यादृच्छिक प्रभावों-, निश्चित प्रभावों- और सीमांत मॉडल के बीच क्या अंतर है?


49

मैं आंकड़ों के अपने ज्ञान का विस्तार करने की कोशिश कर रहा हूं। मैं सांख्यिकीय परीक्षण के लिए "नुस्खा आधारित" दृष्टिकोण के साथ एक भौतिक विज्ञान पृष्ठभूमि से आता हूं, जहां हम कहते हैं कि यह निरंतर है, क्या इसे सामान्य रूप से वितरित किया जाता है - ओएलएस प्रतिगमन

मेरे पढ़ने में मैं शर्तों पर आया हूं: यादृच्छिक प्रभाव मॉडल, निश्चित प्रभाव मॉडल, सीमांत मॉडल। मेरे प्रश्न हैं:

  • बहुत सरल शब्दों में, वे क्या हैं?
  • उनके बीच क्या अंतर हैं?
  • उनमें से कोई पर्यायवाची हैं?
  • ओएलएस प्रतिगमन, एनोवा और एएनसीओवीए जैसे पारंपरिक परीक्षण इस वर्गीकरण में कहां आते हैं?

बस यह तय करने की कोशिश कर रहा है कि सेल्फ स्टडी के साथ आगे कहां जाना है।



1
@ उत्तर: आप जिस जवाब को इनाम देने जा रहे हैं, वह वास्तव में तय / यादृच्छिक प्रभावों (ऊपर टिप्पणी में जुड़ा हुआ) के बीच के अंतर पर "मुख्य" धागे में सभी उत्तरों को पार करता है। इस सवाल में 40 से अधिक अपवोट्स और 25 अपवोट्स के साथ एक स्वीकृत उत्तर है, जो दुर्भाग्य से बहुत उपयोगी नहीं है। क्या हमें शायद इन धागों को मिलाना चाहिए? मुझे लगता है कि इसका मतलब यह होगा कि ओपी एन 26 प्रश्न को खो देगा, लेकिन उनका खाता अब भी सक्रिय नहीं लगता है। निश्चित नहीं है कि कार्रवाई का सबसे अच्छा तरीका क्या है।
अमीबा का कहना है कि मोनिका

1
धन्यवाद @amoeba, मुझे लगता है कि यह भी अधिक ध्यान देने योग्य है। मुझे ऐसा लगता है कि यह सवाल, इसी तरह शीर्षक से, वास्तव में थोड़ा अलग है (और शायद गलत शीर्षक)। मुझे इनका विलय करने का अधिकार नहीं है। मैंने इस थ्रेड को जोड़ने के लिए सिर्फ एक टिप्पणी वहां जोड़ दी। इस सवाल को क्यों नहीं उठाया कि मेटा / वीवी पर w / इन थ्रेड्स का क्या करें और हम देखेंगे कि लोग क्या सोचते हैं?
गंग -

जवाबों:


53

इस सवाल का इस साइट पर नीचे के रूप में आंशिक रूप से चर्चा की गई है, और राय मिश्रित लगती है।

सभी शर्तें आम तौर पर अनुदैर्ध्य / पैनल / क्लस्टर / पदानुक्रमित डेटा और दोहराया उपायों (उन्नत प्रतिगमन और एनोवा के प्रारूप में) से संबंधित हैं, लेकिन विभिन्न संदर्भों में कई अर्थ हैं। मैं अपने ज्ञान के आधार पर सूत्र में प्रश्न का उत्तर देना चाहूंगा।

निश्चित-प्रभाव मॉडल

  • बायोसैटिस्टिक्स में, फिक्स्ड-इफेक्ट्स, जो कि नीचे दिए गए समीकरण (*) में में गए हैं, आमतौर पर यादृच्छिक प्रभावों के साथ आते हैं। लेकिन निश्चित-प्रभाव मॉडल को यह मानने के लिए भी परिभाषित किया गया है कि अवलोकन स्वतंत्र हैं, जैसे पार-अनुभागीय सेटिंग, जैसा कि हेडेकियर और गिबन्स (2006) के अनुदैर्ध्य डेटा विश्लेषण में है।β
  • अर्थमिति में, निश्चित-प्रभाव मॉडल को रूप में लिखा जा सकता है, जहां प्रत्येक विषय ( ) के लिए फिक्स्ड (रैंडम नहीं) इंटरसेप्ट है , या हम प्रत्येक दोहराया माप ( ) के लिए के रूप में एक निश्चित प्रभाव भी रख सकते हैं ; covariates को दर्शाता है।
    yij=xijβ+ui+ϵij
    uiiujjxij
  • मेटा-विश्लेषण में, निश्चित प्रभाव वाला मॉडल मानता है कि अंतर्निहित प्रभाव सभी अध्ययनों (जैसे मेंटल और हेन्सज़ेल, 1954) में समान है।

रैंडम-प्रभाव मॉडल

  • बायोस्टैटिस्टिक्स में, रैंडम-इफेक्ट्स मॉडल (लैयर्ड एंड वेयर, 1982) को " रूप में लिखा जा सकता है। जहां एक वितरण का पालन करने के लिए माना जाता है। निश्चित प्रभावों के लिए को दर्शाता है, और यादृच्छिक प्रभावों के लिए को दर्शाता है।
    (*)yij=xijβ+zijui+eij
    uixijzij
  • अर्थमिति में, यादृच्छिक-प्रभाव मॉडल केवल यादृच्छिक अवरोधन मॉडल को संदर्भित कर सकता है जैसे कि बायोस्टैटिस्टिक्स में, यानी और एक अदिश राशि है।zij=1ui
  • मेटा-विश्लेषण में, यादृच्छिक-प्रभाव वाला मॉडल अध्ययनों के दौरान विषम प्रभाव (डेरसिमोनियन और लैयर्ड, 1986) को मानता है।

सीमांत मॉडल

सीमांत मॉडल की तुलना आम तौर पर सशर्त मॉडल (यादृच्छिक-प्रभाव मॉडल) से की जाती है, और पूर्व का मतलब जनसंख्या पर केंद्रित होता है (उदाहरण के लिए रैखिक मॉडल लें) जबकि उत्तरार्द्ध सशर्त माध्यसीमांत मॉडल और यादृच्छिक-प्रभाव मॉडल के बीच प्रतिगमन गुणांक की व्याख्या और पैमाने nonlinear मॉडल (जैसे लॉजिस्टिक प्रतिगमन) के लिए अलग होंगे। आज्ञा देना , तब

E(yij)=xijβ,
E(yij|ui)=xijβ+zijui.
h(E(yij|ui))=xijβ+zijui
E(yij)=E(E(yij|ui))=E(h1(xijβ+zijui))h1(xijβ),
जब तक कि तुच्छ रूप से लिंक फ़ंक्शन पहचान लिंक नहीं है (रैखिक मॉडल) ), या (कोई यादृच्छिक-प्रभाव नहीं)। अच्छे उदाहरणों में सामान्यीकृत आकलन समीकरण (GEE; ज़िगर, लिआंग और अल्बर्ट, 1988) और सीमांत बहुस्तरीय मॉडल (हेडगेरी और ज़िगर, 2000) शामिल हैं।hui=0

धन्यवाद, Randel। एक और सवाल, "मिश्रित मॉडल" शब्दावली के बारे में। जहां तक ​​मैं समझता हूं, बायोस्टैटिस्टिक्स में आपके समीकरण (*) को एक मिश्रित मॉडल कहा जाएगा क्योंकि इसमें यादृच्छिक और निश्चित दोनों प्रभाव होते हैं। क्या वो सही है? लेकिन क्या "मिश्रित मॉडल" शब्द का उपयोग अर्थमिति में भी किया जाता है? यदि हां, तो इसका क्या मतलब है?
अमीबा का कहना है कि

हां, समीकरण (*) को एक मिश्रित मॉडल (जैव) आंकड़ों में भी कहा जाता है। जहां तक ​​मुझे पता है, अर्थशास्त्री इसे "मिश्रित मॉडल" नहीं कह सकते, लेकिन "यादृच्छिक-प्रभाव मॉडल" या "यादृच्छिक गुणांक मॉडल", यदि वे क्लस्टर विविधता में रुचि रखते हैं। मेरे लिए, एकमात्र अंतर क्लस्टर-विशिष्ट प्रभाव, निश्चित या यादृच्छिक के लिए धारणा है।
रेंडेल

1
@skan यादृच्छिक प्रभावों के लिए को दर्शाता है। यह एक सदिश राशि है, और संक्रमण है। zijzij
रेंडेल

1
यहाँ एक विस्तृत उदाहरण है। आशा है ये मदद करेगा। @skan
रान्डेल

1
@skan यह दोनों के लिए सुझाव नहीं है, या तो पर्याप्त है। यहाँ एक आदर्श उदाहरण है।
रैंडेल

1

अगर मैं यहाँ गलत हूँ तो मुझे सुधारो:

अवधारणात्मक रूप से, चार संभावित प्रभाव हैं: निश्चित अवरोधन, निश्चित गुणांक, यादृच्छिक अवरोधन, यादृच्छिक गुणांक। अधिकांश प्रतिगमन मॉडल 'यादृच्छिक प्रभाव' हैं, इसलिए उनके पास यादृच्छिक अवरोध और यादृच्छिक गुणांक हैं। 'यादृच्छिक प्रभाव' शब्द 'निश्चित प्रभाव' के विपरीत उपयोग में आया।

'निश्चित प्रभाव' तब होता है जब एक चर नमूने में से कुछ को प्रभावित करता है, लेकिन सभी को नहीं। एक निश्चित प्रभाव मॉडल का सबसे सरल संस्करण (वैचारिक रूप से) एक द्विआधारी मूल्य के साथ एक निश्चित प्रभाव के लिए एक डमी चर होगा। इन मॉडलों में एकल यादृच्छिक अवरोधन, निश्चित प्रभाव गुणांक और यादृच्छिक चर गुणांक होते हैं।

जटिलता का अगला स्तर (वैचारिक रूप से) है जब निश्चित प्रभाव द्विआधारी नहीं है, लेकिन कई मूल्यों के साथ नाममात्र है। इस मामले में, जो उत्पन्न होता है, वह एक मॉडल होता है जिसमें कई अंतःक्षेपण होते हैं (प्रत्येक नाममात्र मूल्यों के लिए)। यह वह जगह है जहां आपको एक पैनल डेटा मॉडल की क्लासिक 'कई लाइनें' मिलती हैं , जहां एक निश्चित प्रभाव चर के प्रत्येक 'विकल्प' को अपना प्रभाव मिलता है। सभी अलग-अलग कारक-विशिष्ट डेटा श्रृंखला को एक एकल प्रतिगमन (अपने प्रतिगमन के रूप में निश्चित प्रभाव के प्रत्येक कारक को करने के बजाय) में फेंकने का गुण यह है कि आप एक समीकरण में सभी विभिन्न प्रभावों के विचरण को प्राप्त करते हैं, और इसी तरह अपने सभी गुणांक के लिए बेहतर (कुछ निश्चित) मूल्य प्राप्त करें।

जटिलता का 'टियर थ्री ’तब होगा जब is फिक्स्ड इफेक्ट’ खुद एक रैंडम वैरिएबल हो, सिवाय इसके कि इसके इफेक्ट्स only फिक्स्ड ’हों, जिससे सैंपल का केवल एक सब-सेट प्रभावित हो। जिस बिंदु पर मॉडल में एक यादृच्छिक अवरोधन, कई निश्चित अंतराल और कई यादृच्छिक चर होंगे। मुझे लगता है कि यह 'मिश्रित प्रभाव' मॉडल के रूप में जाना जाता है?

मल्टी-लेवल मॉडलिंग (MLM) के लिए 'मिक्स्ड इफेक्ट' मॉडल का इस्तेमाल किया जाता है, क्योंकि 'फिक्स्ड इफेक्ट्स' का इस्तेमाल दूसरे के भीतर डेटा के सबसेट को नेस्ट करने के लिए किया जा सकता है। इस समूहीकरण में कई स्तर हो सकते हैं, छात्रों को कक्षाओं के भीतर, स्कूलों के भीतर घोंसले के शिकार के साथ। स्कूल कक्षाओं पर और छात्रों पर कक्षाओं का एक निश्चित प्रभाव है। (स्कूल प्रयोगात्मक डिजाइन के आधार पर छात्र पर एक निश्चित प्रभाव हो सकता है या नहीं - निश्चित नहीं है)

पैनल डेटा मॉडल 'मिश्रित प्रभाव' मॉडल हैं, लेकिन समूहन के लिए दो आयामों का उपयोग करते हैं, आमतौर पर समय और किसी प्रकार की श्रेणी।


सुनिश्चित नहीं हैं कि आपके द्वारा चुने गए विकल्पों के "निश्चित प्रभाव कवर 'सेट से क्या मतलब है: ए या बी; ... यादृच्छिक प्रभावों में शरीर के वजन जैसी चीजें शामिल हैं"। क्या आपको लगता है कि निश्चित प्रभाव असतत चर के लिए हैं, यादृच्छिक प्रभाव निरंतर चर के लिए हैं? यह भी सुनिश्चित नहीं है कि "एक ही चीज़ के लिए कई डमी वैरिएबल का उपयोग करना सांख्यिकीय रूप से अनुचित है"। अर्थमिति में निर्धारित प्रभाव मॉडल में प्रत्येक "पैनल" के लिए एक डमी चर होता है। मैं "'मिश्रित' मॉडल के साथ सहमत नहीं हो सकता ... समूहन द्वारा 'निश्चित' इंटरसेप्ट होने के बाद, उनके पास अब कोई यादृच्छिक अवरोधन नहीं है"। कई मिश्रित प्रभाव वाले मॉडल में एक यादृच्छिक अवरोधन होता है।
रान्डेल

मेरी समझ अपूर्ण है। मैं अपनी प्रतिक्रिया संपादित करूंगा और पुनः प्रयास करूंगा।
मोक्स

क्या यह संभव है कि एक चर निश्चित प्रभाव और यादृच्छिक प्रभाव के रूप में एक साथ दिखाई दे?
स्कैन

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.