सरल शब्दों में, आप कैसे बताएंगे (शायद सरल उदाहरणों के साथ) निश्चित प्रभाव, यादृच्छिक प्रभाव और मिश्रित प्रभाव मॉडल के बीच का अंतर?
सरल शब्दों में, आप कैसे बताएंगे (शायद सरल उदाहरणों के साथ) निश्चित प्रभाव, यादृच्छिक प्रभाव और मिश्रित प्रभाव मॉडल के बीच का अंतर?
जवाबों:
सांख्यिकीविद एंड्रयू जेलमैन का कहना है कि 'निश्चित प्रभाव' और 'यादृच्छिक प्रभाव' शब्दों का उपयोग करने के आधार पर परिवर्तनशील अर्थ हैं। शायद आप चुन सकते हैं कि आपके मामले में 5 परिभाषाओं में से कौन सी एक लागू होती है। सामान्य तौर पर यह या तो समीकरणों को देखने के लिए बेहतर हो सकता है जो लेखकों द्वारा उपयोग किए जाने वाले प्रायिकता मॉडल का वर्णन करते हैं (पढ़ते समय) या पूर्ण संभावना वाले मॉडल को लिखते हैं जिसे आप उपयोग करना चाहते हैं (जब लेखन)।
यहां हमने उन पांच परिभाषाओं को रेखांकित किया है जिन्हें हमने देखा है:
निश्चित प्रभाव व्यक्तियों में निरंतर होते हैं, और यादृच्छिक प्रभाव भिन्न होते हैं। उदाहरण के लिए, एक विकास अध्ययन में, यादृच्छिक के साथ एक मॉडल और निश्चित ढलान b को अलग-अलग व्यक्तियों i , या मॉडल y i t = a i + b t के समानांतर लाइनों से मेल खाता है । क्रेफ्ट और डी लीउव (1998) इस प्रकार निश्चित और यादृच्छिक गुणांक के बीच अंतर करते हैं।
प्रभाव तय किए जाते हैं यदि वे स्वयं में दिलचस्प हैं या अंतर्निहित आबादी में रुचि रखते हैं तो यादृच्छिक। Searle, Casella, और McCulloch (1992, धारा 1.4) गहराई में इस अंतर का पता लगाते हैं।
“जब एक नमूना आबादी को समाप्त कर देता है, तो संबंधित चर तय हो जाता है; जब नमूना जनसंख्या का एक छोटा (यानी, नगण्य) हिस्सा होता है, तो संबंधित चर यादृच्छिक होता है। "(ग्रीन और तुक, 1960)
"यदि किसी प्रभाव को एक यादृच्छिक चर का वास्तविक मूल्य माना जाता है, तो इसे यादृच्छिक प्रभाव कहा जाता है।"
कम से कम वर्गों (या, आमतौर पर, अधिकतम संभावना) और यादृच्छिक प्रभावों का अनुमान संकोचन (रॉबिन्सन, 1991 की शब्दावली में "रैखिक निष्पक्ष भविष्यवाणी") के साथ लगाया जाता है। यह परिभाषा बहुस्तरीय मॉडलिंग साहित्य (उदाहरण के लिए, स्निजर्स और बॉस्कर, 1999, धारा 4.2) और अर्थमिति में मानक है।
[ गेलमैन, 2004, विचरण का विश्लेषण — क्यों यह पहले से कहीं अधिक महत्वपूर्ण है। सांख्यिकी के इतिहास। ]
(4) “If an effect is assumed to be a realized value of a random variable, it is called a random effect.” (LaMotte, 1983)
इस पर अच्छी किताबें हैं जैसे कि गेलमैन और हिल । निम्नानुसार अनिवार्य रूप से उनके परिप्रेक्ष्य का सारांश है।
सबसे पहले, आपको शब्दावली में बहुत अधिक नहीं फंसना चाहिए। आंकड़ों में, शब्दजाल को कभी भी मॉडल की गणितीय समझ के विकल्प के रूप में उपयोग नहीं किया जाना चाहिए। यह यादृच्छिक और मिश्रित प्रभाव वाले मॉडल के लिए विशेष रूप से सच है। "मिश्रित" का अर्थ सिर्फ यह है कि मॉडल में फिक्स्ड और रैंडम दोनों तरह के प्रभाव होते हैं, इसलिए आइए फिक्स्ड और रैंडम के बीच के अंतर पर ध्यान दें।
मान लें कि आपके पास एक श्रेणीबद्ध भविष्यवक्ता के साथ एक मॉडल है, जो आपकी टिप्पणियों को श्रेणी के मानों के अनुसार समूहों में विभाजित करता है। * मॉडल का गुणांक, या "प्रभाव", जो कि भविष्यवक्ता से जुड़ा हुआ है, निश्चित या यादृच्छिक हो सकता है। दोनों के बीच सबसे महत्वपूर्ण व्यावहारिक अंतर यह है:
आंशिक पूलिंग के साथ यादृच्छिक प्रभावों का अनुमान लगाया जाता है, जबकि निश्चित प्रभाव नहीं होते हैं।
आंशिक पूलिंग का मतलब है कि, यदि आपके पास समूह में कुछ डेटा बिंदु हैं, तो समूह का प्रभाव अनुमान आंशिक रूप से अन्य समूहों के अधिक प्रचुर मात्रा में डेटा पर आधारित होगा। यह सभी समूहों को पूरी तरह से पूल करके एक प्रभाव का अनुमान लगाने के बीच एक अच्छा समझौता हो सकता है, जो समूह-स्तर भिन्नता को मास्क करता है, और सभी समूहों के लिए पूरी तरह से अलग-अलग प्रभाव का अनुमान लगाता है, जो कम-नमूना समूहों के लिए खराब अनुमान दे सकता है।
रैंडम प्रभाव बस एक सामान्य प्रयोजन सांख्यिकीय मॉडल के रूप में आंशिक पूलिंग तकनीक का विस्तार है। यह कई पूर्वानुमानों, मिश्रित निरंतर और श्रेणीबद्ध चर, और जटिल सहसंबंध संरचनाओं सहित विभिन्न प्रकार की स्थितियों के लिए विचार के राजसी अनुप्रयोग को सक्षम बनाता है। (लेकिन महान शक्ति के साथ बड़ी जिम्मेदारी आती है: मॉडलिंग और अनुमान की जटिलता काफी बढ़ जाती है, और सूक्ष्म जीवों को जन्म दे सकती है जिससे बचने के लिए काफी परिष्कार की आवश्यकता होती है।)
यादृच्छिक प्रभाव मॉडल को प्रेरित करने के लिए, अपने आप से पूछें: आप आंशिक पूल क्यों करेंगे? शायद इसलिए क्योंकि आपको लगता है कि छोटे उपसमूह एक सामान्य माध्य प्रभाव वाले किसी बड़े समूह का हिस्सा हैं। उपसमूह का मतलब बड़े समूह के माध्यम से थोड़ा सा विचलन कर सकता है, लेकिन एक मनमानी राशि से नहीं। उस विचार को औपचारिक रूप देने के लिए, हम मानते हैं कि विचलन एक वितरण का अनुसरण करते हैं, आमतौर पर गॉसियन। यही कारण है कि यादृच्छिक प्रभावों में "यादृच्छिक" आता है: हम एक माता पिता से उपसमूहों के विचलन मान रहे हैं एक यादृच्छिक चर के वितरण का पालन करें। एक बार जब आप इस विचार को ध्यान में रखते हैं, तो मिश्रित-प्रभाव मॉडल समीकरण स्वाभाविक रूप से अनुसरण करते हैं।
दुर्भाग्य से, मिश्रित प्रभाव वाले मॉडल के उपयोगकर्ताओं में अक्सर गलत धारणा होती है कि यादृच्छिक प्रभाव क्या होते हैं और वे निश्चित प्रभावों से कैसे भिन्न होते हैं। लोग "यादृच्छिक" सुनते हैं और सोचते हैं कि यह प्रणाली के मॉडल के बारे में कुछ बहुत ही खास है, जैसे निश्चित प्रभाव का उपयोग तब करना पड़ता है जब कुछ "निश्चित" होता है जबकि यादृच्छिक प्रभाव का उपयोग तब करना पड़ता है जब कुछ "यादृच्छिक रूप से नमूना" होता है। लेकिन यह मानने के बारे में कुछ भी विशेष रूप से यादृच्छिक नहीं है कि मॉडल के गुणांक वितरण से आते हैं; यह केवल एक नरम बाधा है, रिज प्रतिगमन में मॉडल गुणांक पर लागू दंड के समान है । ऐसी कई स्थितियाँ हैं जब आप यादृच्छिक प्रभावों का उपयोग करना चाहते हैं या नहीं कर सकते हैं, और उन्हें "निश्चित" और "के बीच के अंतर के साथ बहुत कुछ करना जरूरी नहीं है"
दुर्भाग्य से, इन शर्तों के कारण होने वाली अवधारणा भ्रम ने परस्पर विरोधी परिभाषाओं का एक भ्रम पैदा कर दिया है । इस लिंक पर पांच परिभाषाओं में से, सामान्य मामले में केवल # 4 पूरी तरह से सही है, लेकिन यह भी पूरी तरह से एकरूप नहीं है। व्यावहारिक कार्यों में क्या परिभाषा निहित है, यह समझने के लिए आपको पूरे कागजात और किताबें (या इस पोस्ट को विफल करना) पढ़ना होगा।
आइए एक ऐसे मामले पर ध्यान दें जहां यादृच्छिक प्रभाव मॉडलिंग उपयोगी हो सकता है। मान लें कि आप ज़िप कोड द्वारा औसत अमेरिकी घरेलू आय का अनुमान लगाना चाहते हैं। आपके पास घरों के आय और ज़िप कोड की टिप्पणियों से युक्त एक बड़ा डेटासेट है। कुछ ज़िप कोड अच्छी तरह से डेटासेट में दर्शाए गए हैं, लेकिन अन्य में केवल कुछ घरों में हैं।
अपने प्रारंभिक मॉडल के लिए आप सबसे अधिक संभावना है कि प्रत्येक ज़िप में औसत आय लेंगे। जब आपके पास ज़िप के लिए बहुत सारे डेटा होते हैं, तो यह अच्छी तरह से काम करेगा, लेकिन आपके खराब नमूना वाले ज़िप के लिए अनुमान उच्च विचरण से पीड़ित होंगे। आप एक संकोचन अनुमानक (उर्फ आंशिक पूलिंग) का उपयोग करके इसे कम कर सकते हैं, जो सभी अन्य कोडों में औसत आय की ओर अत्यधिक मूल्यों को धक्का देगा।
लेकिन एक विशेष ज़िप के लिए आपको कितना संकोचन / पूलिंग करना चाहिए? सहज रूप से, यह निम्नलिखित पर निर्भर होना चाहिए:
यदि आप एक यादृच्छिक प्रभाव के रूप में ज़िप कोड को मॉडल करते हैं, तो सभी ज़िप कोडों में औसत आय अनुमान को सांख्यिकीय रूप से अच्छी तरह से स्थापित संकोचन के अधीन किया जाएगा, जो उपरोक्त सभी कारकों को ध्यान में रखते हैं।
सबसे अच्छी बात यह है कि मॉडल में सभी यादृच्छिक प्रभावों के लिए यादृच्छिक और मिश्रित प्रभाव मॉडल स्वचालित रूप से (4), परिवर्तनशीलता का अनुमान लगाते हैं। यह पहली नज़र में लगता है कि तुलना में कठिन है: आप प्रत्येक ज़िप के लिए नमूना माध्य के विचरण की कोशिश कर सकते हैं, लेकिन यह उच्च पक्षपाती होगा, क्योंकि विभिन्न जिप्स के अनुमानों के बीच के कुछ विचरण केवल नमूने का विचरण है। एक यादृच्छिक प्रभाव मॉडल में, अनुमान प्रक्रिया नमूने के विचरण के लिए जिम्मेदार है और तदनुसार विचरण अनुमान को सिकोड़ती है।
(1) - (4) के लिए जिम्मेदार होने के बाद, एक यादृच्छिक / मिश्रित प्रभाव मॉडल कम-नमूना समूहों के लिए उपयुक्त संकोचन निर्धारित करने में सक्षम है। यह कई अलग-अलग भविष्यवाणियों के साथ बहुत अधिक जटिल मॉडल भी संभाल सकता है।
यदि यह आपको पदानुक्रमित बायेसियन मॉडलिंग की तरह लगता है, तो आप सही हैं - यह एक करीबी रिश्तेदार है, लेकिन समान नहीं है। मिश्रित प्रभाव वाले मॉडल पदानुक्रमित हैं कि वे अव्यक्त, अप्राप्य मापदंडों के लिए वितरण प्रस्तुत करते हैं, लेकिन वे आम तौर पर पूरी तरह से बायेसियन नहीं होते हैं क्योंकि शीर्ष स्तर के हाइपरपैरेटर्स को उचित पुजारी नहीं दिए जाएंगे। उदाहरण के लिए, उपर्युक्त उदाहरण में, हम किसी दिए गए जिप में औसत आय को सामान्य वितरण से एक नमूने के रूप में व्यवहार करेंगे, अज्ञात अर्थ और सिग्मा के साथ मिश्रित-प्रभाव फिटिंग प्रक्रिया द्वारा अनुमान लगाया जाएगा। हालांकि, एक (गैर-बायेसियन) मिश्रित प्रभाव मॉडल आमतौर पर अज्ञात माध्य और सिग्मा पर पूर्व नहीं होगा, इसलिए यह पूरी तरह से बायेसियन नहीं है। उस ने कहा, एक सभ्य आकार के डेटा सेट के साथ, मानक मिश्रित प्रभाव मॉडल और पूरी तरह से बायेसियन संस्करण अक्सर समान परिणाम देगा।
* जबकि इस विषय के कई उपचार "समूह" की एक संकीर्ण परिभाषा पर ध्यान केंद्रित करते हैं, अवधारणा वास्तव में बहुत लचीला है: यह केवल टिप्पणियों का एक सेट है जो एक आम संपत्ति साझा करते हैं। एक समूह एक व्यक्ति, या एक स्कूल में कई लोगों, या एक जिले में कई स्कूलों, या एक ही तरह के फल, या एक ही फसल से कई प्रकार की सब्जी की कई किस्मों की कई टिप्पणियों से बना हो सकता है। एक ही तरह की सब्जी आदि। किसी भी श्रेणीगत चर का उपयोग समूह चर के रूप में किया जा सकता है।
मैंने मिश्रित मॉडल पर एक पुस्तक अध्याय ( फॉक्स, नेग्रेट-यांकेलविच, और सोसा 2014 में अध्याय 13) पर इसके बारे में लिखा है ; प्रासंगिक पृष्ठ (पीपी। 311-315) Google पुस्तकें पर उपलब्ध हैं । मुझे लगता है कि सवाल यह है कि "निश्चित और यादृच्छिक प्रभावों की परिभाषा क्या है?" (एक "मिश्रित मॉडल" सिर्फ एक मॉडल है जिसमें दोनों शामिल हैं)। मेरी चर्चा उनकी औपचारिक परिभाषा के बारे में थोड़ा कम कहती है (जिसके लिए मैं @ जॉनसाल्वेटियर के उत्तर के ऊपर दिए गए गेलमैन पेपर को टाल दूंगा) और उनके व्यावहारिक गुणों और उपयोगिता के बारे में और अधिक। यहाँ कुछ अंश दिए गए हैं:
यादृच्छिक प्रभावों का पारंपरिक दृष्टिकोण सांख्यिकीय परीक्षणों को सही करने का एक तरीका है जब कुछ टिप्पणियों को सहसंबद्ध किया जाता है।
हम एक समूह चर के भीतर विभिन्न स्तरों से सूचनाओं को संयोजित करने के तरीके के रूप में यादृच्छिक प्रभावों के बारे में भी सोच सकते हैं।
यादृच्छिक प्रभाव विशेष रूप से तब उपयोगी होते हैं जब हमारे पास (1) बहुत सारे स्तर होते हैं (जैसे, कई प्रजातियाँ या ब्लॉक), (2) प्रत्येक स्तर पर अपेक्षाकृत कम डेटा (हालाँकि हमें अधिकांश स्तरों से कई नमूनों की आवश्यकता होती है), और (3) असमान स्तरों के अनुसार नमूनाकरण (बॉक्स 13.1)।
फ़्रीक्वेंटर्स और बायेसियन यादृच्छिक प्रभावों को कुछ अलग तरीके से परिभाषित करते हैं, जो उनके उपयोग करने के तरीके को प्रभावित करता है। फ़्रीक्वेंटर यादृच्छिक प्रभावों को श्रेणीबद्ध चर के रूप में परिभाषित करते हैं जिनके स्तर चुने जाते हैं बड़ी आबादी से यादृच्छिक पर जाता है, जैसे, स्थानिक प्रजातियों की सूची से यादृच्छिक पर चुनी गई प्रजातियां। Bayesians यादृच्छिक प्रभावों को चर के सेट के रूप में परिभाषित करते हैं जिनके पैरामीटर [सभी] [समान] वितरण से तैयार किए गए हैं। अक्सर होने वाली परिभाषा दार्शनिक रूप से सुसंगत है, और आप शोधकर्ताओं (समीक्षकों और पर्यवेक्षकों सहित) पर जोर देंगे, जो इस पर जोर देते हैं, लेकिन यह व्यावहारिक रूप से समस्याग्रस्त हो सकता है। उदाहरण के लिए, इसका तात्पर्य यह है कि आप प्रजातियों का उपयोग यादृच्छिक प्रभाव के रूप में नहीं कर सकते हैं, जब आपने अपने क्षेत्र की सभी प्रजातियों का अवलोकन किया हो - क्योंकि प्रजातियों की सूची एक बड़ी आबादी से एक नमूना नहीं है - या एक यादृच्छिक प्रभाव के रूप में वर्ष का उपयोग करें, चूँकि शोधकर्ता शायद ही कभी बेतरतीब ढंग से सैंपल वाले वर्षों में कोई प्रयोग करते हैं - वे आम तौर पर या तो लगातार वर्षों की एक श्रृंखला का उपयोग करते हैं, या वर्षों के उस हफ़्तेदार सेट का जब वे मैदान में उतर सकते हैं।
यादृच्छिक प्रभावों को भविष्यवक्ता चर के रूप में भी वर्णित किया जा सकता है, जहां आप विशेष स्तरों के बीच मूल्यों के अंतर के परीक्षण के बजाय मूल्यों के वितरण (यानी, विभिन्न स्तरों पर प्रतिक्रिया के मूल्यों के बीच विचरण) के बारे में निष्कर्ष बनाने में रुचि रखते हैं।
कभी-कभी लोग कहते हैं कि यादृच्छिक प्रभाव "ऐसे कारक हैं जिनकी आपको कोई दिलचस्पी नहीं है।" यह हमेशा सच नहीं होता है। हालांकि यह अक्सर पारिस्थितिक प्रयोगों में होता है (जहां साइटों के बीच भिन्नता आमतौर पर सिर्फ एक उपद्रव है), यह कभी-कभी बहुत रुचि है, उदाहरण के लिए विकासवादी अध्ययनों में जहां जीनोटाइप के बीच भिन्नता प्राकृतिक चयन के लिए कच्चा माल है, या जनसांख्यिकीय अध्ययन में। जहाँ साल दर साल बदलाव के साथ दीर्घकालिक विकास दर कम होती है। कुछ मामलों में निर्बाध रूप से भिन्नता को नियंत्रित करने के लिए निश्चित प्रभाव का भी उपयोग किया जाता है, उदाहरण के लिए, शरीर के आकार के प्रभावों को नियंत्रित करने के लिए एक कोवरिएट के रूप में द्रव्यमान का उपयोग करना।
आप यह भी सुनेंगे कि "आप सशर्त मोड के (अनुमानित) मूल्य के बारे में कुछ नहीं कह सकते।" यह या तो सच नहीं है - आप औपचारिक रूप से एक शून्य परिकल्पना का परीक्षण नहीं कर सकते हैं कि मूल्य शून्य के बराबर है, या यह दो अलग-अलग स्तरों के मान समान हैं, लेकिन यह अभी भी अनुमानित मूल्य को देखने के लिए पूरी तरह से समझदार है, और यहां तक कि अनुमानित मूल्य के मानक त्रुटि की गणना करने के लिए भी (उदाहरण के लिए, आंकड़ा 13.1 में सशर्त मोड के आसपास त्रुटि बार देखें)।
बेयसियन ढांचे में यादृच्छिक प्रभावों की एक सरल परिभाषा है। बायेसियन दृष्टिकोण के तहत, एक निश्चित प्रभाव वह है जहां हम प्रत्येक पैरामीटर का अनुमान लगाते हैं (उदाहरण के लिए, एक जीनस के भीतर प्रत्येक प्रजाति के लिए) स्वतंत्र रूप से (स्वतंत्र रूप से निर्दिष्ट पुजारियों के साथ), जबकि एक यादृच्छिक प्रभाव के लिए प्रत्येक स्तर के लिए मापदंडों को तैयार किया जा रहा है। एक वितरण से (आमतौर पर सामान्य); मानक सांख्यिकीय अंकन में, ।
मैंने कहा कि यादृच्छिक प्रभाव सबसे उपयोगी होते हैं जब समूहीकरण चर में कई मापा स्तर होते हैं। इसके विपरीत, यादृच्छिक प्रभाव आम तौर पर अप्रभावी होते हैं जब समूह चर में बहुत कम स्तर होते हैं। आप आमतौर पर यादृच्छिक प्रभावों का उपयोग नहीं कर सकते हैं जब समूहीकरण चर में पांच से कम स्तर होते हैं, और यादृच्छिक प्रभाव विचरण अनुमान आठ से कम स्तर के साथ अस्थिर होते हैं, क्योंकि आप बहुत छोटे नमूने से विचरण का अनुमान लगाने की कोशिश कर रहे हैं।
निश्चित प्रभाव: किसी चीज़ का प्रयोग करने वाला सीधे तौर पर हेरफेर करता है और अक्सर दोहराए जाने योग्य होता है, जैसे, ड्रग एडमिनिस्ट्रेशन - एक समूह को दवा मिलती है, एक समूह को प्लेसबो मिलता है।
यादृच्छिक प्रभाव: यादृच्छिक भिन्नता / प्रायोगिक इकाइयों का स्रोत, उदाहरण के लिए, एक नैदानिक परीक्षण के लिए जनसंख्या से (यादृच्छिक पर) लोगों को खींचा गया। यादृच्छिक प्रभाव परिवर्तनशीलता का अनुमान लगाते हैं
मिश्रित प्रभाव: दोनों में शामिल हैं, इन मामलों में निश्चित प्रभाव जनसंख्या स्तर के गुणांक का अनुमान लगा रहे हैं, जबकि यादृच्छिक प्रभाव एक प्रभाव के जवाब में व्यक्तिगत मतभेदों को ध्यान में रख सकते हैं, उदाहरण के लिए, प्रत्येक व्यक्ति अलग-अलग अवसरों पर दवा और प्लेसबो दोनों प्राप्त करता है, निश्चित प्रभाव दवा के प्रभाव का अनुमान लगाता है, यादृच्छिक प्रभाव शर्तें प्रत्येक व्यक्ति को दवा के लिए अलग तरीके से प्रतिक्रिया करने की अनुमति देगा।
मिश्रित प्रभावों की सामान्य श्रेणियां - दोहराया उपाय, अनुदैर्ध्य, पदानुक्रमित, विभाजन-कथानक।
मैं यहाँ से इस सवाल पर आया था , एक संभावित डुप्लिकेट।
पहले से ही कई उत्कृष्ट उत्तर हैं, लेकिन जैसा कि स्वीकार किए गए उत्तर में कहा गया है, इस शब्द के कई अलग-अलग (लेकिन संबंधित) उपयोग हैं, इसलिए यह अर्थमिति में नियोजित के रूप में परिप्रेक्ष्य देने के लिए मूल्यवान हो सकता है, जो अभी तक पूरी तरह से संबोधित नहीं लगता है ।
एक यादृच्छिक प्रभाव दृष्टिकोण का उपयोग करने का एक कारण यह है कि की उपस्थिति एक त्रुटि सहसंयोजक मैट्रिक्स को जन्म देगी जो "गोलाकार" नहीं है (इसलिए पहचान मैट्रिक्स के एक से अधिक नहीं), ताकि यादृच्छिक प्रभावों की तरह जीएलएस-प्रकार का दृष्टिकोण हो सके ओएलएस से अधिक कुशल हो)।
m
यहां वह कोड है जो डेटा उत्पन्न करता है और जो एक सकारात्मक आरई अनुमान और "सही", नकारात्मक एफई अनुमान पैदा करता है। (उस ने कहा, आरई अनुमान भी अक्सर अन्य बीजों के लिए नकारात्मक होगा, ऊपर देखें।)
library(Jmisc)
library(plm)
library(RColorBrewer)
# FE illustration
set.seed(324)
m = 8
n = 12
step = 5
alpha = runif(n,seq(0,step*n,by=step),seq(step,step*n+step,by=step))
beta = -1
y = X = matrix(NA,nrow=m,ncol=n)
for (i in 1:n) {
X[,i] = runif(m,i,i+1)
X[,i] = rnorm(m,i)
y[,i] = alpha[i] + X[,i]*beta + rnorm(m,sd=.75)
}
stackX = as.vector(X)
stackY = as.vector(y)
darkcols <- brewer.pal(12, "Paired")
plot(stackX,stackY,col=rep(darkcols,each=m),pch=19)
unit = rep(1:n,each=m)
# first two columns are for plm to understand the panel structure
paneldata = data.frame(unit,rep(1:m,n),stackY,stackX)
fe <- plm(stackY~stackX, data = paneldata, model = "within")
re <- plm(stackY~stackX, data = paneldata, model = "random")
उत्पादन:
> fe
Model Formula: stackY ~ stackX
Coefficients:
stackX
-1.0451
> re
Model Formula: stackY ~ stackX
Coefficients:
(Intercept) stackX
18.34586 0.77031
गैर-बायेसियन आंकड़ों के संदर्भ में भेद केवल सार्थक है। बायेसियन आंकड़ों में, सभी मॉडल पैरामीटर "यादृच्छिक" हैं।
अर्थमिति में, शब्द आमतौर पर सामान्यीकृत रैखिक मॉडल में लागू होते हैं, जहां मॉडल प्रपत्र का होता है
में रैखिक मॉडल , एक यादृच्छिक प्रभाव की उपस्थिति OLS आकलनकर्ता की विसंगति में परिणाम नहीं करता है। हालांकि, एक यादृच्छिक प्रभाव अनुमानक (जैसे व्यवहार्य सामान्यीकृत कम से कम वर्ग) का उपयोग करने के परिणामस्वरूप अधिक कुशल अनुमानक होगा।
में गैर रेखीय मॉडल ऐसे PROBIT, Tobit के रूप में, ..., एक यादृच्छिक प्रभाव की उपस्थिति, सामान्य रूप में, एक असंगत आकलनकर्ता का परिणाम देगा। एक यादृच्छिक प्रभाव अनुमानक का उपयोग करना तब स्थिरता को बहाल करेगा।
दोनों रैखिक और गैर-रेखीय मॉडल के लिए, एक पूर्वाग्रह में निश्चित प्रभाव परिणाम। हालांकि, रैखिक मॉडल में ऐसे रूपांतरण होते हैं जिनका उपयोग किया जा सकता है (जैसे कि पहले अंतर या डीमिंगिंग), जहां रूपांतरित डेटा पर ओएलएस के परिणामस्वरूप लगातार अनुमान लगाए जाएंगे। गैर-रेखीय मॉडल के लिए, कुछ अपवाद हैं जहां परिवर्तन मौजूद हैं, निश्चित प्रभाव एक उदाहरण है।
उदाहरण: यादृच्छिक प्रभाव जांच। मान लीजिए
और देखा गया परिणाम है
जमा अधिकतम संभावना आकलनकर्ता का नमूना औसत को कम करता है
बेशक, यहां लॉग और उत्पाद सरल हो जाता है, लेकिन शैक्षणिक कारणों से, यह समीकरण को यादृच्छिक प्रभाव अनुमानक के लिए अधिक तुलनीय बनाता है, जिसका रूप है
वास्तव में एक औपचारिक परिभाषा नहीं है, लेकिन मुझे निम्नलिखित स्लाइड्स पसंद हैं: मिश्रित मॉडल और क्यों समाजशास्त्रियों को डैनियल एज्रा जॉनसन से उनका ( दर्पण ) उपयोग करना चाहिए । एक संक्षिप्त पुनर्कथन 'स्लाइड 4 पर प्रस्तुत किया गया है। हालांकि यह ज्यादातर मनोवैज्ञानिक अध्ययन पर केंद्रित है, यह पहले चरण के रूप में बहुत उपयोगी है।
यादृच्छिक और निश्चित प्रभाव मॉडल पर एक और बहुत ही व्यावहारिक परिप्रेक्ष्य अर्थमिति से आता है जब पैनल डेटा पर रैखिक रेजिमेंट करते हैं । यदि आप एक व्याख्यात्मक चर और एक परिणामी चर के बीच संगति का आकलन कर रहे हैं, तो प्रति व्यक्ति / समूह में कई नमूनों के साथ डेटासेट में, यह वह ढांचा है जिसका आप उपयोग करना चाहते हैं।
पैनल डेटा का एक अच्छा उदाहरण वार्षिक रूप से व्यक्तियों के सेट से माप है:
यदि हम व्यायाम और वजन परिवर्तन के बीच के संबंध को समझने की कोशिश कर रहे हैं, तो हम निम्नलिखित प्रतिगमन स्थापित करेंगे:
तो, मुख्य प्रश्न यह निर्धारित करना है कि कौन सा मॉडल उपयुक्त है। इसका जवाब है हौसमैन टेस्ट । इसका उपयोग करने के लिए हम दोनों निश्चित और यादृच्छिक प्रभाव प्रतिगमन करते हैं, और फिर हौसमैन टेस्ट को यह देखने के लिए लागू करते हैं कि क्या उनके गुणांक अनुमान काफी भिन्न हैं। यदि वे विचलन करते हैं, तो एंडोजेनिटी खेल में है और एक निश्चित प्रभाव मॉडल सबसे अच्छा विकल्प है। अन्यथा, हम यादृच्छिक प्रभावों के साथ जाएंगे।