पैनल डेटा और मिश्रित मॉडल के बीच अंतर


14

मैं पैनल डेटा विश्लेषण और मिश्रित मॉडल विश्लेषण के बीच अंतर जानना चाहूंगा। मेरी जानकारी के लिए, पैनल डेटा और मिश्रित मॉडल दोनों निश्चित और यादृच्छिक प्रभाव का उपयोग करते हैं। यदि हां, तो उनके अलग-अलग नाम क्यों हैं? या वे पर्यायवाची हैं?

मैंने निम्नलिखित पोस्ट पढ़ी है, जो निश्चित, यादृच्छिक और मिश्रित प्रभाव की परिभाषा का वर्णन करती है, लेकिन वास्तव में मेरे प्रश्न का उत्तर नहीं देती है: निश्चित प्रभाव, यादृच्छिक प्रभाव और मिश्रित प्रभाव मॉडल के बीच अंतर क्या है?

अगर कोई मुझे मिश्रित मॉडल विश्लेषण पर एक संक्षिप्त (लगभग 200 पृष्ठ) संदर्भ के लिए संदर्भित कर सकता है तो मैं भी आभारी रहूंगा। बस जोड़ने के लिए, मैं सॉफ्टवेयर उपचार के बावजूद मिश्रित मॉडलिंग संदर्भ पसंद करूंगा। मुख्य रूप से मिश्रित मॉडलिंग की सैद्धांतिक व्याख्या।



जवाबों:


22

पैनल डेटा और मिश्रित प्रभाव मॉडल डेटा दोनों दोहरे अनुक्रमित यादृच्छिक चर के साथ सौदा करते हैं । पहला इंडेक्स समूह के लिए है, दूसरा समूह के व्यक्तियों के लिए है। पैनल डेटा के लिए आमतौर पर दूसरा सूचकांक समय होता है, और यह माना जाता है कि हम समय के साथ व्यक्तियों का निरीक्षण करते हैं। जब मिश्रित प्रभाव वाले मॉडल के लिए समय दूसरा सूचकांक होता है तो मॉडल अनुदैर्ध्य मॉडल कहलाते हैं। मिश्रित प्रभाव मॉडल को 2 स्तर के प्रतिगमन के संदर्भ में सबसे अच्छा समझा जाता है। (एक्सपोज़र में आसानी के लिए केवल एक व्याख्यात्मक चर मान लें)yij

प्रथम स्तर का प्रतिगमन निम्नलिखित है

yij=αi+xijβi+εij.

यह बस प्रत्येक समूह के लिए व्यक्तिगत प्रतिगमन के रूप में समझाया गया है। दूसरे स्तर प्रतिगमन प्रतिगमन गुणांक में भिन्नता समझाने की कोशिश करता है:

β मैं = δ 0 + z मैं 2 δ 1 + वी मैं

αi=γ0+zi1γ1+ui
βi=δ0+zi2δ1+vi

जब आप दूसरे समीकरण को पहले प्राप्त करने के लिए स्थानापन्न करते हैं

yij=γ0+zi1γ1+xijδ0+xijzi2δ1+ui+xijvi+εij

तय प्रभाव क्या तय हो गई है, इस साधन हैं । यादृच्छिक प्रभाव u i और v i हैंγ0,γ1,δ0,δ1uivi

अब पैनल डेटा के लिए शब्दावली बदल जाती है, लेकिन आप अभी भी सामान्य बिंदु पा सकते हैं। पैनल डेटा यादृच्छिक प्रभाव मॉडल के साथ मिश्रित प्रभाव मॉडल के समान है

β मैं = δ 0

αi=γ0+ui
βi=δ0

मॉडल के साथ becomming

yit=γ0+xitδ0+ui+εit,

जहां यादृच्छिक इफेक्ट होते हैं।ui

xij

uiviεijxijzixijzixijxitui

yit=γ0+xitδ0+ui+εit,

xituiδ0

yity¯i.=(xitx¯i.)δ0+εitε¯i.,

ui

पैनल डेटा अर्थमिति में निश्चित प्रभाव और यादृच्छिक प्रभाव शब्दावली के पीछे बहुत सारा इतिहास है, जिसे मैंने छोड़ दिया था। मेरी व्यक्तिगत राय में इन मॉडलों को वोल्ड्रिज के " क्रॉस सेक्शन और पैनल डेटा के इकोनोमेट्रिक विश्लेषण " में समझाया गया है । जहां तक ​​मुझे पता है कि मिश्रित प्रभाव वाले मॉडल में ऐसा कोई इतिहास नहीं है, लेकिन दूसरी तरफ मैं अर्थमिति पृष्ठभूमि से आता हूं, इसलिए मुझसे गलती हो सकती है।


...+xijvi+ui+εij

यह व्याख्या अद्भुत है! मुझे इस तरह के एक अद्भुत प्रदर्शन देने के लिए सभी प्रयास करने के लिए बहुत बहुत धन्यवाद। बस एक बात पूछना चाहता हूं। 2 स्तर के प्रतिगमन से आपका क्या मतलब है?
बीटा

2
@ श्री, दूसरे स्तर का प्रतिगमन पहले स्तर के प्रतिगमन के प्रतिगमन गुणांक के लिए एक प्रतिगमन है। पहले स्तर का प्रतिगमन समूह के भीतर भिन्नता को समझाने का प्रयास करता है, जबकि दूसरे स्तर का प्रतिगमन समूहों में भिन्नता को समझाने का प्रयास करता है। यह विभाजन कृत्रिम है, लेकिन मुझे यह पसंद है क्योंकि यह मेरे लिए कम से कम स्वाभाविक लगता है। इस तरह के विभाजन का उपयोग पदानुक्रमित बेयस मॉडल में भी किया जाता है।
mpiktas

δ0

3

मैं समझता हूं कि आप एक ऐसे पाठ की तलाश में हैं जो सॉफ्टवेयर पैकेज के संदर्भ के बिना मिश्रित मॉडलिंग सिद्धांत का वर्णन करता है।

मैं मल्टीलेवल एनालिसिस की सिफारिश करूंगा , टॉम स्निजर्स और रोएल बॉस्कर द्वारा लगभग 250pp में बेसिक और एडवांस मल्टीलेवल मॉडलिंग का परिचय। यह अंत में सॉफ्टवेयर पर एक अध्याय है (जो अब कुछ पुराना है) लेकिन शेष बहुत ही सिद्धांत है।

हालांकि मुझे कहना होगा कि मैं सोफिया राबे-हेसेथ और एंडर्स स्के्रनडाल द्वारा मल्टीटाले एंड लॉन्गिट्यूडिनल मॉडल्स फॉर स्टैटा का उपयोग करने के लिए ऊपर की सिफारिश से सहमत हूं। पुस्तक बहुत सैद्धांतिक है और सॉफ्टवेयर घटक वास्तव में एक पर्याप्त पाठ के लिए एक अच्छा जोड़ है। मैं आमतौर पर स्टाटा का उपयोग नहीं करता और मेरे डेस्क पर बैठा पाठ है और इसे बहुत अच्छी तरह से लिखा हुआ पाता हूं। हालांकि यह 200pp से अधिक लंबा है।

निम्नलिखित पाठ सभी क्षेत्र के वर्तमान विशेषज्ञों द्वारा लिखे गए हैं और इन तकनीकों के बारे में अधिक जानकारी चाहने वाले किसी भी व्यक्ति के लिए उपयोगी होंगे (हालांकि वे विशेष रूप से आपके अनुरोध को फिट नहीं करते हैं): [मैं इन से लिंक नहीं कर सकता क्योंकि मैं एक नया हूं उपयोगकर्ता, क्षमा करें]

होक्स, जोप (2010)। बहुस्तरीय विश्लेषण, तकनीक और अनुप्रयोग।

गेलमैन, ए।, और हिल, जे। (2006) रिग्रेसन और मल्टीलेवल / पदानुक्रमित मॉडल का उपयोग कर डेटा विश्लेषण।

सिंगर, जे। (2003) एप्लाइड लॉन्गिट्यूडिनल डेटा एनालिसिस: मॉडलिंग चेंज एंड इवेंट ऑक्योरेंस

राउडेनबश, एसडब्ल्यू, और ब्रिक, ए।, एस (2002)। पदानुक्रमित रैखिक मॉडल: अनुप्रयोग और डेटा विश्लेषण विधियाँ

ल्यूक, डगलस, (2004)। बहुस्तरीय मॉडलिंग

मैं ऊपर उल्लिखित वॉर्ड्रिज के पाठ के साथ-साथ आर पाठ को भी दूसरा कहूंगा , और मल्टीलेवल मॉडलिंग के लिए बी राइफल यूनिवर्सिटी सेंटर में ट्यूटोरियल और जानकारी का एक समूह है


धन्यवाद Playitagain! यह एक बहुत ही उपयोगी जानकारी है। यहां तक ​​कि उर नाम दिलचस्प है :)
बीटा

2

मैंने भी दोनों के बीच के अंतर के बारे में सोचा है और हाल ही में इस विषय पर एक संदर्भ पाया है जो मैं समझता हूं कि "पैनल डेटा" डेटासेट के लिए एक पारंपरिक नाम है जो "क्रॉस-सेक्शन या उन लोगों के समूह का प्रतिनिधित्व करता है जो समय-समय पर सर्वेक्षण करते हैं। समय दिया गया ”। तो "पैनल" डेटासेट के भीतर एक समूह-संरचना है, और इस तरह के समूह का इस तरह के डेटा का विश्लेषण करने का सबसे स्वाभाविक तरीका मिश्रित-मॉडलिंग दृष्टिकोण है।

एक अच्छा संदर्भ (भले ही आप मिश्रित प्रभाव वाले मॉडलिंग पर "आर या नहीं" बोलते हैं) डगलस बेट्स द्वारा आगामी पुस्तक (?) का प्रारूप है ( lme4: R के साथ मिश्रित-प्रभाव मॉडलिंग )।


1
संदर्भ के लिए धन्यवाद ils! लेकिन समस्या अभी भी बनी हुई है।
बीटा

2

@mpiktas ने पूरी तरह से जवाब दिया है। मैं आर में plm पैकेज के लिए प्रलेखन के अध्याय 7 को पढ़ने का भी सुझाव दूंगा । मिश्रित मॉडल और पैनल डेटा के बीच अंतर के बारे में लेखकों की चर्चा पढ़ने लायक है।


1

यदि आप सोफिया राबे-हसेथ और एंडर्स स्केरनडल द्वारा स्टाटा, मल्टीलेवल और लॉन्गिटूडिनल मॉडल का उपयोग करते हैं, तो एक अच्छा विकल्प होगा। इस बात पर निर्भर करता है कि आप वास्तव में किसमें रुचि रखते हैं, 200 पेज सही हो सकते हैं।


संदर्भ के लिए धन्यवाद दिमित्री। लेकिन दुर्भाग्य से मैं STATA का उपयोग नहीं करता। मैं मुख्य रूप से एसएएस का उपयोग करता हूं, और कभी-कभी आर। लेकिन वैसे भी धन्यवाद।
बीटा

2
मैंने wiley.com/WileyCDA/WileyTitle/productCd-0470073713.html के बारे में अच्छी बातें सुनी हैं , लेकिन मैंने इसे खुद नहीं पढ़ा है।
दिमित्री वी। मास्टरोव

धन्यवाद दिमित्री! यह वास्तव में आशाजनक लगता है। काले चश्मे के बजाय सवाल पूछने का लाभ यह है कि आपको वास्तव में अच्छे परिणाम मिलते हैं :)
बीटा

1

मेरे अनुभव में, 'पैनल इकोनोमेट्रिक्स' का उपयोग करने का औचित्य यह है कि पैनल के 'निश्चित प्रभाव' अनुमानक का उपयोग छोड़े गए वैरिएबल पूर्वाग्रह के विभिन्न रूपों को नियंत्रित करने के लिए किया जा सकता है।

हालांकि, मुंडलाक प्रकार के दृष्टिकोण का उपयोग करके एक बहुस्तरीय मॉडल के भीतर इस प्रकार का अनुमान करना संभव है , अर्थात समूह के अतिरिक्त रजिस्टरों के रूप में इसका मतलब है। यह दृष्टिकोण त्रुटि शब्द और संभावित समूह स्तर छोड़े गए कारकों के बीच संबंध को हटाता है, जिससे 'गुणांक' का पता चलता है। हालाँकि, मेरे लिए अज्ञात कारण से यह आमतौर पर लागू अनुसंधान में नहीं किया गया है। ये स्लाइड और यह दस्तावेज़ एक विस्तार प्रदान करते हैं।


(+1) समाजशास्त्री अक्सर समूहों की व्याख्या करते हैं, जिसका अर्थ है संदर्भ प्रभाव (हालांकि यह नेस्टेड क्रॉस-सेक्शनल डेटा के लिए अधिक बार होता है, जबकि यह समय श्रृंखला पैनल डेटा के लिए है)। मुझे पढ़ने की आवश्यकता होगी, संबंधित नोट मैन्स्की (1993) ( पीडीएफ यहां ) में एक लेख है, जिसमें दिखाया गया है कि ऐसे संदर्भ प्रभावों को अक्सर कैसे पहचाना जाता है। "कारणों से ऐसा नहीं किया जाता है" मुझे संदेह है कि यह सामाजिक विज्ञान अभ्यास के बीच उतना ही अंतर है जितना कि कुछ भी हो, यह पूछने के लिए एक अच्छा सवाल हो सकता है।
एंडी डब्ल्यू
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.