क्या डंडियों के साथ लॉजिस्टिक प्रतिगमन के लिए मुंडलाक निश्चित प्रभाव प्रक्रिया लागू है?


12

मेरे पास 8000 क्लस्टर और 4 मिलियन टिप्पणियों के साथ एक डेटासेट है। दुर्भाग्य से मेरा सांख्यिकीय सॉफ्टवेयर, स्टैटा, लॉजिस्टिक प्रतिगमन के लिए अपने पैनल डेटा फ़ंक्शन का उपयोग करते समय धीरे-धीरे चलता है: xtlogitयहां तक ​​कि 10% सदस्यता के साथ।

हालांकि, नॉनपैनल logitफ़ंक्शन का उपयोग करते समय परिणाम बहुत जल्दी दिखाई देते हैं। इसलिए मैं logitसंशोधित आंकड़ों पर उपयोग करने से लाभान्वित हो सकता हूं जो निश्चित प्रभावों के लिए खाते हैं।

मेरा मानना ​​है कि इस प्रक्रिया को "मुंड्लक फिक्स्ड इफेक्ट्स प्रोसेस" (मुंडलाक, वाई। 1978) कहा जाता है। पूलिंग ऑफ टाइम-सीरीज़ और क्रॉस-सेक्शन डेटा। अर्थमित्रा, 46 (1), 69-85।

मुझे एंटोनकिस, जे।, बेंधन, एस।, जैक्वार्ट, पी।, और लालिव, आर। (2010) द्वारा एक पेपर में इस प्रक्रिया का सहज विवरण मिला कारण दावे करने पर: एक समीक्षा और सिफारिशें। नेतृत्व त्रैमासिक, 21 (6)। 1086-1120। मैं उद्धृत करता हूं:

एक तरह से छोड़े गए effects xed प्रभावों की समस्या को हल करने के लिए और अभी भी स्तर 2 चर को शामिल करने के लिए अनुमानित मॉडल (मुंडलाक, 1978) में सभी स्तर 1 कोवरिएट्स के क्लस्टर साधनों को शामिल करना है। क्लस्टर साधनों को स्तर 1 कोवरिएट से रजिस्टरों या घटाया (यानी, क्लस्टर-मीन सेंटरिंग) के रूप में शामिल किया जा सकता है। क्लस्टर का मतलब क्लस्टर के भीतर अपरिवर्तनीय है (और क्लस्टर के बीच भिन्न होता है) और स्तर 1 मापदंडों के सुसंगत आकलन के लिए अनुमति देता है जैसे कि had xed-effects को शामिल किया गया था (देखें Rabe-Hesketh & Skrondal, 2008)।

इसलिए क्लस्टर-मीनिंग सेंटिंग मेरी कम्प्यूटेशनल समस्या को हल करने के लिए आदर्श और व्यावहारिक लगता है। हालांकि, इन कागजों को रेखीय प्रतिगमन (OLS) की ओर देखा जा रहा है।

क्या क्लस्टर-माध्य केंद्र की यह विधि "फिक्स्ड इफेक्टिंग" के लिए भी लागू है जो कि निश्चित प्रभाव बाइनरी लॉजिस्टिक रिग्रेशन है?

एक और अधिक तकनीकी प्रश्न जिसका परिणाम एक ही उत्तर में होना चाहिए: xtlogit depvar indepvars, feडेटासेट के साथ है A, logit depvar indepvarsडाटासेट B के बराबर है जब डाटासेट B, डाटासेट A का क्लस्टर-माध्य केन्द्रित संस्करण है?

इस क्लस्टर-मीनिंग सेंटरिंग में मुझे एक अतिरिक्त कठिनाई यह देखने को मिली कि कैसे डमी से सामना करना है। क्योंकि डमीज़ या तो 0 या 1 हैं, क्या वे यादृच्छिक और स्थिर प्रभाव प्रतिगमन में समान हैं? क्या उन्हें "केंद्रित" नहीं होना चाहिए?

जवाबों:


9

पहले अलग-अलग या परिवर्तनों के भीतर जैसे कि डीमनिंग लोगिट जैसे मॉडल में उपलब्ध नहीं हैं क्योंकि नॉनलाइनर मॉडल के मामले में इस तरह के ट्रिक्स अप्रमाणित निश्चित प्रभावों को नहीं हटाते हैं। यहां तक ​​कि अगर आपके पास एक छोटा डेटा सेट था जिसमें निश्चित प्रभावों का अनुमान लगाने के लिए एन -1 व्यक्तिगत डमी को शामिल करना संभव था, तो इससे पक्षपाती अनुमान होता है जब तक कि आपके डेटा का समय आयाम बड़ा नहीं होता। पैनल लॉज में निश्चित प्रभावों का उन्मूलन इसलिए न तो अलग-अलग होता है और न ही डिमैमिंग और केवल लॉजिकल फंक्शनल फॉर्म के कारण ही संभव होता है। यदि आप उन विवरणों में रुचि रखते हैं जो आप इन नोटों पर एक नज़र रख सकते हैं Söderbom द्वारा पीडीएफ पेज 30 पर (स्पष्टीकरण के लिए कि लॉग इन / प्रोबिट में डिमांनिंग / पहले अंतर कैसे मदद नहीं करता है) और पृष्ठ 42 (पैनल लॉगिट अनुमानक का परिचय)।

एक और समस्या यह है कि xtlogitऔर पैनल लॉग मॉडल सामान्य रूप से निश्चित प्रभावों का अनुमान नहीं लगाते हैं जो कि सीमांत प्रभावों की गणना करने के लिए आवश्यक हैं। उन लोगों के बिना आपके गुणांक की व्याख्या करना बहुत अजीब होगा जो घंटों और घंटों तक मॉडल चलाने के बाद निराशाजनक हो सकते हैं।

इस तरह के एक बड़े डेटा सेट और एफई पैनल लॉगिट की पहले से वर्णित वैचारिक कठिनाइयों के साथ मैं रैखिक संभाव्यता मॉडल के साथ रहना चाहूंगा। मुझे उम्मीद है कि यह उत्तर आपको निराश नहीं करता है, लेकिन ऐसी सलाह देने के कई अच्छे कारण हैं: एलपीएम बहुत तेज है, गुणांक सीधे व्याख्या की जा सकती है (यह विशेष रूप से रखती है यदि आपके मॉडल में परस्पर प्रभाव पड़ता है क्योंकि उनकी व्याख्या गैर-रैखिक मॉडल परिवर्तनों में गुणांक!), निश्चित प्रभाव को आसानी से नियंत्रित किया जाता है और आप अनुमान से परे बढ़ते समय के बिना निरंकुशता और क्लस्टर के लिए मानक त्रुटियों को समायोजित कर सकते हैं। आशा है कि ये आपकी मदद करेगा।


1
यह एक समाधान नहीं है, बल्कि इसका उत्तर है। धन्यवाद :)
टॉम

1
छोटा बिंदु: उन स्लाइड्स का p20 आपके मामले को बनाता है, लेकिन एक मुंडलाक-सुधार उर्फ ​​'सहसंबद्ध यादृच्छिक प्रभाव' मॉडल को p47 पर वर्णित किया गया है और ऐसा लगता है कि ऐसा कोई कैवेट नहीं है।
conjugateprior

1

मेरा मानना ​​है कि सशर्त लॉगिट (स्टैटा पर "क्लॉगिट"), यह एक वैकल्पिक निश्चित-प्रभाव लॉजिट पैनल अनुमानक है।

http://www3.nd.edu/~rwilliam/stats3/Panel03-FixedEffects.pdf


5
साइट पर आपका स्वागत है! मुझे लगता है कि यह एक स्वीकार्य जवाब नहीं है, क्योंकि वास्तव में सवाल यह है: अनुमान को गति देने के उद्देश्य से संशोधित क्रॉस-अनुभागीय लॉजिस्टिक रिग्रेशन द्वारा सशर्त (निश्चित-प्रभाव) लॉजिस्टिक रिग्रेशन से कैसे बचा जाए। आपके संदर्भ (पेज 3 के शीर्ष पर) इंगित करता है, "हम या तो उपयोग कर सकते हैं Stataके clogitआदेश या xtlogit, feआदेश एक निश्चित प्रभाव logit विश्लेषण करना है। दोनों एक ही परिणाम देती है। (वास्तव में, मेरा मानना है कि xtlogit, feवास्तव में कॉल clogit।)" द ओपी पहले से ही xtlogit, feपारंगत पैराग्राफ के आधार पर जानता था ।
Randel

0

एलिसन ने इस समस्या पर एलिसन, (2009), "फिक्स्ड इफेक्ट्स रिग्रेशन मॉडल", p.32f में चर्चा की है।

एलीसन का तर्क है कि अधिकतम संभावना के साथ बिना शर्त मॉडल का अनुमान लगाना संभव नहीं है। यह इसलिए है क्योंकि "आकस्मिक मापदंडों की समस्या" के कारण मॉडल पक्षपाती हो जाते हैं। इसके बजाय, वह एक सशर्त लॉजिट मॉडल (चैंबरलेन, 1980) का उपयोग करने की सलाह देता है। यह कंडीशनिंग द्वारा प्रत्येक व्यक्ति के लिए देखी गई घटनाओं की संख्या पर संभावना फ़ंक्शन को पूरा करता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.