क्लस्टर एसई का उपयोग करके बनाम स्थिर प्रभावों का उपयोग कब करें?


19

मान लीजिए कि आपके पास डेटा का एक एकल क्रॉस-सेक्शन है, जहां व्यक्ति समूहों के भीतर स्थित हैं (जैसे स्कूलों के भीतर छात्र) और आप उस फॉर्म के एक मॉडल का अनुमान लगाना चाहते हैं, Y_i = a + B*X_iजहां Xव्यक्तिगत स्तर की विशेषताओं और aएक स्थिर का वेक्टर है ।

इस मामले में, मान लें कि समूह-विषम विषमता के बीच आपकी बात Bऔर उनके एसई के अनुमान को पूर्वाग्रहित कर दिया गया है क्योंकि यह आपके स्वतंत्र चर के साथ सहसंबद्ध है।

एक विकल्प समूहों (स्कूलों) द्वारा अपने एसई को क्लस्टर करना है। एक और समूह FEs शामिल करने के लिए है। एक और दोनों का उपयोग करना है। इन विकल्पों के बीच चयन करते समय किसी को क्या विचार करना चाहिए? यह विशेष रूप से स्पष्ट नहीं है कि कोई समूह द्वारा एसई को क्लस्टर क्यों कर सकता है और ग्रुप एफई का उपयोग कर सकता है। मेरे विशिष्ट मामले में, मेरे पास 35 समूह हैं और प्रत्येक समूह में 5,000 व्यक्ति नेस्टेड हैं । मैंने इस pdf में चर्चा का पालन किया है , लेकिन यह स्पष्ट नहीं है कि क्यों और कब दोनों क्लस्टर्ड SEs और निश्चित प्रभाव का उपयोग कर सकते हैं।

(कृपया मुझे सिर्फ एक बहुस्तरीय मॉडल फिट करने के सुझाव के बजाय क्लस्टर किए गए एसई बनाम एफए के पेशेवरों और विपक्ष पर चर्चा करें।)

जवाबों:


22

समूह निर्धारित प्रभाव और / या क्लस्टर-समायोजित मानक त्रुटि का उपयोग करते हुए दोनों दृष्टिकोण, क्लस्टर (या पैनल) डेटा से संबंधित विभिन्न मुद्दों को ध्यान में रखते हैं और मैं स्पष्ट रूप से उन्हें अलग-अलग दृष्टिकोणों के रूप में देखूंगा। अक्सर आप दोनों का उपयोग करना चाहते हैं:

सबसे पहले, क्लस्टर-सहसंबंध या विषम-विषमता के लिए क्लस्टर-समायोजित मानक त्रुटि खाता जिसे निश्चित-प्रभाव अनुमानक खाते में नहीं लेता है जब तक कि आप आगे की धारणा बनाने के लिए तैयार नहीं होते हैं, लघु चर्चा के लिए इमबेंस और वोल्ड्रिज व्याख्यान स्लाइड देखें और लंबे पैनल और इस समस्या से संबंधित विभिन्न मुद्दे । कैमरन और मिलर द्वारा इस विषय के बारे में एक उपन्यास पत्र भी है: एक प्रैक्टिशनर गाइड टू क्लस्टर-रोबस्ट इंट्रेंस जो आपके लिए दिलचस्प हो सकता है। यदि आप विचरण-सहसंयोजक मैट्रिक्स को मॉडल नहीं करना चाहते हैं और आपको संदेह है कि क्लस्टर-सहसंबंध मौजूद है, तो मैं क्लस्टर मजबूत मानक त्रुटि का उपयोग करने की सलाह देता हूं क्योंकि आपके एसई में पूर्वाग्रह गंभीर हो सकता है (विषमलैंगिकता की तुलना में बहुत अधिक समस्याग्रस्त), देखेंइस विषय की चर्चा के लिए एंग्रीस्ट और पिसके अध्याय III.8 । लेकिन आपको पर्याप्त क्लस्टर की आवश्यकता है (एग्रीस्ट और पिस्के ने अंगूठे की भूमिका के रूप में 40-50 कहा)। क्लस्टर-समायोजित मानक त्रुटि मानक त्रुटि को ध्यान में रखती है लेकिन अपने बिंदु अनुमानों को अपरिवर्तित छोड़ दें (मानक त्रुटि आमतौर पर ऊपर जाएगी)!

फिक्स्ड-इफेक्ट इस्टीमेट अनुमान के अनुसार समय-असमानता विषमता (जैसा कि आपने उल्लेख किया है) को ध्यान में रखता है। यह अच्छा या बुरा हो सकता है: हाथ पर, आपको लगातार अनुमान प्राप्त करने के लिए कम मान्यताओं की आवश्यकता होती है। दूसरी ओर, आप बहुत से विचरण फेंक देते हैं जो उपयोगी हो सकते हैं। एंड्रयू जेलमैन जैसे कुछ लोग पदानुक्रमित मॉडलिंग को निश्चित प्रभावों के लिए पसंद करते हैं लेकिन यहां राय अलग है। फिक्स्ड-इफेक्ट का अनुमान, बिंदु और अंतराल के अनुमान दोनों को बदल देगा (यहां भी मानक त्रुटि आमतौर पर अधिक होगी)।

तो संक्षेप में: क्लस्टर-स्ट्रांग स्टैण्डर्ड एरर क्लस्टर्ड डेटा से संबंधित संभावित मुद्दों को ध्यान में रखने का एक आसान तरीका है यदि आप मॉडलिंग इंटर और इंट्रा-क्लस्टर सहसंबंध के साथ परेशान नहीं करना चाहते हैं (और पर्याप्त क्लस्टर उपलब्ध हैं)। निश्चित-प्रभाव आकलन केवल कुछ भिन्नता का उपयोग करेगा, इसलिए यह आपके मॉडल पर निर्भर करता है कि आप कम भिन्नता के आधार पर अनुमान लगाना चाहते हैं या नहीं। लेकिन आगे की मान्यताओं के बिना निश्चित-प्रभाव का अनुमान विचरण मैट्रिक्स के लिए इंट्रा-क्लस्टर सहसंबंध से संबंधित समस्याओं का ध्यान नहीं रखेगा। निश्चित-प्रभाव आकलन के उपयोग से संबंधित समस्याओं को ध्यान में रखते हुए न तो क्लस्टर-मजबूत मानक त्रुटि होगी।


2
अच्छी प्रतिक्रिया। शेष शेष प्रश्न यह है कि कोई BOTH क्यों चाहेगा। Imbens और Wooldridge कुछ हद तक इसे कवर करते हैं।
प्रश्नावली

14

आपके डेटा में अलग-अलग समूहों को अलग-अलग समूहों को हटाने के लिए निश्चित प्रभाव हैं।

मैं स्वीकृत प्रतिक्रिया में निहितार्थ से असहमत हूं कि एफई मॉडल का उपयोग करने का निर्णय इस बात पर निर्भर करेगा कि आप "कम भिन्नता का उपयोग करना चाहते हैं या नहीं"। यदि आपका आश्रित चर अप्रभावी चर से प्रभावित होता है जो आपके पैनल के समूहों में व्यवस्थित रूप से भिन्न होता है, तो इस परिवर्तन के साथ सहसंबंधित किसी भी चर पर गुणांक पक्षपाती होगा। जब तक आपके एक्स चर को बेतरतीब ढंग से असाइन नहीं किया गया है (और वे अवलोकन डेटा के साथ कभी नहीं होंगे), आमतौर पर छोड़े गए चर पूर्वाग्रह के लिए तर्क करना काफी आसान है। आप कर सकते हैंनियंत्रण चर की एक अच्छी सूची के साथ कुछ छोड़े गए चर के लिए नियंत्रित करने में सक्षम हो, लेकिन अगर मजबूत पहचान आपका नंबर 1 लक्ष्य है, तो भी नियंत्रण की एक व्यापक सूची महत्वपूर्ण पाठकों के लिए आपके परिणामों पर संदेह करने के लिए जगह छोड़ सकती है। इन मामलों में, आमतौर पर एक निश्चित प्रभाव मॉडल का उपयोग करना एक अच्छा विचार है।

क्लस्टर की गई मानक त्रुटियां उन स्थितियों के लिए लेखांकन के लिए होती हैं, जिनमें प्रत्येक समूह के लिए अवलोकन iid नहीं होते हैं (स्वतंत्र रूप से और समान रूप से वितरित)।

एक क्लासिक उदाहरण है यदि आपके पास समय के साथ फर्मों के एक पैनल के लिए कई अवलोकन हैं। आप फर्म-स्तरीय निश्चित प्रभावों के लिए जिम्मेदार हो सकते हैं, लेकिन आपके आश्रित चर में कुछ अस्पष्टीकृत भिन्नता हो सकती है जो समय के साथ सहसंबद्ध है। सामान्य तौर पर, जब समय-श्रृंखला डेटा के साथ काम करते हैं, तो आमतौर पर आपके समूहों के भीतर त्रुटि शब्दों में अस्थायी सीरियल सहसंबंध को मानना ​​सुरक्षित होता है। क्लस्टर एसई के लिए ये स्थिति सबसे स्पष्ट उपयोग के मामले हैं।

कुछ उदाहरण हैं:

यदि आपके पास प्रायोगिक डेटा है जहां आप बेतरतीब ढंग से उपचार प्रदान करते हैं, लेकिन समय के साथ प्रत्येक व्यक्ति / समूह के लिए बार-बार अवलोकन करते हैं, तो आप निश्चित प्रभावों को छोड़ने में उचित होंगे, लेकिन अपने एसई को क्लस्टर करना चाहेंगे।

वैकल्पिक रूप से, यदि आपके पास गैर-प्रायोगिक डेटा के लिए प्रति समूह में कई अवलोकन हैं, लेकिन प्रत्येक समूह के अवलोकन को उनके बड़े समूह से आईआईडी ड्रा माना जा सकता है (उदाहरण के लिए, आपके पास कई स्कूलों के अवलोकन हैं, लेकिन प्रत्येक समूह एक यादृच्छिक रूप से तैयार किया गया उपसमूह है। अपने विद्यालय के छात्रों से), आप निश्चित प्रभावों को शामिल करना चाहते हैं, लेकिन क्लस्टर किए गए एसई की आवश्यकता नहीं होगी।


2

ये उत्तर ठीक हैं, लेकिन सबसे हाल ही में और सबसे अच्छा उत्तर अबादी एट अल द्वारा प्रदान किया गया है। (2019) "आपको क्लस्टरिंग के लिए मानक त्रुटियों को कब समायोजित करना चाहिए?" निश्चित प्रभावों के साथ, क्लस्टर का एक मुख्य कारण यह है कि आप समूहों में उपचार के प्रभाव में विविधता ला सकते हैं। अन्य कारण हैं, उदाहरण के लिए यदि क्लस्टर (जैसे फर्म, देश) जनसंख्या में समूहों के सबसेट हैं (जिसके बारे में आप बता रहे हैं)। क्लस्टरिंग एक डिजाइन मुद्दा है जो कागज का मुख्य संदेश है। आँख बंद करके मत करो।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.