द्विआधारी साधन और एक द्विआधारी अंतर्जात चर के साथ वाद्य चर प्रतिगमन में दूसरे चरण के गुणांक की व्याख्या कैसे करें?


11

(काफी लंबी पोस्ट, क्षमा करें। इसमें बहुत सारी पृष्ठभूमि जानकारी शामिल है, इसलिए नीचे दिए गए सवाल पर बेझिझक जाएं।)

परिचय: मैं एक ऐसी परियोजना पर काम कर रहा हूँ जहाँ हम एक द्विआधारी अंतर्जात चर के प्रभाव की पहचान करने की कोशिश कर रहे हैं,x1निरंतर परिणाम पर, y। हम एक उपकरण के साथ आए हैं,z1, कि हम दृढ़ता से मानते हैं कि अगर-बेतरतीब ढंग से सौंपा गया है।

डेटा: डेटा स्वयं एक पैनल संरचना में है जिसमें लगभग 1000 इकाइयों में फैले 34,000 अवलोकन और लगभग 56 समयावधि हैं।x1 टिप्पणियों के लगभग 700 (2%) के लिए 1 का मान लेता है, और z1लगभग 3000 (9%) के लिए ऐसा करता है। 111 (0.33%) टिप्पणियों में दोनों पर 1 अंक होता हैz1 और इसपर x1, और यह 1 पर स्कोर करने के लिए एक अवलोकन के लिए दो बार की संभावना है x1 अगर यह भी 1 पर स्कोर करता है z1

अनुमान: हम स्टैटा के ivreg2- प्रक्रिया के माध्यम से निम्नलिखित 2SLS मॉडल का अनुमान लगाते हैं:

x1=π0+π1z1+Zπ+v
y=β0+β1x1+Zβ+u

कहाँ पे Z अन्य बहिर्जात चर का एक वेक्टर है, x1 का अनुमानित मूल्य है x1 पहले चरण से, और u तथा v त्रुटि शब्द हैं।

परिणाम: सब कुछ अच्छी तरह से काम करने लगता है; का अनुमान हैπ1 पहले चरण और अनुमान में अत्यधिक महत्वपूर्ण है β1दूसरे चरण में अत्यधिक महत्वपूर्ण है। सभी संकेत अपेक्षित हैं, जिनमें अन्य बहिर्जात चर के लिए भी शामिल हैं। हालाँकि, समस्या यह है कि अनुमान हैβ1 - ब्याज का गुणांक - बड़ा करने योग्य है (या, कम से कम, जिस तरह से हम इसकी व्याख्या कर रहे हैं, उसके अनुसार)।

y लगभग 2 से लेकर 26 तक माध्य और 17 के माध्यिका के साथ है, लेकिन इसका अनुमान है β1 30 से 40 तक (विनिर्देशन के आधार पर)!

कमजोर IV: हमारा पहला विचार यह था कि यह साधन बहुत कमजोर होने के कारण था; यह अंतर्जात चर के साथ बहुत सहसंबद्ध नहीं है, लेकिन यह वास्तव में मामला नहीं लगता है। साधन की कमजोरी का निरीक्षण करने के लिए, हम फिनेले, मैग्नीसन, और शेफ़र के कमजोर पैकेज का उपयोग करते हैं, क्योंकि यह परीक्षण प्रदान करता है जो उल्लंघन के लिए मजबूत हैंi.i.d. धारणा (जो यहां प्रासंगिक है, यह देखते हुए कि हमारे पास पैनल डेटा है और हमारे एसई को इकाई स्तर पर क्लस्टर करता है)।

उनके एआर-परीक्षण के अनुसार, दूसरे चरण के गुणांक के लिए 95% आत्मविश्वास अंतराल की निचली सीमा 16 और 29 के बीच है (फिर से विनिर्देश के आधार पर)। अस्वीकृति संभावना व्यावहारिक रूप से शून्य के करीब सभी मूल्यों के लिए 1 है।

प्रभावशाली अवलोकन: हमने मॉडल को अलग-अलग हटाए गए प्रत्येक इकाई के साथ मॉडल का आकलन करने की कोशिश की है, प्रत्येक अवलोकन को व्यक्तिगत रूप से हटा दिया गया है, और इकाइयों के समूहों के साथ हटा दिया गया है। कोई वास्तविक परिवर्तन नहीं।

प्रस्तावित समाधान: किसी ने प्रस्तावित किया कि हमें साधन के अनुमानित प्रभाव को संक्षेप में प्रस्तुत नहीं करना चाहिएx1 इसके मूल मीट्रिक (0-1) में, लेकिन इसके पूर्वानुमानित संस्करण की मीट्रिक में। x1-०.०१ से ०.१ तक माध्य और लगभग ०.०२ का माध्य और लगभग ०.० 0.1 का एसडी है। अगर हम अनुमानित प्रभाव को संक्षेप में प्रस्तुत करतेx1 द्वारा, कहते हैं, एक एसडी में वृद्धि हुई है x1, यह होगा 0.01830=0.54(अन्य विनिर्देश लगभग समान परिणाम देते हैं)। यह रास्ता अधिक उचित (अभी भी पर्याप्त) होगा। बिल्कुल सही समाधान की तरह लगता है। सिवाय मैंने कभी किसी को ऐसा करते नहीं देखा; हर कोई बस मूल अंतर्जात चर के मीट्रिक का उपयोग करके दूसरे चरण के गुणांक की व्याख्या करता प्रतीत होता है।

प्रश्न: एक IV-मॉडल में, अनुमानित पूर्वानुमान के मीट्रिक का उपयोग करके अंतर्जात चर में वृद्धि के अनुमानित प्रभाव (LATE, वास्तव में) को संक्षेप में बताना सही है? हमारे मामले में, उस मीट्रिक की संभावना की भविष्यवाणी की जाती है।

नोट: हम 2SLS का उपयोग करते हैं, भले ही हमारे पास एक द्विआधारी अंतर्जात चर है (पहले चरण को एलपीएम बनाते हुए)। यह अनुगृहीत और क्रुगर (2001): "इंस्ट्रूमेंटल वैरिएबल्स एंड द सर्च फॉर आइडेंटिफिकेशन: फ्रॉम सप्लाई एंड डिमांड टू नेचुरल एक्सपेरिमेंट्स") हमने एडम्स, अल्मेडा, और फेरेरा (2009) में इस्तेमाल की गई तीन-चरण प्रक्रिया की भी कोशिश की है: " संस्थापक-सीईओ और दृढ़ प्रदर्शन के बीच संबंध को समझना ”। बाद का दृष्टिकोण, जिसमें 2SLS के बाद एक प्रोबिट मॉडल होता है, छोटे और अधिक समझदार गुणांक प्राप्त करता है, लेकिन 0-1 मीट्रिक (लगभग 9-10) में व्याख्या किए जाने पर वे अभी भी बहुत बड़े हैं। हम मैन्युअल गणना के साथ समान परिणाम प्राप्त करते हैं जैसा कि हम सेरुल्ली के ivtreatreg में प्रोबेट -2sls- विकल्प के साथ करते हैं।


क्या आपने कोशिश की है etregress/treatreg?
दिमित्री वी। मास्टरोव

हाय दिमित्री, प्रतिक्रिया के लिए धन्यवाद! मैंने अब etregress की कोशिश की है, और यह कुछ इसी तरह के परिणाम देता है। हालांकि, स्टैट्टा मैनुअल और वोल्ड्रिज (2002) को पढ़ना: "क्रॉस सेक्शन और पैनल डेटा का अर्थमितीय विश्लेषण" मुझे यह धारणा मिलती है कि इस तरह के उपचार-प्रतिगमन मॉडल उपचार की अज्ञानता को मानते हैं। अर्थात्, देखे गए चर पर सशर्त, चाहे एक इकाई का इलाज किया जाए या नहीं, दोनों उपचार और नियंत्रण के तहत इसके (संभावित) परिणाम से स्वतंत्र है।
बर्टेल

(cont।) हमारे डेटा में, हम वास्तव में इस धारणा को बनाए नहीं रख सकते हैं; हमारे पास केवल यादृच्छिक भिन्नता का स्रोत हैx। इसलिए, IV उचित विकल्प लगता है। अगर मेरे पास धारणाएं सही हैं, तो भी।
बर्टेल

यह वास्तव में मददगार होगा, कुछ रेखांकन, जैसे स्कैल्पलॉट्स या कच्चे चर और अवशिष्ट आदि के कर्नेल घनत्व वाले प्लॉट .. याद रखें कि रिम β^1=β1+Cov(z1,u)Cov(z1,x1), यहां तक ​​कि साधन और त्रुटि शब्द के बीच एक छोटा सहसंबंध भी एक मजबूत असंगत अनुमान का कारण बन सकता है β1!
अर्ने जोनास वार्नके

जवाबों:


2

यह एक पुराना सवाल है, लेकिन जो भी भविष्य में इसके पार जाता है, उसके लिए सहज रूप से 2SLS का अनुमान है β1 है α1 "घटा हुआ रूप" प्रतिगमन से

y=α0+α1z1+Zα+u

द्वारा विभाजित π1 "पहले चरण" प्रतिगमन से

x1=π0+π1z1+Zπ+v

तो अगर 2SLS का अनुमान है β1 "बहुत बड़े हैं," के OLS अनुमानों की जाँच करें α1 तथा π1

अगर द α1 अनुमान "उचित" हैं, समस्या यह हो सकती है कि π1अनुमान "बहुत छोटे हैं।" डिवाइडिंगα^1 "बहुत छोटे" द्वारा π^1 एक "काफी बड़े" का उत्पादन कर सकते हैं β^1

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.