(काफी लंबी पोस्ट, क्षमा करें। इसमें बहुत सारी पृष्ठभूमि जानकारी शामिल है, इसलिए नीचे दिए गए सवाल पर बेझिझक जाएं।)
परिचय: मैं एक ऐसी परियोजना पर काम कर रहा हूँ जहाँ हम एक द्विआधारी अंतर्जात चर के प्रभाव की पहचान करने की कोशिश कर रहे हैं,निरंतर परिणाम पर, । हम एक उपकरण के साथ आए हैं,, कि हम दृढ़ता से मानते हैं कि अगर-बेतरतीब ढंग से सौंपा गया है।
डेटा: डेटा स्वयं एक पैनल संरचना में है जिसमें लगभग 1000 इकाइयों में फैले 34,000 अवलोकन और लगभग 56 समयावधि हैं। टिप्पणियों के लगभग 700 (2%) के लिए 1 का मान लेता है, और लगभग 3000 (9%) के लिए ऐसा करता है। 111 (0.33%) टिप्पणियों में दोनों पर 1 अंक होता है और इसपर , और यह 1 पर स्कोर करने के लिए एक अवलोकन के लिए दो बार की संभावना है अगर यह भी 1 पर स्कोर करता है ।
अनुमान: हम स्टैटा के ivreg2- प्रक्रिया के माध्यम से निम्नलिखित 2SLS मॉडल का अनुमान लगाते हैं:
कहाँ पे अन्य बहिर्जात चर का एक वेक्टर है, का अनुमानित मूल्य है पहले चरण से, और तथा त्रुटि शब्द हैं।
परिणाम: सब कुछ अच्छी तरह से काम करने लगता है; का अनुमान है पहले चरण और अनुमान में अत्यधिक महत्वपूर्ण है दूसरे चरण में अत्यधिक महत्वपूर्ण है। सभी संकेत अपेक्षित हैं, जिनमें अन्य बहिर्जात चर के लिए भी शामिल हैं। हालाँकि, समस्या यह है कि अनुमान है - ब्याज का गुणांक - बड़ा करने योग्य है (या, कम से कम, जिस तरह से हम इसकी व्याख्या कर रहे हैं, उसके अनुसार)।
लगभग 2 से लेकर 26 तक माध्य और 17 के माध्यिका के साथ है, लेकिन इसका अनुमान है 30 से 40 तक (विनिर्देशन के आधार पर)!
कमजोर IV: हमारा पहला विचार यह था कि यह साधन बहुत कमजोर होने के कारण था; यह अंतर्जात चर के साथ बहुत सहसंबद्ध नहीं है, लेकिन यह वास्तव में मामला नहीं लगता है। साधन की कमजोरी का निरीक्षण करने के लिए, हम फिनेले, मैग्नीसन, और शेफ़र के कमजोर पैकेज का उपयोग करते हैं, क्योंकि यह परीक्षण प्रदान करता है जो उल्लंघन के लिए मजबूत हैं धारणा (जो यहां प्रासंगिक है, यह देखते हुए कि हमारे पास पैनल डेटा है और हमारे एसई को इकाई स्तर पर क्लस्टर करता है)।
उनके एआर-परीक्षण के अनुसार, दूसरे चरण के गुणांक के लिए 95% आत्मविश्वास अंतराल की निचली सीमा 16 और 29 के बीच है (फिर से विनिर्देश के आधार पर)। अस्वीकृति संभावना व्यावहारिक रूप से शून्य के करीब सभी मूल्यों के लिए 1 है।
प्रभावशाली अवलोकन: हमने मॉडल को अलग-अलग हटाए गए प्रत्येक इकाई के साथ मॉडल का आकलन करने की कोशिश की है, प्रत्येक अवलोकन को व्यक्तिगत रूप से हटा दिया गया है, और इकाइयों के समूहों के साथ हटा दिया गया है। कोई वास्तविक परिवर्तन नहीं।
प्रस्तावित समाधान: किसी ने प्रस्तावित किया कि हमें साधन के अनुमानित प्रभाव को संक्षेप में प्रस्तुत नहीं करना चाहिए इसके मूल मीट्रिक (0-1) में, लेकिन इसके पूर्वानुमानित संस्करण की मीट्रिक में। -०.०१ से ०.१ तक माध्य और लगभग ०.०२ का माध्य और लगभग ०.० 0.1 का एसडी है। अगर हम अनुमानित प्रभाव को संक्षेप में प्रस्तुत करते द्वारा, कहते हैं, एक एसडी में वृद्धि हुई है , यह होगा (अन्य विनिर्देश लगभग समान परिणाम देते हैं)। यह रास्ता अधिक उचित (अभी भी पर्याप्त) होगा। बिल्कुल सही समाधान की तरह लगता है। सिवाय मैंने कभी किसी को ऐसा करते नहीं देखा; हर कोई बस मूल अंतर्जात चर के मीट्रिक का उपयोग करके दूसरे चरण के गुणांक की व्याख्या करता प्रतीत होता है।
प्रश्न: एक IV-मॉडल में, अनुमानित पूर्वानुमान के मीट्रिक का उपयोग करके अंतर्जात चर में वृद्धि के अनुमानित प्रभाव (LATE, वास्तव में) को संक्षेप में बताना सही है? हमारे मामले में, उस मीट्रिक की संभावना की भविष्यवाणी की जाती है।
नोट: हम 2SLS का उपयोग करते हैं, भले ही हमारे पास एक द्विआधारी अंतर्जात चर है (पहले चरण को एलपीएम बनाते हुए)। यह अनुगृहीत और क्रुगर (2001): "इंस्ट्रूमेंटल वैरिएबल्स एंड द सर्च फॉर आइडेंटिफिकेशन: फ्रॉम सप्लाई एंड डिमांड टू नेचुरल एक्सपेरिमेंट्स") हमने एडम्स, अल्मेडा, और फेरेरा (2009) में इस्तेमाल की गई तीन-चरण प्रक्रिया की भी कोशिश की है: " संस्थापक-सीईओ और दृढ़ प्रदर्शन के बीच संबंध को समझना ”। बाद का दृष्टिकोण, जिसमें 2SLS के बाद एक प्रोबिट मॉडल होता है, छोटे और अधिक समझदार गुणांक प्राप्त करता है, लेकिन 0-1 मीट्रिक (लगभग 9-10) में व्याख्या किए जाने पर वे अभी भी बहुत बड़े हैं। हम मैन्युअल गणना के साथ समान परिणाम प्राप्त करते हैं जैसा कि हम सेरुल्ली के ivtreatreg में प्रोबेट -2sls- विकल्प के साथ करते हैं।
etregress/treatreg
?