अपने पहले प्रश्न का उत्तर देने के लिए, आप सही हैं कि नमूना चयन एंडोजेनिटी का एक विशिष्ट रूप है (एंडोगेनेटी और सामान्य उपचार की एक अच्छी बुनियादी समीक्षा के लिए एंटोनकिस एट अल। 2010 देखें), हालांकि आप यह कहने में सही नहीं हैं कि इलाज होने की संभावना है। अंतर्जात चर है, क्योंकि यह उपचार चर ("गैर-यादृच्छिक उपचार असाइनमेंट") है - इलाज किए जाने की संभावना के बजाय - जो कि नमूना चयन में अंतर्जात है। याद रखें कि एंडोजेनिटी एक ऐसी स्थिति को संदर्भित करता है, जहां आपने गलत तरीके से कारक एक्स और कारक वाई के बीच एक कारण संबंध की पहचान की है, जब मनाया गया "संबंध" वास्तव में एक और कारक जेड के कारण होता है जो एक्स और वाई दोनों को प्रभावित करता है। एक और तरीका है, एक प्रतिगमन मॉडल दिया। :
yi=β0+β1xi+...+ϵi
एंडोगेनेसी तब होती है जब आपके एक या एक से अधिक भविष्यवाणियों के मॉडल में त्रुटि शब्द से संबंधित होता है। है कि, जब ।Cov(x,ϵ)≠0
अंतर्जात के सामान्य कारणों में शामिल हैं:
- चर चर (कुछ चीजें जो हम अभी नहीं माप सकते हैं)
- प्रेरणा / विकल्प
- क्षमता / प्रतिभा
- स्व चयन
- मापन त्रुटि
(हम शामिल करना चाहते हैं , लेकिन हम केवल निरीक्षण एक्स जे * )xjxj∗
- Simultaneity / द्विदिश (5 वर्ष से कम उम्र के बच्चों में, पोषण संबंधी स्थिति संकेतक "उम्र के लिए वजन" और क्या बच्चे को हाल ही में बीमारी थी, के बीच संबंध एक साथ हो सकता है।
विभिन्न प्रकार की समस्याओं के लिए थोड़ा अलग समाधान की आवश्यकता होती है, जो कि IV और हेक्मैन-प्रकार के सुधारों के बीच अंतर होता है। बेशक, इन तरीकों के अंतर्निहित यांत्रिकी में अंतर हैं, लेकिन आधार एक ही है: जो कि एक बहिष्कार प्रतिबंध के माध्यम से आदर्श रूप से, एकांतता प्रतिबंध के माध्यम से आदर्श रूप से हटाने के लिए है, अर्थात IV या चर के मामले में एक या अधिक उपकरण जो चयन को प्रभावित करते हैं या नहीं हेकमैन के मामले में परिणाम।
अपने दूसरे प्रश्न का उत्तर देने के लिए, आपको उन डेटा सीमाओं के प्रकारों में अंतर के बारे में सोचना होगा जिन्होंने इन समाधानों के विकास को जन्म दिया। मुझे लगता है कि वाद्य चर (IV) दृष्टिकोण का उपयोग तब किया जाता है जब एक या एक से अधिक चर अंतर्जात होते हैं, और एंडोजीनिटी को दूर करने के लिए मॉडल में छड़ी करने के लिए बस कोई अच्छा सहारा नहीं होता है, लेकिन सभी टिप्पणियों के लिए सहसंयोजक और परिणाम देखे गए थे। दूसरी ओर, हेक्मैन-प्रकार के सुधार का उपयोग तब किया जाता है जब आपके पास ट्रंकेशन होता है, अर्थात नमूना में उन लोगों के लिए जानकारी नहीं देखी जाती है जहां चयन चर का मूल्य == 0 है।
वाद्य चर (IV) दृष्टिकोण
दो चरण के कम से कम वर्गों (2SLS) अनुमानक के साथ IV प्रतिगमन के लिए क्लासिक अर्थमितीय उदाहरण के बारे में सोचो: कमाई पर शिक्षा का प्रभाव।
(1)Earningsi=β0+β1OwnEdi+ϵi
यहां शैक्षिक उपलब्धि का स्तर अंतर्जात है क्योंकि यह आंशिक रूप से व्यक्ति की प्रेरणा और क्षमता से निर्धारित होता है, दोनों एक व्यक्ति की कमाई को भी प्रभावित करते हैं। प्रेरणा और योग्यता आमतौर पर घरेलू या आर्थिक सर्वेक्षण में नहीं मापी जाती है। समीकरण 1 में स्पष्ट रूप से प्रेरणा और क्षमता शामिल करने के लिए लिखा जा सकता है:
(2)Earningsi=β0+{β1OwnEdi+β2Motivi+β3Abili}+ϵi
चूंकि और ए बी आई एल वास्तव में मनाया नहीं गया है, समीकरण 2 को इस प्रकार लिखा जा सकता है:MotivAbil
(3),Earningsi=β0+β1OwnEdi+ui
जहां (4)।ui=β2Motivi+β3Abili+ϵi
इसलिए, OLS के माध्यम से कमाई पर शिक्षा के प्रभाव का एक मामूली अनुमान पक्षपाती होगा। यह हिस्सा आप पहले से ही जानते हैं।
अतीत में, लोगों ने माता-पिता की शिक्षा का उपयोग विषय के शिक्षा के स्तर के लिए उपकरणों के रूप में किया है, क्योंकि वे एक वैध साधन ( ) के लिए 3 आवश्यकताओं को फिट करते हैं :z
- अंतर्जात भविष्यवक्ता से संबंधित होना चाहिए - 𝐶 𝑜 𝑣 ( 𝑧 , 𝑥 ) ≠ 0 ,zCov(z,x)≠0
- सीधे परिणाम से संबंधित नहीं किया जा सकता - 𝐶 𝑜 𝑣 ( 𝑧 , 𝑦 ) = 0 , औरzCov(z,y)=0
- , अप्रचलित (यू) विशेषता से संबंधित नहीं हो सकता है (अर्थात, z बहिर्जात है) - the the 𝑧 ( 𝑜 , 𝑢 ) = 0zzCov(z,u)=0
आप (विषय की शिक्षा का अनुमान है जब ) माता-पिता की शिक्षा का उपयोग कर ( एम ओ एम ई डी और डी एक घ ई डी ) पहले चरण में और (शिक्षा की भविष्यवाणी मान का उपयोग ^ ओ डब्ल्यू एन ई डी अनुमान के) ई एक r n मैं n छ रों दूसरे चरण में, आप (बहुत साधारण शब्दों में) कर रहे हैं, का आकलन ई एक r n मैं n छ रों के भाग पर आधारितOwnEdMomEdDadEdOwnEdˆEarningsEarnings जो प्रेरणा / क्षमता द्वारा निर्धारित नहीं है।OwnEd
हेकमैन-प्रकार सुधार
जैसा कि हमने पहले स्थापित किया है, गैर-यादृच्छिक नमूना चयन एक विशिष्ट प्रकार की एंडोजेनिटी है। इस मामले में, छोड़ा गया चर है कि कैसे लोगों को नमूने में चुना गया था। आमतौर पर, जब आपको नमूना चयन समस्या होती है, तो आपका परिणाम केवल उन लोगों के लिए मनाया जाता है जिनके लिए नमूना चयन होता है variable == 1
। इस समस्या को "आकस्मिक ट्रंकेशन" के रूप में भी जाना जाता है, और समाधान को सामान्यतः हेक्मैन सुधार के रूप में जाना जाता है। अर्थमिति में क्लासिक उदाहरण विवाहित महिलाओं का वेतन प्रस्ताव है:
(5 )Wagei=β0+β1Educi+β2Experiencei+β3Experience2i+ϵi
यहाँ समस्या यह है कि केवल उन महिलाओं के लिए मनाया जाता है, जो मजदूरी के लिए काम करती हैं, इसलिए एक भोला-भाला व्यक्ति पक्षपाती होगा, क्योंकि हम नहीं जानते कि जो लोग श्रम बल में भाग नहीं लेते हैं, उनके लिए क्या प्रस्ताव है, चयन चर एस । समीकरण 5 को यह दिखाने के लिए फिर से लिखा जा सकता है कि यह दो अव्यक्त मॉडल द्वारा संयुक्त रूप से निर्धारित किया गया है:Wages
(6)Wage∗i=Xβ′+ϵi
(7)LaborForce∗i=Zγ′+νi
यही कारण है, आईएफएफ एल एक ख ओ आर एफ ओ आर सी ई * मैं > 0 और डब्ल्यू एक जी ई = । आईएफएफ एल एक ख ओ आर एफ ओ आर सी ई * मैं ≤ 0Wage=Wage∗iLaborForce∗i>0Wage=.LaborForce∗i≤0
यहाँ समाधान इसलिए एक PROBIT मॉडल और बहिष्कार प्रतिबंध (मान्य साधन के लिए एक ही मापदंड यहाँ लागू) का उपयोग करते हुए पहले चरण में श्रम शक्ति में भागीदारी की संभावना की भविष्यवाणी करने, भविष्यवाणी मिल्स उलटा अनुपात (गणना है λ प्रत्येक अवलोकन के लिए) , और दूसरे चरण में, का उपयोग करते हुए मजदूरी प्रस्ताव का अनुमान λ मॉडल में एक कारक के रूप में (Wooldridge 2009)। तो पर गुणांक λ सांख्यिकीय शून्य के बराबर है, वहाँ नमूना चयन (endogeneity) का कोई सबूत नहीं है, और OLS परिणाम संगत कर रहे हैं और प्रस्तुत किया जा सकता। तो पर गुणांक λλ^λ^λ^λ^ सांख्यिकीय रूप से शून्य से काफी अलग है, आपको सही मॉडल से गुणांक की रिपोर्ट करने की आवश्यकता होगी।
संदर्भ
- एंटोनकिस, जॉन, सैमुअल बेंधन, फिलिप जैक्वार्ट और राफेल लाइव। 2010. "मेकिंग काउंसल क्लेम: ए रिव्यू एंड रिकमेंडेशन्स। " लीडरशिप क्वार्टरली 21 (6): 1086–1120। doi: 10.1016 / j.leaqua.2010.10.010।
- वोल्ड्रिज, जेफरी एम। 2009. परिचयात्मक अर्थमिति: एक आधुनिक दृष्टिकोण। 4 वां संस्करण। मेसन, ओह, यूएसए: साउथ-वेस्टर्न, सेंगेज लर्निंग।