क्या होता है अगर "नियंत्रण चर" भी अंतर्जात हैं?


13

मैं पॉलिटिकल इकोनॉमी में काम करता हूं, और बहुत सारे मॉडल में "निर्दोष" नियंत्रण चर जैसे कि जनसंख्या, असमानता, औपनिवेशिक विरासत आदि शामिल हैं ताकि लेखक अपने स्वतंत्र चर पर निष्पक्षता का दावा कर सके।

लेकिन अगर इनमें से कोई नियंत्रण चर किसी छोड़े गए चर के लिए अंतर्जात है, तो क्या यह सभी स्वतंत्र चर की निष्पक्षता को दूषित नहीं करता है?

अगर यह सच है, तो हम क्या कर सकते हैं? उन नियंत्रण चर को बाहर छोड़ दो और वे स्वयं चर पूर्वाग्रह का नेतृत्व करते हैं। उन लोगों को शामिल करें और वे मॉडल में सब कुछ दूषित करेंगे।

उदाहरण: एक शोधकर्ता यह जानना चाहता है कि क्या असमानता हिंसा की ओर ले जाती है, और वह कुछ चीजों के लिए नियंत्रित करता है: यह देखते हुए कि असमानता की संभावना छोड़े गए चर की वजह से अंतर्जात होने के लिए (है परोपकारिता का स्तर

Violence=Inequality+Growth+Development+ϵ
), वह असमानता के लिए एक वाद्य चर खोजने की कोशिश करेगा । लेकिन विकास और विकास अंतर्जात होने की संभावना नहीं है (यानी परोपकारिता के स्तर के साथ सहसंबद्ध ) भी?

यह उदाहरण मूर्खतापूर्ण लग सकता है, लेकिन मेरी बात पॉलिटिकल इकोनॉमी / डेवलपमेंट के काम में है, प्ले (अभी तक लोप) में बहुत सारे कारक हैं जो मुझे डर है कि एलएचएस पर शामिल कई वैरिएबल एंडोजेनस हैं। फिर भी अक्सर, शोधकर्ता केवल अपने पालतू स्वतंत्र चर के लिए एक साधन की तलाश करता है।


फिर भी विचार करने के लिए एक और चीज तथाकथित "खराब नियंत्रण" मुद्दा है - एक स्थिति जब नियंत्रण एक परिणाम चर है। मैं आपको इस विषय की समझ पाने के लिए Angrist और Pischke के "Mostly Harmless Econometrics" सेक्शन 3.2.3 में पढ़ने का सुझाव दूंगा और अगर आप अपने प्रश्न की बेहतर समझ चाहते हैं तो यह क्यों मायने रखता है।
मौलिवारेस

जवाबों:


10

"लेकिन अगर इनमें से कोई नियंत्रण चर किसी छोड़े गए चर के लिए अंतर्जात है, तो क्या यह सभी स्वतंत्र चर की निष्पक्षता को दूषित नहीं करता है?"

मैं इस पर बहुत जोर नहीं देना चाहता, लेकिन यह ध्यान देने योग्य है कि यह सामान्य रूप से सच नहीं है। निम्नलिखित व्युत्पत्ति आपके द्वारा उल्लिखित "संदूषण" की कुछ समझ प्रदान करेगी। एक सरल counterexample के रूप में, लगता है कि डेटा पैदा करने की प्रक्रिया द्वारा दिया जाता है जहां जेड अप्रत्यक्ष है। आज्ञा देना सी वी ( एक्स 1 , जेड ) = 0 , सी वी ( एक्स 2)

Y=X1β1+X2β2+Zγ+ε,
ZCov(X1,Z)=0 , और C o v ( X 1 , X 2 ) = 0 । फिर, यह स्पष्ट है कि X 2 "अंतर्जात" है। लेकिन ध्यान दें कि क्योंकि C o v ( X 1 , Z ) = 0 , हमारे β 1 का अनुमानअभी भी ठीक होगा: प्लिमCov(X2,Z)0Cov(X1,X2)=0X2Cov(X1,Z)=0β1 जहांएक्स * 1 =एम2एक्स1औरएम2=[मैं-एक्स2(एक्स ' 2 एक्स2)-1एक्स ' 2 ]। क्योंकिसीवी(एक्स1,एक्स2)=0,एक्स * 1
plimβ^1=β1+γCov(X1,Z)Var(X1)=β1,
X1=M2X1M2=[IX2(X2X2)1X2]Cov(X1,X2)=0 । तो सी वी ( एक्स * 1 , जेड ) = 0X1=X1Cov(X1,Z)=0

"हम क्या कर सकते है?"

अच्छे अर्थमिति करने की मुख्य चुनौतियों में से एक संभावित पहचान रणनीतियों के बारे में सोचना है। जिस प्रकार की स्थिति का आप वर्णन करते हैं, वहाँ शायद कुछ भी नहीं है जो आप कर सकते हैं लेकिन समस्या को एक अलग तरीके से दृष्टिकोण करने का प्रयास करें।


जबकि आप तकनीकी रूप से सही हैं, मैं इस बिंदु पर जोर नहीं दूंगा। मैं यह कहूंगा कि सामान्य तौर पर, हम किसी भी चर की पक्षपातपूर्णता को खारिज नहीं कर सकते , बजाय इसके कि कुछ परिदृश्यों में इसके ठीक , ठीक होने की बात कही जाए , क्योंकि हम आमतौर पर DGP को नहीं जानते हैं।
FooBar

1) क्या आप मुझे एक संदर्भ जहां को इंगित कर सके β इस तरह से ली गई है? मुझे अपने अर्थमिति में यह नहीं पढ़ाया गया था। 2) आप प्रमाण में C o v ( X 1 , Z ) = 0 का उपयोग कहां करते हैं ? ऐसा लगता है जैसे C o v ( X 1 , X - 2 ) = 0 पर्याप्त है। 3) मैं @FooBar से सहमत हूं कि C o v ( X 1 , X 2 ) = 0 अपवाद हैं, आदर्श नहीं। वास्तव में, यदि सीβ^Cov(X1,Z)=0Cov(X1,X2)=0Cov(X1,X2)=0 हम एक्स 2 के लिए पहली जगह (सटीक को छोड़कर)को नियंत्रित करने के लिए परेशान नहीं करेंगे। Cov(X1,X2)=0X2
हाइजेनबर्ग

@FooBar, मैं सहमत हूँ। मैंने इस बात पर जोर देने के लिए पोस्ट अपडेट किया है कि यह एक विशेष मामला है। जहां तक ​​डीजीपी को न जानने की बात है, वह सच है। लेकिन वह बात नहीं है। किसी भी विश्लेषण को DGP के बारे में धारणाएं बनानी होती हैं और विश्लेषण की गुणवत्ता मान्यताओं की गुणवत्ता पर निर्भर करती है। मैंने जो व्युत्पत्ति दी थी, वह केवल उन मान्यताओं (उदाहरणों, बहुत मजबूत मान्यताओं) का एक उदाहरण प्रस्तुत करने का काम करती है, जो आपको उस स्थान पर पहुँचा सकती हैं जहाँ आप जाना चाहते हैं।
जम्बिजारा २

Cov(X1,Z)=0Cov(X1,Z)=0YX1X2

1
@jmbejara I ने 1) एक अलग प्रश्न के रूप में पोस्ट किया । कृपया मेरे प्रश्न / शीर्षक को संपादित करने के लिए स्वतंत्र महसूस करें, क्योंकि मैं नहीं जानता कि इस मामले में गोगलर के लिए समझदारी और उपयोगी वाक्यांश का उपयोग कैसे किया जाए।
हाइजेनबर्ग

6

सब बहुत मजबूत है, लेकिन शायद कुछ। इस समस्या को "स्मीयरिंग" कहा जाता है। स्लाइड 5 पर ग्रीन के व्याख्यान नोट्स में प्रमाण पर एक नज़र डालें ।

एमिली ओस्टर के पास एक अच्छा काम करने वाला पेपर (और स्टैटा कमांड psacalc) है जो पूर्वाग्रह को बांधने में मदद कर सकता है।


5

लिस्टर-वर्गों के अनुमान के संदर्भ में, जिस तरह से हमें (रजिस्ट्रार के लिए) प्रयास संभव है कि रजिस्टरों की संभावित समरूपता का आकलन इंस्ट्रूमेंटल वेरिएबल्स के आकलन के माध्यम से किया जा सकता है। यह दृष्टिकोण सिर्फ एक अंतर्जात प्रतिगामी होने पर निर्भर नहीं करता है -आप के पास कई हो सकते हैं। इस तरह के एक मामले में आपको अधिक उपकरणों को खोजने की जरूरत है जो चीजों को कठिन बनाते हैं-लेकिन सिद्धांत रूप में, विधि उसी तरह से काम करेगी।

IV अनुमान पूर्वाग्रह के मुद्दे को हल नहीं करता है, यह केवल अनुमानक के लिए स्थिरता प्रदान करता है। लेकिन कुछ भी नहीं है पूर्वाग्रह बार के मुद्दे को सख्ती से अपने आप में (और फिर पूर्वाग्रह कम करने के कुछ तरीके हैं)। लेकिन अगर आप किसी अन्य एसई साइट के आसपास नज़र डालें, तो क्रॉस वैलिडेट , जो कि आँकड़ों के बारे में है, आप देखेंगे कि अनुभवी सांख्यिकीविद् वास्तव में निष्पक्षता की संपत्ति पर अधिक भार नहीं देते हैं, जो परिमित नमूना गुणों पर मीन-स्क्वायर दक्षता पर ध्यान केंद्रित करते हैं, और बड़े नमूना गुणों के लिए स्थिरता पर।


1
तो सही दृष्टिकोण वास्तव में सभी अंतर्जात चर के लिए उपकरण ढूंढना है, है ना?
हाइजेनबर्ग

1
हाँ, यह तरीका है।
एलेकोस पापाडोपोलोस

5

यह एक उदाहरण है कि सांख्यिकीविद एंड्रयू जेलमैन ने "एक मध्यवर्ती परिणाम के लिए नियंत्रण की गिरावट " कहा है। यहाँ उनकी इस पतनशीलता का वर्णन है, जब शोधकर्ता पूछते हैं कि क्या अधिक बेटियाँ आपकी राजनीति को बदल देती हैं। दूसरा बच्चा होने का निर्णय आवश्यक रूप से पहला बच्चा होने के पिछले निर्णय पर सशर्त है, और इसलिए निर्णय चर के लिए नियंत्रण का एक स्पष्ट उदाहरण लगता है जो अंतर्जात था।

बेटियों के माता-पिता की तुलना में बेटों के माता-पिता के आर्थिक फैसलों को देखते हुए पिछले कुछ वर्षों में कई अध्ययन किए गए हैं .... इन सभी अध्ययनों की एक सामान्य विशेषता यह है कि वे कुल बच्चों की संख्या को नियंत्रित करते हैं ... बच्चों की कुल संख्या के लिए नियंत्रित पहली दृष्टि, उचित लगता है। हालाँकि, एक कठिनाई यह है कि बच्चों की कुल संख्या एक मध्यवर्ती परिणाम है, और इसके लिए नियंत्रण (चाहे #kids पर आधारित डेटा को कम करके या प्रतिगमन मॉडल में एक नियंत्रण चर के रूप में #kids का उपयोग करके) अनुमान को पूर्वाग्रह कर सकता है। पुत्र (या पुत्री) होने के कारण का प्रभाव।

यह देखने के लिए, मान लीजिए कि (काल्पनिक रूप से) राजनीतिक रूप से रूढ़िवादी माता-पिता बेटों को चाहते हैं, और यदि उनकी दो बेटियां हैं, तो वे (काल्पनिक रूप से) तीसरे बच्चे के लिए प्रयास करने की अधिक संभावना रखते हैं। तुलना में, उदारवादियों को दो बेटियों पर रुकने की अधिक संभावना है। इस मामले में, यदि आप 2 बेटियों वाले परिवारों के आंकड़ों को देखते हैं, तो रूढ़िवादियों को कम करके आंका जाएगा, और डेटा राजनीतिक उदारवाद के साथ बेटियों के सहसंबंध को दिखा सकता है - भले ही बेटियों का कोई प्रभाव न हो! ...

एक समाधान मानक रूढ़िवादी (सांख्यिकीय अर्थ में!) कार्य-कारण निष्कर्ष पर पहुंचना है, जो आपके उपचार चर (बच्चे के लिंग) पर फिर से लागू करना है, लेकिन केवल उन चीजों के लिए नियंत्रित करना जो बच्चे के जन्म से पहले होती हैं। उदाहरण के लिए, कोई ऐसे माता-पिता की तुलना कर सकता है, जिसका पहला बच्चा माता-पिता की लड़की हो, जिसका पहला बच्चा लड़का हो। एक दूसरे जन्म को भी देख सकता है, माता-पिता की तुलना करता है, जिसका दूसरा बच्चा उन लोगों के लिए एक लड़की है, जिनका दूसरा बच्चा एक लड़का है - जो पहले बच्चे के लिंग के लिए नियंत्रित करता है। और इतने पर तीसरे बच्चे के लिए, आदि।

क्या पुत्र होने से आप अधिक रूढ़िवादी हो जाते हैं? शायद शायद नहीं। एक मध्यवर्ती परिणाम के लिए नियंत्रित करने में समस्या

आपकी टिप्पणी के बारे में कि "उन नियंत्रण चर को छोड़ दें और वे स्वयं चर चर को छोड़ देते हैं।", यह निर्भर करता है कि आपको किस प्रकार का साधन मिलता है। एक अच्छा साधन, जो वास्तव में आवश्यकताओं को संतुष्ट करता है, को दूसरे चरण में त्रुटि शब्द से स्वतंत्र होना चाहिए और जो कुछ आप सीधे सीधे नियंत्रित करते हैं, उसके लिए स्वतंत्र होना चाहिए । यही है, साधन केवल X के माध्यम से Y बदलता है। इसलिए असमानता के लिए एक उपयुक्त साधन विकास और विकास से स्वतंत्र होना चाहिए (सौभाग्य यह खोज!) यदि हम मानते हैं कि हिंसा समीकरण हिंसा के लिए संरचनात्मक समीकरण है।


1

जैसा कि अन्य पोस्टों में बताया गया है, अंतर्जात रजिस्टर्स रिग्रेशन के सभी पैरामीटर अनुमानों को दूषित कर सकते हैं जब रजिस्टरों को सहसंबद्ध किया जाता है।

X1X2X2X1

β^1X2X1X2

निम्नलिखित मॉडल पर विचार करें (@ jmbejara की संकेतन के अनुरूप)

y=X1β1+X2β2+Zγ+ε,

Zε1nx1(k)εp01nx2(k)εp0kX21nx1(k)z(l)p0(k,l)

X2X1X1ZX2

1nx1(k)QX2z(l)p0
(k,l)QX2X2QX2[InX2(X2X2)1X2]β1

β^1=(X1QX2X1)1X1QX2y=β1+(X1QX2X1)1X1QX2X2p0β2+(X1QX2X1)1X1QX2Zp0γ+(X1QX2X1)1X1QX2εp0
X1X2
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.