क्या "एंडोजेनिटी" और "अतिशयता" का तात्पर्य है?


43

मैं समझता हूं कि एंडोजेनिटी की मूल परिभाषा यह है कि संतुष्ट नहीं है, लेकिन वास्तविक दुनिया में इसका क्या मतलब है? मैंने आपूर्ति और मांग के उदाहरण के साथ विकिपीडिया लेख पढ़ा, इसे समझने की कोशिश कर रहा था, लेकिन यह वास्तव में मदद नहीं करता था। मैंने अंतर्जात और बहिर्जात के अन्य विवरण को सिस्टम के भीतर होने और सिस्टम के बाहर होने के रूप में सुना है और यह अभी भी मेरे लिए समझ में नहीं आता है।

Xϵ=0

1
नीचे दिए गए सभी तीन उत्तर बहुत अच्छे हैं (प्रत्येक के लिए +1)। यदि आप जानकारी का कोई अन्य स्रोत चाहते हैं, तो मैं इस विषय पर यहां चर्चा करता हूं: बजाय अनुमानb 1 x 1 + b 2 x 2 + b 3 x 3b1x1+b2x2b1x1+b2x2+b3x3 , और इसमें w / सिमुलेशन का वर्णन करें R
गूँज - मोनिका

1
जब आपके पास अपने प्रतिगमन की संभावना होती है तो अब प्रयोग करने योग्य अनुमानक या परीक्षण आँकड़े नहीं होते हैं।
इवान

1
मैं @gung से सहमत हूं, और इस बात पर जोर देना चाहूंगा कि एक पूर्ण उत्तर " किस उद्देश्य के लिए उपयोग करने योग्य " होगा? उपर्युक्त उत्तरों में से कई इस सवाल से बहुत अच्छे से निपटते हैं।
मैथ्यू ड्र्यू

@ मैथ्यू मुझे लगता है कि यह पोस्ट इस सवाल का जवाब देने की कोशिश करता है कि "वास्तविक दुनिया में इसका क्या मतलब है?" स्पष्टीकरण को देख कर अच्छा लगेगा कि लोग इसे बेहतर तरीके से सराह सकें।
whuber

@ जब तक मैं नहीं जानता, यह इतना छोटा है कि मैं वास्तव में नहीं बता सकता। लेकिन मैं सोच रहा था, उदाहरण के लिए, कि अनुमानित मॉडल भविष्यवाणी (या सिर्फ एसोसिएशन) के लिए उपयोगी हो सकता है, भले ही आपके पास एंडोजेनिटी हो, इसलिए "अब कोई उपयोगी अनुमान नहीं है" स्पष्टीकरण के बिना गलत लगता है।
मैथ्यू ड्र्यू

जवाबों:


69

जॉनरोस का जवाब बहुत अच्छा है। सादे अंग्रेजी में, एंडोजेनिटी का मतलब है कि आपको कारण गलत मिला है। यह कि आपने जो मॉडल लिखा और अनुमान लगाया, वह वास्तविक दुनिया में कार्य करने के तरीके पर ठीक से कब्जा नहीं करता है। जब आप लिखते हैं:

Yi=β0+β1Xi+ϵi

आप कई तरीकों से इस समीकरण के बारे में सोच सकते हैं। आप इसे के मूल्यों के आधार पर की भविष्यवाणी करने का एक सुविधाजनक तरीका मान सकते हैं। आप इसे मॉडलिंग के सुविधाजनक तरीके के रूप में सोच सकते थे । इन मामलों में से किसी में भी एंडोजेनिटी जैसी कोई चीज नहीं है, और आपको इसके बारे में चिंता करने की आवश्यकता नहीं है।X E { Y | X }YXE{Y|X}

हालाँकि, आप समीकरण को मूर्त रूप भी दे सकते हैं। आप प्रश्न के उत्तर के रूप में बारे में सोच सकते हैं : " यदि मैं इस प्रणाली में पहुंच गया और को प्रयोगात्मक रूप से 1 से बढ़ा दिया तो क्या होगा ?" यदि आप इसके बारे में इस तरह से सोचना चाहते हैं, तो अनुमान लगाने के लिए OLS का उपयोग करके यह मान लिया जाता है कि: Y एक्सβ1YX

  1. वाईX कारण बनता हैY
  2. ϵ कारण बनता हैY
  3. एक्सϵ कारण नहीं बनता हैX
  4. एक्सY , कारण नहीं बनता हैX
  5. कुछ भी नहीं जिसके कारण भी कारण बनता हैएक्सϵX

3-5 में से किसी एक की विफलता आमतौर पर , या, काफी समकक्ष नहीं, । वाद्य चर इस तथ्य के लिए सही करने का एक तरीका है कि आपको कारण गलत मिला (एक और, अलग, कारण धारणा बनाकर)। एक पूरी तरह से संचालित यादृच्छिक नियंत्रित परीक्षण 3-5 को सही होने के लिए मजबूर करने का एक तरीका है। यदि आप बेतरतीब ढंग से उठाते हैं , तो यह निश्चित रूप से , , या किसी अन्य चीज़ के कारण नहीं है। तथाकथित "प्राकृतिक प्रयोग" विधियां दुनिया में विशेष परिस्थितियों को खोजने का प्रयास करती हैं जहां 3-5 सच हैं, जबकि हम यह नहीं सोचते कि 3-5 आमतौर पर सच होते हैं।सी वी ( एक्स , ε ) 0 एक्स वाई εE{ϵ|X}0Cov(X,ϵ)0XYϵ

जॉनरोस के उदाहरण में, शिक्षा के मजदूरी मूल्य की गणना करने के लिए, आपको कारण की व्याख्या की आवश्यकता है , लेकिन यह मानने के अच्छे कारण हैं कि 3 या 5 गलत है।β1

आपका भ्रम समझ में आता है, हालांकि। यह प्रशिक्षक के लिए पाठ्यक्रम में बहुत विशिष्ट है, प्रशिक्षक के लिए के कारण की व्याख्या का उपयोग करने के लिए। मैंने उपर्युक्त दिए गए कार्य का परिचय नहीं होने का बहाना करते हुए कहा, "यह सब सिर्फ आँकड़े हैं।" यह एक कायरतापूर्ण झूठ है, लेकिन यह भी बहुत आम है। β1

वास्तव में, यह बायोमेडिसिन और सामाजिक विज्ञान में एक बड़ी घटना का हिस्सा है। यह लगभग हमेशा मामला है कि हम पर के कारण के प्रभाव को निर्धारित करने की कोशिश कर रहे हैं --- यही विज्ञान आखिरकार क्या है। दूसरी ओर, यह भी लगभग हमेशा ही होता है कि कुछ कहानी है जो आप किसी निष्कर्ष पर पहुंचा सकते हैं कि 3-5 में से एक झूठी है। तो, एक प्रकार का अभ्यास, तरल, साम्यहीन बेईमानी है जिसमें हम यह कहकर आपत्तियों को दूर कर देते हैं कि हम सिर्फ काम कर रहे हैं और फिर कारण व्याख्या को कहीं और (सामान्य रूप से कागज के परिचय और निष्कर्ष वर्गों में) छींकें।वाईXY

यदि आप वास्तव में रुचि रखते हैं, तो पढ़ने वाला लड़का यहूदिया पर्ल है। जेम्स हेकमैन भी अच्छे हैं।


5
+1 महान व्याख्या और टिप्पणी। हमारी साइट पर आपका स्वागत है!।
whuber

2
क्या आप बता सकते हैं कि इस मुद्दे पर एक बुनियादी और ठोस समझ हासिल करने के लिए, हेकेमैन किस काम की सिफारिश करेंगे?
केनी एलजे

मेरे पास एक सवाल है: कैसे जाए कि क्या या सही है "अपने डेटा का उपयोग अपने हाथ (अपने डोमेन ज्ञान के बजाय) जो प्रयोग से नहीं हो सकता है, अर्थात , अवलोकन डेटा सेट ”? मुझे लगता है कि या का परीक्षण करने का कोई तरीका नहीं है , केवल डेटा का उपयोग करें, क्योंकि देखने योग्य नहीं है, तो क्या यह सच है कि डेटा का उपयोग करते हुए एंडोजेनिटी का परीक्षण नहीं किया जा सकता है? E[ϵ|X]=0E[ϵX]=0E[ϵ|X]=0E[ϵX]=0ϵ
केविनकिम

1
@KevinKim हाँ। आँकड़ों का उपयोग कर परीक्षण करने योग्य नहीं है। एक अनुमान लगाने और फिर अवशिष्ट बनाने के अलावा बरामद / अनुमानित नहीं किया जा सकता है। वसूली केवल एक अनुमान के बाद की जा सकती है। यदि अनुमान सही ढंग से किया गया हो तो रिकवरी केवल सही है। यदि तो अनुमान केवल सही तरीके से किया जाता है । तो, परिपत्र। की जानकारी मूल, गैर-सांख्यिकीय ज्ञान से आनी चाहिए। इसका एक उदाहरण है कि जहां OLS अवशिष्ट हैं। यह सच है कि क्या । ε { ε | X } = 0 E { ϵ | एक्स } = 0 सी वी { एक्स , } = 0 { ε | एक्स } = 0E{ϵ|X}=0ϵE{ϵ|X}=0E{ϵ|X}=0Cov{X,e}=0eE{ϵ|X}=0
बिल

2
@KevinKim यह सही है। और यह सिर्फ रैखिक मॉडल नहीं है। यह सभी आँकड़ों की है। ध्यान दें, जब कोई कहता है कि "सहसंबंध कार्य-कारण नहीं है" तो वे कभी नहीं, कभी भी आपको बताते हैं कि कार्य-कारण क्या है । कारण सिद्धांत है और केवल सिद्धांत हो सकता है। यहां तक ​​कि एक पूरी तरह से (पूरी तरह से --- और इस तरह कभी नहीं --- आयोजित) आरसीटी आपको सिद्धांत के बिना कारण नहीं बताता है।
बिल

18

मुझे एक उदाहरण का उपयोग करने दें:

कहते हैं कि आप आय पर शिक्षा के (कारण) प्रभाव की मात्रा निर्धारित करना चाहते हैं। आप शिक्षा वर्ष और आय डेटा लेते हैं और एक को दूसरे के खिलाफ पुनः प्राप्त करते हैं। क्या आप जो चाहते थे वह ठीक हो गया? शायद ऩही! ऐसा इसलिए है क्योंकि आय भी शिक्षा के अलावा अन्य चीजों के कारण होती है, लेकिन जो शिक्षा से संबंधित हैं। चलो उन्हें "कौशल" कहते हैं: हम सुरक्षित रूप से मान सकते हैं कि शिक्षा वर्ष "कौशल" से प्रभावित होते हैं, आप जितने कुशल होंगे, शिक्षा हासिल करना उतना ही आसान होगा। इसलिए, यदि आप आय पर शिक्षा के वर्षों को फिर से प्राप्त करते हैं, तो शिक्षा प्रभाव के लिए अनुमानक "कौशल" के प्रभाव को अवशोषित करता है और आपको शिक्षा पर लौटने का एक अत्यधिक आशावादी अनुमान मिलता है। यह कहना है, शिक्षा का आय पर प्रभाव (ऊपर की ओर) पक्षपातपूर्ण है क्योंकि शिक्षा आय के प्रति बहिष्कृत नहीं है।

यदि आप कारण संबंधी प्रभावों (मात्र सहसंबंधों के विपरीत) को पुनर्प्राप्त करना चाहते हैं, तो समरूपता केवल एक समस्या है । इसके अलावा- यदि आप कोई प्रयोग डिज़ाइन कर सकते हैं, तो आप यह गारंटी दे सकते हैं कि यादृच्छिक असाइनमेंट द्वारा। अफसोस की बात है, यह आमतौर पर सामाजिक विज्ञान में असंभव है।Cov(X,ϵ)=0


1
उदाहरण और स्पष्टीकरण के लिए धन्यवाद। मैं अब भी इस बात को लेकर थोड़ा अड़ियल हूं कि सादी अंग्रेजी में एंडोगेनेसी और एग्जॉहिटी का क्या मतलब है। वास्तव में मेरा क्या मतलब है जब मैं कहता हूं कि एक चर अंतर्जात या उस मामले के लिए बहिर्जात है।
user25901

@ जॉनरोस आपने लिखा है "एंडोजेनिटी केवल एक समस्या है यदि आप कारण प्रभाव को पुनर्प्राप्त करना चाहते हैं" तो यह मुझे लगता है कि यह भी कहना संभव है कि: "अतिशयोक्ति का अर्थ उद्दंडता है" ... मैंने उस वाक्यांश को कभी नहीं पढ़ा ... हालांकि इसका अधिकार है? यदि यह सही है, तो मुझे लगता है कि कई पाठ्यपुस्तक, कभी-कभी अंतर्निहित रूप से, सामान्य लक्ष्य के रूप में कारण अनुमान लगाते हैं।
मार्कोवित जूल

@markowitz: जब भी आप प्रतिगमन गुणांक पर जिक्र कर रहे हैं, यह निहित है कि आप कारण चाहते हैं। यदि आप केवल पूर्वानुमान चाहते हैं, तो गुणांक का मूल्य वास्तव में मायने नहीं रखता है, बशर्ते कि पूर्वानुमान अच्छे हों। यह सच है कि शास्त्रीय पाठ्यपुस्तकों में यह अंतर नहीं है क्योंकि भविष्यवाणी के कार्य से पहले "बुनियादी विज्ञान" नहीं है, बल्कि अधिक "इंजीनियरिंग" (और मुझे इस कच्चे सामान्यीकरण के लिए क्षमा करें)
जॉनरोस

धन्यवाद जॉनरोस, मुझे संबंधित बिंदु के बारे में एक और सवाल पूछना चाहिए। गुणांक के पक्षपाती आकलन की समस्या केवल कारण प्रतिगमन मॉडल में समझ में आता है जबकि भविष्यवाणी लक्ष्यों के लिए निश्चित रूप से नहीं है। यह सही है? मैं यह पूछता हूं क्योंकि यह बिंदु किसी भी स्थान पर स्पष्ट नहीं है।
markowitz

8

User25901 एक सीधे-सरल, वास्तविक-विश्व स्पष्टीकरण की तलाश कर रहा है कि बहिर्जात और अंतर्जात का क्या अर्थ है। रहस्यमय उदाहरणों या गणितीय परिभाषाओं के साथ जवाब देना वास्तव में उस प्रश्न का उत्तर नहीं देता है जो पूछा गया था।

मुझे इन दोनों शब्दों की समझ कैसे मिल सकती है?

यहाँ मैं क्या लेकर आया हूँ:

एक्सो - बाहरी, एंडो के बाहर - आंतरिक, अंदर - अंदर उत्पन्न

बहिर्जात: एक चर एक मॉडल के लिए बाहरी है अगर यह मॉडल में अन्य मापदंडों और चर द्वारा निर्धारित नहीं है, लेकिन बाहरी रूप से सेट किया गया है और इसके लिए कोई भी परिवर्तन बाहरी बलों से आते हैं।

अंतर्जात: एक चर एक मॉडल में अंतर्जात है अगर यह एक मॉडल में अन्य मापदंडों और चर का कम से कम आंशिक रूप से कार्य करता है।


7
ये उचित सहज ज्ञान युक्त परिभाषाएं हैं, लेकिन अन्य उत्तरों के बारे में इतना ध्यान रखने की आवश्यकता नहीं है।
गूँग - मोनिका

3
व्युत्पत्ति के लिए अपील करना यह याद रखने के लिए एक उपयोगी हैंडल दे सकता है कि तकनीकी शब्दों का क्या मतलब है (यह मेरे लिए अच्छी तरह से काम करता है), लेकिन उन्हें सही ठहराने के लिए व्युत्पत्ति का उपयोग करना है। काफी कुछ (आंकड़ों और अन्य जगहों पर) ठीक से केवल उनकी गणितीय परिभाषाओं के सावधानीपूर्वक अध्ययन के माध्यम से समझा जाता है। इस उत्तर को समझने के लिए शब्दों और वाक्यांशों के इच्छित उपयोगों की स्पष्ट अवधारणा की आवश्यकता होती है, जैसे "निर्धारित," "बाहरी रूप से सेट," "परिवर्तन," "बाहरी बल," और "आंशिक रूप से [एक] फ़ंक्शन," जिनमें से कोई भी तुरंत नहीं होता है। स्पष्ट या असंदिग्ध।
whuber

6

Xϵ=0Xϵ^=0

Y=α+βX+γZ+noiseZXXnoise0ZXlog(ex)=x। यह सिर्फ एक गणितीय तथ्य है। यह लोप वैरिएबल पूर्वाग्रह है।

IYXIXXY

यह दो चरण कम से कम वर्ग है, जो लगभग IV के समान है।


जैसा कि मैं समझता हूँ कि IVSL करने के लिए 2SLS नहीं है, अगर मुझसे गलती हुई है तो माफी माँगता हूँ।
user25901

2SLS मानक त्रुटियां गलत हैं। मैं भूल जाता हूं कि क्यों या कैसे, लेकिन आपको शायद कुछ मिल जाएगा यदि आप "IV 2SLS मानक त्रुटियां" Google करते हैं। अधिकांश सॉफ्टवेयर पैकेज 2sls को हल (t (z)% *% (x)% *% t (z)% *% y विधि के साथ लागू करते हैं
जेनेरिक_युसर

1
X^X

धन्यवाद। जब मैंने यह लिखा था तो मैं लागू अर्थमिति से बाहर था।
जेनेरिक_युसर

-1

प्रतिगमन में हम एक पहचाने गए आश्रित चर पर एक स्वतंत्र चर के मात्रात्मक प्रभाव (जो हम मानते हैं कि बहिर्जात है और खुद कुछ और पर निर्भर नहीं है) पर कब्जा करना चाहते हैं। हम जानना चाहते हैं कि एक बाहरी चर पर एक बाहरी चर का क्या शुद्ध प्रभाव होता है- मतलब स्वतंत्र चर दूसरे चर से किसी भी प्रभाव से मुक्त होना चाहिए। यह देखने का एक त्वरित तरीका है कि क्या प्रतिगमन एंडोजेनिटी की समस्या से पीड़ित है, स्वतंत्र चर और अवशिष्ट के बीच सहसंबंध की जांच करना है। लेकिन यह सिर्फ एक मोटा जाँच है अन्यथा एंडोजेनिटी के औपचारिक परीक्षण किए जाने की आवश्यकता है।


3
यह सच नहीं है। अवशिष्ट और एक प्रतिगमन से व्याख्यात्मक चर के बीच संबंध निर्माण द्वारा शून्य है। यह एंडोजेनिटी के लिए एक परीक्षण नहीं है।
एंडी

E[ϵX]=0ϵy=b0+b1x+ϵϵE[e^i|x]=0e^iE[e^i|x]=0b^0+b^1x
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.