यदि कोई लोप किए गए चर नहीं हैं तो क्या एक प्रतिगमन कारण है?


13

यदि और दोनों को प्रभावित करने वाले छोड़े गए चर हैं तो पर का एक प्रतिगमन कारण नहीं हो सकता है । लेकिन नहीं छोड़ा गया चर और माप त्रुटि के लिए, एक प्रतिगमन कारण है? यही है, अगर हर संभव चर प्रतिगमन में शामिल है?yxxy


4
नहीं, भले ही आपने दुनिया के हर चर को शामिल किया हो, लेकिन इसका उलटा कारण हो सकता है। उदाहरण के लिए, किसी ग्रह की अपने निकटतम तारे से निकटता का सटीक अनुमान ग्रह के सतह के तापमान से लगाया जा सकता है, लेकिन स्पष्ट रूप से कार्य-कारण दूसरे तरीके से होता है
gazza89

@ gazza89 - चूँकि यह प्रभावी रूप से प्रश्न का उत्तर देता है, आप इसे उत्तर में विस्तारित करना चाह सकते हैं।
जूलमैन

3
"छोड़े गए चर" क्या है? मान लीजिए कि मेरे डेटासेट में एक Y और 4 Xs हैं। मैं सभी 4 एक्स सहित एक मॉडल फिट करता हूं। तब मेरे पास कोई छोड़े गए चर नहीं हैं?
user158565

जवाबों:


20

नहीं, यह नहीं है, मैं आपको कुछ प्रतिरूप दिखाऊंगा।

पहला उल्टा कार्य है । कारण पर विचार करें मॉडल , जहां और मानक गाऊसी यादृच्छिक चर हैं। तब , क्योंकि कारण नहीं है , लेकिन पर निर्भर करेगा ।YXXYE[Y|do(x)]=0XYE[Y|x]X

दूसरा उदाहरण कोलाडर के लिए नियंत्रित है ( यहां देखें )। कारण मॉडल पर विचार करें , जो कारण नहीं है और एक सामान्य कारण है। लेकिन ध्यान दें, यदि आप सहित एक प्रतिगमन चलाते हैं, तो का प्रतिगमन गुणांक शून्य नहीं होगा, क्योंकि सामान्य कारण पर कंडीशनिंग और बीच जुड़ाव को प्रेरित करेगा (आप यहां देखना चाह सकते हैं और साथ ही पथ विश्लेषण में मौजूद है। एक वातानुकूलित-कोलाइडर )।XZYXYZZXYX

अधिक आम तौर पर, पर का प्रतिगमन कारण होगा यदि प्रतिगमन में शामिल चर पिछले दरवाजे मानदंड को पूरा करते हैंYX


3
अत्यधिक यहूदिया पर्ल द्वारा बुक ऑफ व्हाई की सिफारिश करें। पूरी तरह से बताते हैं कि कार्लोस ने क्या संदर्भित किया है।
मार्कोस काशीओरिस

3
क्या करता है मतलब? do(x)
n

5
@ naught101 इसका मतलब है कि आप वास्तव में X = x को बल देते हैं, निष्क्रिय रूप से X = x को देखने के विपरीत, यहाँ आँकड़े
कार्लोस

धन्यवाद, लेकिन मैं संकेतन पर स्पष्ट नहीं हूं। क्या अर्थ है और कारण बनता है ? क्या बाण उलटे होने चाहिए? XZYZXY
एशा

@ ईशा का अर्थ है कि और दोनों का कारणxyz
कार्लोस सिनेली

6

इस सवाल के कार्लोस सिनेली के महत्वपूर्ण जवाब के अलावा, कुछ और कारण हैं कि प्रतिगमन गुणांक कारण नहीं हो सकता है।

सबसे पहले, मॉडल प्रक्षेपीकरण मापदंडों को गैर-कारण हो सकता है। सिर्फ इसलिए कि आपके मॉडल में सभी प्रासंगिक चर हैं इसका मतलब यह नहीं है कि आपने उनके लिए सही तरीके से समायोजित किया है। एक बहुत ही सरल उदाहरण के रूप में, एक चर पर विचार कि सममित आसपास 0. मान लीजिए कि आपके परिणाम चर वितरित किया जाता है से प्रभावित होता है इस तरह से कि में । Regressing पर (के रूप में प्रदर्शित होने के बजाय ) तो के लिए एक अनुमान के अनुसार गुणांक दे देंगे होगा , के बावजूद आप सभी को प्रभावित करता है (केवल) चर के लिए समायोजित करने के बाद स्पष्ट रूप से पक्षपाती 0 के बारे में, के ।XYXE(YX)=X2YXX2XY

दूसरे, और रिवर्स एक्टीविटी के विषय से संबंधित, यह भी जोखिम है कि आपके पास चयन पूर्वाग्रह हो सकते हैं , यानी कि आपका नमूना इस तरह से चुना गया है कि यह उस आबादी के लिए प्रतिनिधि नहीं है जिसके लिए आप अपना निष्कर्ष निकालना चाहते हैं। इसके अलावा, लापता डेटा भी पूर्वाग्रह का परिचय दे सकता है यदि डेटा पूरी तरह से यादृच्छिक पर गायब नहीं है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.