यदि और दोनों को प्रभावित करने वाले छोड़े गए चर हैं तो पर का एक प्रतिगमन कारण नहीं हो सकता है । लेकिन नहीं छोड़ा गया चर और माप त्रुटि के लिए, एक प्रतिगमन कारण है? यही है, अगर हर संभव चर प्रतिगमन में शामिल है?
यदि और दोनों को प्रभावित करने वाले छोड़े गए चर हैं तो पर का एक प्रतिगमन कारण नहीं हो सकता है । लेकिन नहीं छोड़ा गया चर और माप त्रुटि के लिए, एक प्रतिगमन कारण है? यही है, अगर हर संभव चर प्रतिगमन में शामिल है?
जवाबों:
नहीं, यह नहीं है, मैं आपको कुछ प्रतिरूप दिखाऊंगा।
पहला उल्टा कार्य है । कारण पर विचार करें मॉडल , जहां और मानक गाऊसी यादृच्छिक चर हैं। तब , क्योंकि कारण नहीं है , लेकिन पर निर्भर करेगा ।
दूसरा उदाहरण कोलाडर के लिए नियंत्रित है ( यहां देखें )। कारण मॉडल पर विचार करें , जो कारण नहीं है और एक सामान्य कारण है। लेकिन ध्यान दें, यदि आप सहित एक प्रतिगमन चलाते हैं, तो का प्रतिगमन गुणांक शून्य नहीं होगा, क्योंकि सामान्य कारण पर कंडीशनिंग और बीच जुड़ाव को प्रेरित करेगा (आप यहां देखना चाह सकते हैं और साथ ही पथ विश्लेषण में मौजूद है। एक वातानुकूलित-कोलाइडर )।
अधिक आम तौर पर, पर का प्रतिगमन कारण होगा यदि प्रतिगमन में शामिल चर पिछले दरवाजे मानदंड को पूरा करते हैं ।
इस सवाल के कार्लोस सिनेली के महत्वपूर्ण जवाब के अलावा, कुछ और कारण हैं कि प्रतिगमन गुणांक कारण नहीं हो सकता है।
सबसे पहले, मॉडल प्रक्षेपीकरण मापदंडों को गैर-कारण हो सकता है। सिर्फ इसलिए कि आपके मॉडल में सभी प्रासंगिक चर हैं इसका मतलब यह नहीं है कि आपने उनके लिए सही तरीके से समायोजित किया है। एक बहुत ही सरल उदाहरण के रूप में, एक चर पर विचार कि सममित आसपास 0. मान लीजिए कि आपके परिणाम चर वितरित किया जाता है से प्रभावित होता है इस तरह से कि में । Regressing पर (के रूप में प्रदर्शित होने के बजाय ) तो के लिए एक अनुमान के अनुसार गुणांक दे देंगे होगा , के बावजूद आप सभी को प्रभावित करता है (केवल) चर के लिए समायोजित करने के बाद स्पष्ट रूप से पक्षपाती 0 के बारे में, के ।
दूसरे, और रिवर्स एक्टीविटी के विषय से संबंधित, यह भी जोखिम है कि आपके पास चयन पूर्वाग्रह हो सकते हैं , यानी कि आपका नमूना इस तरह से चुना गया है कि यह उस आबादी के लिए प्रतिनिधि नहीं है जिसके लिए आप अपना निष्कर्ष निकालना चाहते हैं। इसके अलावा, लापता डेटा भी पूर्वाग्रह का परिचय दे सकता है यदि डेटा पूरी तरह से यादृच्छिक पर गायब नहीं है।