कारण सिद्धांत एक और स्पष्टीकरण प्रदान करता है कि कैसे दो चर बिना शर्त स्वतंत्र रूप से अभी तक सशर्त रूप से निर्भर हो सकते हैं। मैं कार्य-कारण के सिद्धांत का विशेषज्ञ नहीं हूं और किसी भी आलोचना के लिए आभारी हूं जो नीचे किसी भी गलतफहमी को सही करेगा।
समझाने के लिए, मैं निर्देशित एसाइक्लिक ग्राफ (DAG) का उपयोग करूँगा । इन ग्राफ़ में, चर ( − ) चर के बीच प्रत्यक्ष कारण संबंधों का प्रतिनिधित्व करते हैं। एरो हेड्स ( ← या → ) कारण संबंधों की दिशा का संकेत देते हैं। इस प्रकार A→B उल्लंघन होता है कि A सीधे B , और A ers B का कारण बनता हैA←B infers कि A सीधे के कारण होता है B । A→B→C एक कारण मार्ग है जो A बात को संक्रमित करता है कि A अप्रत्यक्ष रूप से B के माध्यम से C कारण बनता हैB। सादगी के लिए, मान लें कि सभी कारण संबंध रैखिक हैं।
सबसे पहले, का एक सरल उदाहरण पर विचार confounder पूर्वाग्रह :
यहां, एक सरल द्विअर्थी प्रतिगमन X और Y बीच एक निर्भरता का सुझाव देगा । हालांकि, X और Y बीच कोई सीधा कारण संबंध नहीं है । इसके बजाय दोनों सीधे Z कारण होते हैं , और साधारण द्विभाजन प्रतिगमन में, देख रहे हैंZX औरY बीच एक निर्भरता को प्रेरित करता है, जिसके परिणामस्वरूपभ्रम पैदा होता है। हालांकि,Z पर एक बहुपरत प्रतिगमन कंडीशनिंगपूर्वाग्रह को हटा देगा औरX औरY बीच कोई निर्भरता नहीं होने का सुझाव देगा।
दूसरा, कोलाइडर पूर्वाग्रह (जिसे बर्कसन के पूर्वाग्रह या बर्कसियन पूर्वाग्रह के रूप में भी जाना जाता है, जिसमें से चयन पूर्वाग्रह एक विशेष प्रकार है) पर विचार करें:
यहां, एक सरल द्विअर्थी प्रतिगमन X और Y बीच कोई निर्भरता नहीं सुझाएगा । यह डीएजी से सहमत है, जो X और Y बीच कोई सीधा कारण नहीं है । हालांकि, Z पर एक बहुक्रियाशील प्रतिगमन कंडीशनिंग X और Y बीच एक निर्भरता को प्रेरित करेगा जो यह सुझाव देगा कि दो चर के बीच एक सीधा कारण संबंध मौजूद हो सकता है, जब वास्तव में कोई भी मौजूद नहीं है। मल्टीवर्सिबल रिग्रेशन में Z समावेश से कोलाइडर पूर्वाग्रह होता है।
तीसरा, आकस्मिक रद्दीकरण के एक उदाहरण पर विचार करें:
आइए हम मान लेते हैं कि α , β , और γ पथ गुणांक और है कि कर रहे हैं β=−αγ । एक साधारण द्विअर्थी प्रतिगमन X और Y बीच कोई प्रतिरूपण का सुझाव नहीं देगा । हालाँकि X वास्तव में Y का प्रत्यक्ष कारण है , X और Y पर Z का परस्पर प्रभावXY संयोग के प्रभाव बाहर रद्द X पर Y । Z पर एक बहुक्रियाशील प्रतिगमन कंडीशनिंग, X और पर Z के परस्पर प्रभाव को हटा देगाXY ,X परY के प्रत्यक्ष प्रभाव के आकलन के लिए अनुमति देता है,कारण मॉडल का DAG सही है।
संक्षेप में:
कन्फ़्यूडर का उदाहरण: X और Y बीवरेबल रिग्रेशन में निर्भर हैं और कन्फ़्यूडर Z पर मल्टीवार्जेबल रिग्रेशन कंडीशनिंग में स्वतंत्र हैं ।
कोलाइडर उदाहरण: X और Y द्विविभाजन प्रतिगमन में स्वतंत्र हैं और कोलेडर Z पर बहुक्रियाशील प्रतिगमन कंडीशनिंग में निर्भर हैं ।
अंतर्विरोधी रद्दीकरण उदाहरण: X और Y द्विअर्थी प्रतिगमन में स्वतंत्र होते हैं और कन्फ़ाउंडर Z पर बहुआयामी प्रतिगामी कंडीशनिंग में निर्भर होते हैं ।
चर्चा:
आपके विश्लेषण के परिणाम कंफ़्यूडर उदाहरण के साथ संगत नहीं हैं, लेकिन दोनों कोलाइडर उदाहरण और आकस्मिक रद्द उदाहरण के साथ संगत हैं। इस प्रकार, एक संभावित व्याख्या यह है कि आपने अपने बहुविकल्पी प्रतिगमन में एक कोलाइडर चर पर गलत रूप से वातानुकूलित किया है और X और Y बीच एक जुड़ाव को प्रेरित किया है, भले ही Xवाई का कारण नहीं है।Y और Y का एक कारण नहीं है X । वैकल्पिक रूप से, आप अपने बहुविकल्पी प्रतिगमन में एक कन्फ्यूडर पर सही ढंग से वातानुकूलित हो सकते हैं जो आपके बीवरिबल रिग्रेशन में वाई पर X के वास्तविक प्रभाव को गलती से रद्द कर रहा था ।Y
मैं कारण ज्ञान मॉडल का निर्माण करने के लिए पृष्ठभूमि ज्ञान का उपयोग करने में मदद करता हूं जब यह विचार करता हूं कि सांख्यिकीय मॉडल में कौन से चर शामिल हैं। उदाहरण के लिए, यदि पिछले उच्च-गुणवत्ता वाले यादृच्छिक अध्ययनों ने निष्कर्ष निकाला है कि XZ कारण बनता है और YZ कारण बनता है , तो मैं एक मजबूत धारणा बना सकता हूं कि Z , X और Y का कोलाइडर है और सांख्यिकीय मॉडल में इस पर कोई शर्त नहीं लगाता है । हालांकि, अगर मुझे केवल एक अंतर्ज्ञान था कि XZ कारण बनता है , और YZ कारण बनता है , लेकिन मेरे अंतर्ज्ञान का समर्थन करने के लिए कोई मजबूत वैज्ञानिक सबूत नहीं है, तो मैं केवल एक कमजोर धारणा बना सकता हूं कि ZX और Y का एक कोलाइडर है , क्योंकि मानव अंतर्ज्ञान में गुमराह होने का इतिहास है। इसके बाद, मैं Z के साथ उनके कार्य संबंधों के आगे की जांच के बिना X और Y बीच कारणपरक संबंधों पर संदेह करूंगा । पृष्ठभूमि ज्ञान के अलावा या इसके अलावा, एसोसिएशन के परीक्षणों की एक श्रृंखला (जैसे पीसी एल्गोरिथ्म और FCI एल्गोरिथ्म, जावा कार्यान्वयन के लिए TETRAD देखें , PCalgZआर कार्यान्वयन के लिए)। ये एल्गोरिदम बहुत दिलचस्प हैं, लेकिन मैं कारण सिद्धांत में शक्ति और कारण केलकुलस और कारण मॉडल की सीमाओं की मजबूत समझ के बिना उन पर भरोसा नहीं करना चाहूंगा।
निष्कर्ष:
कारण के मॉडल का विवेचन, अन्वेषक को अन्य उत्तरों में चर्चा किए गए सांख्यिकीय विचारों को संबोधित करने से नहीं रोकता है। हालांकि, मुझे लगता है कि कारण मॉडल तब भी एक उपयोगी ढांचा प्रदान कर सकते हैं, जब सांख्यिकीय मॉडल में मनाया सांख्यिकीय निर्भरता और स्वतंत्रता के लिए संभावित स्पष्टीकरण के बारे में सोच रहे हैं, खासकर जब संभावित confounders और colliders की कल्पना।
आगे की पढाई:
गेलमैन, एंड्रयू। 2011. " कारण और सांख्यिकीय शिक्षा ।" Am। जे। समाजशास्त्र 117 (3) (नवंबर): 955–966।
ग्रीनलैंड, एस, जे पर्ल, और जेएम रॉबिन्स। 1999. " महामारी विज्ञान के लिए कोशिक आरेख ।" महामारी विज्ञान (कैम्ब्रिज, मास।) 10 (1) (जनवरी): 37-48।
ग्रीनलैंड, सैंडर। 2003. " कोसल मॉडल्स में क्वांटिफाइंग बायसेस: क्लासिकल कन्फाउंडिंग बनाम कोलाइडर-स्तरीकरण बायस ।" महामारी विज्ञान 14 (3) (1 मई): 300–306।
पर्ल, जुडिया। 1998. कॉन्फाउंडिंग के लिए कोई सांख्यिकीय परीक्षण क्यों नहीं है, क्यों कई विचार हैं, और क्यों वे लगभग सही हैं ।
पर्ल, जुडिया। 2009. कारण: मॉडल, तर्क और अंतर्ज्ञान । दूसरा संस्करण। कैम्ब्रिज यूनिवर्सिटी प्रेस।
स्पिरिट्स, पीटर, क्लार्क ग्लाइमोर और रिचर्ड स्हीनेन्स। 2001. कारण, भविष्यवाणी और खोज , दूसरा संस्करण। एक ब्रैडफोर्ड पुस्तक।
अद्यतन करें: यहूदिया पर्ल ने अमस्ट न्यूज़ के नवंबर 2012 के संस्करण में कार्य- कारण निष्कर्ष के सिद्धांत और परिचयात्मक आँकड़ों के पाठ्यक्रम में समावेश को शामिल करने की आवश्यकता पर चर्चा की । उनका ट्यूरिंग अवार्ड लेक्चर , जिसका शीर्षक है "द मेकेनाइजेशन ऑफ एज़ल इन्वेंशन: ए 'मिनी' ट्यूरिंग टेस्ट एंड परे" भी रुचि का है।