कार्य-कारण को गणितीय रूप से कैसे परिभाषित किया जाता है?


16

दो यादृच्छिक चर के बीच एक कारण संबंध की गणितीय परिभाषा क्या है?

दो यादृच्छिक चर X और Y के संयुक्त वितरण से एक नमूने को देखते हुए , हम कहेंगे कि XY कारण क्या है?

संदर्भ के लिए, मैं इस पेपर को कारण खोज के बारे में पढ़ रहा हूं


2
जहाँ तक मैं देख सकता हूँ कि कार्य-कारण एक गणितीय अवधारणा नहीं है। आप स्पष्ट करने के लिए संपादित कर सकते हैं?
mdewey

2
@mdewey मैं असहमत हूं। पूरी तरह से औपचारिक रूप में कारणों को भुनाया जा सकता है। उदाहरण देखिए मेरा जवाब।
कोडियालॉजिस्ट

जवाबों:


9

दो यादृच्छिक चर के बीच एक कारण संबंध की गणितीय परिभाषा क्या है?

गणितीय रूप से, एक कारण मॉडल में चर के बीच कार्यात्मक संबंध होते हैं । उदाहरण के लिए, नीचे दिए गए संरचनात्मक समीकरणों की प्रणाली पर विचार करें:

x=fx(ϵx)y=fy(x,ϵy)

इसका मतलब यह है कि x कार्यात्मक रूप से y के मूल्य को निर्धारित करता है (यदि आप x पर हस्तक्षेप करते हैं तो यह y के मूल्यों को बदल देता है ) लेकिन आसपास के अन्य तरीके से नहीं। आलेखीय रूप से, यह आमतौर पर xy द्वारा दर्शाया जाता है , जिसका अर्थ है कि x , y के संरचनात्मक समीकरण में प्रवेश करता है। एक परिशिष्ट के रूप में, आप प्रतिक्रियात्मक चर के संयुक्त वितरण के संदर्भ में एक कारण मॉडल भी व्यक्त कर सकते हैं, जो गणितीय रूप से कार्यात्मक मॉडल के बराबर है

दो यादृच्छिक चर X और Y के संयुक्त वितरण से एक नमूने को देखते हुए, हम कहेंगे कि X, Y का कारण क्या है?

कभी कभी (या समय की सबसे) आप संरचनात्मक समीकरण के आकार के बारे में जानकारी नहीं है fx , fy , और न ही और भी है कि क्या xy या yx । आपके पास एकमात्र जानकारी संयुक्त संभावना वितरण p(y,x) (या इस वितरण से नमूने) है।

यह आपके प्रश्न की ओर जाता है: मैं डेटा से सिर्फ कार्य-कारण की दिशा कब ठीक कर सकता हूं? या, अधिक सटीक रूप से, जब मैं पुनर्प्राप्त कर सकता हूं कि क्या x डेटा के संरचनात्मक समीकरण y या इसके विपरीत में प्रवेश करता है ?

बेशक, कारण मॉडल के बारे में किसी भी मौलिक रूप से अस्थिर मान्यताओं के बिना , यह असंभव है । समस्या यह है कि कई अलग-अलग कारण मॉडल मनाया चर के समान संयुक्त संभावना वितरण को प्राप्त कर सकते हैं। सबसे आम उदाहरण गाऊसी शोर के साथ एक कारण रैखिक प्रणाली है।

लेकिन कुछ कारण मान्यताओं के तहत, यह संभव हो सकता है --- और यही कारण है कि खोज का साहित्य काम करता है। यदि आपके पास इस विषय का कोई पूर्व संपर्क नहीं है, तो आप पीटर्स, जेनिंग और स्कोलॉफ़ द्वारा तत्वों के कारण से शुरू कर सकते हैं , साथ ही यहूदिया पर्ल द्वारा अध्याय 2 के कारण । हमारे पास सीवी पर यहां एक विषय है , कारण खोज पर संदर्भ के लिए , लेकिन हमारे पास अभी तक सूचीबद्ध कई संदर्भ नहीं हैं।

इसलिए, आपके प्रश्न का सिर्फ एक उत्तर नहीं है, क्योंकि यह मान्यताओं पर निर्भर करता है। आप जिस कागज का उल्लेख करते हैं, वह कुछ उदाहरणों का हवाला देता है, जैसे कि गैर-गौसियन शोर के साथ एक रेखीय मॉडल । इस मामले को LINGAN के रूप में जाना जाता है (रैखिक गैर-गाऊसी मॉडल के लिए छोटा), यहाँ एक उदाहरण है R:

library(pcalg)
set.seed(1234)
n <- 500
eps1 <- sign(rnorm(n)) * sqrt(abs(rnorm(n)))
eps2 <- runif(n) - 0.5
x2 <- 3 + eps2
x1 <- 0.9*x2 + 7 + eps1

# runs lingam
X <- cbind(x1, x2)
res <- lingam(X)
as(res, "amat") 

# Adjacency Matrix 'amat' (2 x 2) of type ‘pag’:
#     [,1]  [,2]
# [1,] .     .   
# [2,]  TRUE .     

ध्यान दें कि हमारे पास गैर-गॉसियन शोर के साथ एक रैखिक कारण मॉडल है जहां x2 कारण x1 और लिंगम सही रूप से कारण दिशा को ठीक करता है। हालाँकि, यह नोटिस गंभीर रूप से लिंगम मान्यताओं पर निर्भर करता है

आपके द्वारा उद्धृत पेपर के मामले के लिए, वे इस विशिष्ट धारणा को बनाते हैं (देखें उनका "पोस्ट" "):

यदि xy , तंत्र की न्यूनतम विवरण लंबाई X से Y की मैपिंग X के मान से स्वतंत्र है, जबकि Y से X तक के तंत्र की न्यूनतम विवरण लंबाई Y के मान पर निर्भर है।

ध्यान दें यह एक धारणा है। इसे हम उनकी "पहचान की स्थिति" कहेंगे। अनिवार्य रूप से, डाक वितरण संयुक्त वितरण पी ( एक्स) पर प्रतिबंध लगाता हैp(x,y) । यही है, पोस्टऑउट कहता है कि यदि xy कुछ प्रतिबंध डेटा में हैं, और यदि yx अन्य प्रतिबंध हैं। इस प्रकार के प्रतिबंध जिनके परीक्षण योग्य निहितार्थ हैं ( p(y,x) पर अवरोध लगाते हैं ) जो किसी को प्रत्यक्ष डेटा से प्रत्यक्ष रूप से पुनर्प्राप्त करने की अनुमति देता है।

अंतिम टिप्पणी के रूप में, कारण खोज परिणाम अभी भी बहुत सीमित हैं, और मजबूत मान्यताओं पर निर्भर करते हैं, वास्तविक दुनिया के संदर्भ में इन्हें लागू करते समय सावधान रहें।


1
क्या कोई मौका है कि आप किसी भी तरह से अपने उत्तर को बढ़ाएं ताकि नकली डेटा के साथ कुछ सरल उदाहरण शामिल हों ? उदाहरण के लिए, Causal Inference के कुछ तत्वों को पढ़ा है और पीटर्स के कुछ व्याख्यानों को देखा है, और एक प्रतिगमन रूपरेखा का उपयोग आमतौर पर समस्या को विस्तार से समझने की आवश्यकता को प्रेरित करने के लिए किया जाता है (मैं उनके ICP कार्य पर स्पर्श भी नहीं कर रहा हूं)। मेरे पास (शायद गलत है) धारणा है कि आरसीएम से दूर जाने के प्रयास में, आपके उत्तर सभी वास्तविक मूर्त मॉडलिंग मशीनरी को छोड़ देते हैं।
us --r11852 का कहना है कि 23

1
@ us @r11852 मुझे यकीन नहीं है कि मैं आपके सवालों के संदर्भ को समझता हूं, क्या आप कारण खोज के उदाहरण चाहते हैं? जेन ने जो कागज उपलब्ध कराए हैं, उसमें कई उदाहरण हैं। इसके अलावा, मुझे यकीन नहीं है कि मैं समझता हूं कि "आरसीएम से बचने और वास्तविक मूर्त मॉडलिंग मशीनरी को छोड़ने" से आपका क्या मतलब है, हम यहां खोज के संदर्भ में क्या ठोस मशीनरी को याद कर रहे हैं?
कार्लोस सिनेली

1
भ्रम के लिए माफी, मैं कागजात से उदाहरणों के बारे में परवाह नहीं करता हूं। मैं खुद दूसरे कागजात का हवाला दे सकता हूं। (उदाहरण के लिए, लोपेज़-पाज़ एट अल। उनके तंत्रिका संबंधी गुणांक के बारे में सीवीपीआर 2017) एक साधारण संख्यात्मक उदाहरण के लिए मुझे क्या ध्यान रखना चाहिए नकली डेटा के कि कोई आर (या आपकी पसंदीदा भाषा) में चलता है और देखें कि आपका क्या मतलब है। यदि आप उदाहरण के लिए पीटर्स एट अल का हवाला देते हैं। पुस्तक और उनके पास छोटे कोड स्निपेट हैं जो बेहद मददगार हैं (और कभी-कभी सिर्फ उपयोग करते हैं lm)। हम सभी Tuebingen डेटासेट के आसपास काम नहीं कर सकते क्योंकि अवलोकन संबंधी नमूनों को कारण खोज का विचार मिलता है! :)
us Monr11852 का कहना है कि

1
@ us @r11852 यकीन है, एक नकली उदाहरण सहित तुच्छ है, मैं आर में लिंगम का उपयोग कर एक को शामिल कर सकता हूं। लेकिन क्या आप यह समझाने की परवाह करेंगे कि "आरसीएम से बचने और वास्तविक मूर्त मॉडलिंग मशीनरी छोड़ने" से आपका क्या मतलब है?
कार्लोस सिनेली

2
@ us @r11852 ठीक प्रतिक्रिया के लिए धन्यवाद, मैं उपयुक्त होने पर अधिक कोड शामिल करने का प्रयास करूंगा। अंतिम टिप्पणी के रूप में, कारण खोज परिणाम अभी भी बहुत सीमित हैं, इसलिए संदर्भ के आधार पर इन्हें लागू करते समय लोगों को बहुत सावधान रहने की आवश्यकता है।
कार्लोस सिनेली

4

औपचारिकता संबंधी कार्यवाहियों के लिए कई तरह के दृष्टिकोण हैं (जो कि सदियों से चली आ रही कार्यवाहियों के बारे में पर्याप्त दार्शनिक असहमति के साथ है)। एक लोकप्रिय संभावित परिणामों के संदर्भ में है। रुबिन कारण मॉडल कहलाता है, संभावित परिणाम दृष्टिकोण, यह मानता है कि प्रत्येक कार्य स्थिति के लिए, एक अलग यादृच्छिक चर है। तो, Y1 एक नैदानिक ​​परीक्षण से संभावित परिणामों का यादृच्छिक चर हो सकता है यदि कोई विषय अध्ययन दवा लेता है, और यदि वह प्लेसबो लेता है तो Y2 यादृच्छिक चर हो सकता है। कारण प्रभाव Y1 और Y2 बीच का अंतर है । यदि वास्तव में Y1=Y2 , हम कह सकते हैं कि उपचार का कोई प्रभाव नहीं है। अन्यथा, हम कह सकते हैं कि उपचार की स्थिति परिणाम का कारण बनती है।

चरों के बीच के संबंध को दिशात्मक एसाइकल ग्राफ के साथ भी दर्शाया जा सकता है , जिनका स्वाद बहुत अलग होता है, लेकिन गणितीय रूप से रुबिन मॉडल (वेसमरन, 2004, धारा 17.8) के बराबर होता है।

वासरमैन, एल। (2004)। सांख्यिकी के सभी: सांख्यिकीय निष्कर्ष में एक संक्षिप्त पाठ्यक्रम । न्यूयॉर्क, एनवाई: स्प्रिंगर। आईएसबीएन 978-0-387-40272-7।


धन्यवाद। संयुक्त वितरण से नमूने का एक सेट देने के लिए यह एक परीक्षण क्या होगा?
जेन

3
मैं arxiv.org/abs/1804.04622 पढ़ रहा हूं । मैंने इसके संदर्भ नहीं पढ़े हैं। मैं यह समझने की कोशिश कर रहा हूं कि अवलोकन डेटा के आधार पर कार्य-कारण का क्या मतलब है।
जेन

1
Y1Y2XY

2
(x,y=x3+ϵ)ϵ

2
@ अवलोकन संबंधी मामले के लिए (आपके प्रश्न के लिए), सामान्य तौर पर आप कार्य-कारण की दिशा को विशुद्ध रूप से गणितीय रूप से कम से कम, दो चर मामले के लिए नहीं समझ सकते हैं। अतिरिक्त (अप्राप्य) मान्यताओं के तहत अधिक चर के लिए, आप एक दावा कर सकते हैं, लेकिन निष्कर्ष अभी भी पूछताछ की जा सकती है। टिप्पणियों में यह चर्चा बहुत लंबी है। :)
विमल

0

XY

  1. XY

एक हस्तक्षेप एक परिवर्तनशील परिवर्तन है जो एक चर पर निर्भर करता है जो चर को प्रभावित नहीं करता है। संरचनात्मक समीकरणों और कारण ग्राफिकल मॉडल में हस्तक्षेप को कड़ाई से औपचारिक रूप दिया गया है, लेकिन जहां तक ​​मुझे पता है, कोई परिभाषा नहीं है जो एक विशेष मॉडल वर्ग से स्वतंत्र है।

  1. YX

XY

कार्य-कारण के लिए आधुनिक दृष्टिकोणों में, हस्तक्षेप को आदिम वस्तु के रूप में लिया जाता है जो कार्य-संबंधों को परिभाषित करता है (परिभाषा 1)। मेरी राय में, हालांकि, हस्तक्षेप सिमुलेशन का एक प्रतिबिंब है, और जरूरी सिमुलेशन सिमुलेशन के अनुरूप है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.