दो यादृच्छिक चर के बीच एक कारण संबंध की गणितीय परिभाषा क्या है?
दो यादृच्छिक चर और के संयुक्त वितरण से एक नमूने को देखते हुए , हम कहेंगे कि कारण क्या है?
संदर्भ के लिए, मैं इस पेपर को कारण खोज के बारे में पढ़ रहा हूं ।
दो यादृच्छिक चर के बीच एक कारण संबंध की गणितीय परिभाषा क्या है?
दो यादृच्छिक चर और के संयुक्त वितरण से एक नमूने को देखते हुए , हम कहेंगे कि कारण क्या है?
संदर्भ के लिए, मैं इस पेपर को कारण खोज के बारे में पढ़ रहा हूं ।
जवाबों:
दो यादृच्छिक चर के बीच एक कारण संबंध की गणितीय परिभाषा क्या है?
गणितीय रूप से, एक कारण मॉडल में चर के बीच कार्यात्मक संबंध होते हैं । उदाहरण के लिए, नीचे दिए गए संरचनात्मक समीकरणों की प्रणाली पर विचार करें:
इसका मतलब यह है कि कार्यात्मक रूप से के मूल्य को निर्धारित करता है (यदि आप पर हस्तक्षेप करते हैं तो यह के मूल्यों को बदल देता है ) लेकिन आसपास के अन्य तरीके से नहीं। आलेखीय रूप से, यह आमतौर पर द्वारा दर्शाया जाता है , जिसका अर्थ है कि , y के संरचनात्मक समीकरण में प्रवेश करता है। एक परिशिष्ट के रूप में, आप प्रतिक्रियात्मक चर के संयुक्त वितरण के संदर्भ में एक कारण मॉडल भी व्यक्त कर सकते हैं, जो गणितीय रूप से कार्यात्मक मॉडल के बराबर है ।
दो यादृच्छिक चर X और Y के संयुक्त वितरण से एक नमूने को देखते हुए, हम कहेंगे कि X, Y का कारण क्या है?
कभी कभी (या समय की सबसे) आप संरचनात्मक समीकरण के आकार के बारे में जानकारी नहीं है , , और न ही और भी है कि क्या या । आपके पास एकमात्र जानकारी संयुक्त संभावना वितरण (या इस वितरण से नमूने) है।
यह आपके प्रश्न की ओर जाता है: मैं डेटा से सिर्फ कार्य-कारण की दिशा कब ठीक कर सकता हूं? या, अधिक सटीक रूप से, जब मैं पुनर्प्राप्त कर सकता हूं कि क्या डेटा के संरचनात्मक समीकरण या इसके विपरीत में प्रवेश करता है ?
बेशक, कारण मॉडल के बारे में किसी भी मौलिक रूप से अस्थिर मान्यताओं के बिना , यह असंभव है । समस्या यह है कि कई अलग-अलग कारण मॉडल मनाया चर के समान संयुक्त संभावना वितरण को प्राप्त कर सकते हैं। सबसे आम उदाहरण गाऊसी शोर के साथ एक कारण रैखिक प्रणाली है।
लेकिन कुछ कारण मान्यताओं के तहत, यह संभव हो सकता है --- और यही कारण है कि खोज का साहित्य काम करता है। यदि आपके पास इस विषय का कोई पूर्व संपर्क नहीं है, तो आप पीटर्स, जेनिंग और स्कोलॉफ़ द्वारा तत्वों के कारण से शुरू कर सकते हैं , साथ ही यहूदिया पर्ल द्वारा अध्याय 2 के कारण । हमारे पास सीवी पर यहां एक विषय है , कारण खोज पर संदर्भ के लिए , लेकिन हमारे पास अभी तक सूचीबद्ध कई संदर्भ नहीं हैं।
इसलिए, आपके प्रश्न का सिर्फ एक उत्तर नहीं है, क्योंकि यह मान्यताओं पर निर्भर करता है। आप जिस कागज का उल्लेख करते हैं, वह कुछ उदाहरणों का हवाला देता है, जैसे कि गैर-गौसियन शोर के साथ एक रेखीय मॉडल । इस मामले को LINGAN के रूप में जाना जाता है (रैखिक गैर-गाऊसी मॉडल के लिए छोटा), यहाँ एक उदाहरण है R
:
library(pcalg)
set.seed(1234)
n <- 500
eps1 <- sign(rnorm(n)) * sqrt(abs(rnorm(n)))
eps2 <- runif(n) - 0.5
x2 <- 3 + eps2
x1 <- 0.9*x2 + 7 + eps1
# runs lingam
X <- cbind(x1, x2)
res <- lingam(X)
as(res, "amat")
# Adjacency Matrix 'amat' (2 x 2) of type ‘pag’:
# [,1] [,2]
# [1,] . .
# [2,] TRUE .
ध्यान दें कि हमारे पास गैर-गॉसियन शोर के साथ एक रैखिक कारण मॉडल है जहां कारण और लिंगम सही रूप से कारण दिशा को ठीक करता है। हालाँकि, यह नोटिस गंभीर रूप से लिंगम मान्यताओं पर निर्भर करता है ।
आपके द्वारा उद्धृत पेपर के मामले के लिए, वे इस विशिष्ट धारणा को बनाते हैं (देखें उनका "पोस्ट" "):
यदि , तंत्र की न्यूनतम विवरण लंबाई X से Y की मैपिंग X के मान से स्वतंत्र है, जबकि Y से X तक के तंत्र की न्यूनतम विवरण लंबाई Y के मान पर निर्भर है।
ध्यान दें यह एक धारणा है। इसे हम उनकी "पहचान की स्थिति" कहेंगे। अनिवार्य रूप से, डाक वितरण संयुक्त वितरण पी ( एक्स) पर प्रतिबंध लगाता है । यही है, पोस्टऑउट कहता है कि यदि कुछ प्रतिबंध डेटा में हैं, और यदि अन्य प्रतिबंध हैं। इस प्रकार के प्रतिबंध जिनके परीक्षण योग्य निहितार्थ हैं ( पर अवरोध लगाते हैं ) जो किसी को प्रत्यक्ष डेटा से प्रत्यक्ष रूप से पुनर्प्राप्त करने की अनुमति देता है।
अंतिम टिप्पणी के रूप में, कारण खोज परिणाम अभी भी बहुत सीमित हैं, और मजबूत मान्यताओं पर निर्भर करते हैं, वास्तविक दुनिया के संदर्भ में इन्हें लागू करते समय सावधान रहें।
lm
)। हम सभी Tuebingen डेटासेट के आसपास काम नहीं कर सकते क्योंकि अवलोकन संबंधी नमूनों को कारण खोज का विचार मिलता है! :)
औपचारिकता संबंधी कार्यवाहियों के लिए कई तरह के दृष्टिकोण हैं (जो कि सदियों से चली आ रही कार्यवाहियों के बारे में पर्याप्त दार्शनिक असहमति के साथ है)। एक लोकप्रिय संभावित परिणामों के संदर्भ में है। रुबिन कारण मॉडल कहलाता है, संभावित परिणाम दृष्टिकोण, यह मानता है कि प्रत्येक कार्य स्थिति के लिए, एक अलग यादृच्छिक चर है। तो, एक नैदानिक परीक्षण से संभावित परिणामों का यादृच्छिक चर हो सकता है यदि कोई विषय अध्ययन दवा लेता है, और यदि वह प्लेसबो लेता है तो यादृच्छिक चर हो सकता है। कारण प्रभाव और बीच का अंतर है । यदि वास्तव में , हम कह सकते हैं कि उपचार का कोई प्रभाव नहीं है। अन्यथा, हम कह सकते हैं कि उपचार की स्थिति परिणाम का कारण बनती है।
चरों के बीच के संबंध को दिशात्मक एसाइकल ग्राफ के साथ भी दर्शाया जा सकता है , जिनका स्वाद बहुत अलग होता है, लेकिन गणितीय रूप से रुबिन मॉडल (वेसमरन, 2004, धारा 17.8) के बराबर होता है।
वासरमैन, एल। (2004)। सांख्यिकी के सभी: सांख्यिकीय निष्कर्ष में एक संक्षिप्त पाठ्यक्रम । न्यूयॉर्क, एनवाई: स्प्रिंगर। आईएसबीएन 978-0-387-40272-7।
एक हस्तक्षेप एक परिवर्तनशील परिवर्तन है जो एक चर पर निर्भर करता है जो चर को प्रभावित नहीं करता है। संरचनात्मक समीकरणों और कारण ग्राफिकल मॉडल में हस्तक्षेप को कड़ाई से औपचारिक रूप दिया गया है, लेकिन जहां तक मुझे पता है, कोई परिभाषा नहीं है जो एक विशेष मॉडल वर्ग से स्वतंत्र है।
कार्य-कारण के लिए आधुनिक दृष्टिकोणों में, हस्तक्षेप को आदिम वस्तु के रूप में लिया जाता है जो कार्य-संबंधों को परिभाषित करता है (परिभाषा 1)। मेरी राय में, हालांकि, हस्तक्षेप सिमुलेशन का एक प्रतिबिंब है, और जरूरी सिमुलेशन सिमुलेशन के अनुरूप है।