क्या सांख्यिकीय स्वतंत्रता का मतलब करणीय की कमी है?


40

दो यादृच्छिक चर A और B सांख्यिकीय रूप से स्वतंत्र हैं। इसका मतलब है कि प्रक्रिया के DAG में: और निश्चित रूप से । लेकिन क्या इसका यह भी मतलब है कि बी से ए तक कोई फ्रंट-डोर नहीं है?पी ( | बी ) = पी ( )(AB)P(A|B)=P(A)

क्योंकि तब हमें प्राप्त करना चाहिए । तो अगर ऐसा है, तो क्या सांख्यिकीय स्वतंत्रता का मतलब अपने आप में कमी है?P(A|do(B))=P(A)

जवाबों:


37

तो अगर ऐसा है, तो क्या सांख्यिकीय स्वतंत्रता का मतलब अपने आप में कमी है?

नहीं, और यहाँ एक बहुभिन्नरूपी सामान्य के साथ एक सरल काउंटर उदाहरण है,

set.seed(100)
n <- 1e6
a <- 0.2
b <- 0.1
c <- 0.5
z <- rnorm(n)
x <- a*z + sqrt(1-a^2)*rnorm(n)
y <- b*x - c*z + sqrt(1- b^2 - c^2 +2*a*b*c)*rnorm(n)
cor(x, y)

इसी ग्राफ के साथ,

यहाँ छवि विवरण दर्ज करें

यहां हमारे पास यह है कि और मामूली स्वतंत्र हैं (बहुभिन्नरूपी सामान्य मामले में, शून्य सहसंबंध स्वतंत्रता का अर्थ है)। ऐसा इसलिए होता है क्योंकि माध्यम से पिछले दरवाजे को सीधे से , यानी, से सीधा रास्ता रद्द कर देता है । इस प्रकार । फिर भी, सीधे कारण बनता है , और हमारे पास , जो से भिन्न है ।xyzxycov(x,y)=bac=0.10.1=0E[Y|X=x]=E[Y]=0xyE[Y|do(X=x)]=bxE[Y]=0

संघ, हस्तक्षेप और प्रतिकृतियां

मुझे लगता है कि संघों, हस्तक्षेपों और प्रतिपक्षों के संबंध में कुछ स्पष्टीकरण देना महत्वपूर्ण है।

सिस्टम के व्यवहार के बारे में कॉज़ल मॉडल बयान दर्ज करते हैं: (i) निष्क्रिय टिप्पणियों के तहत, (ii) हस्तक्षेपों के तहत, साथ ही (iii) जवाबी कार्रवाई। और एक स्तर पर स्वतंत्रता दूसरे के लिए जरूरी नहीं है।

जैसा कि ऊपर दिए गए उदाहरणों से पता चलता है कि हमारा और बीच कोई संबंध नहीं है , अर्थात , और फिर भी ऐसा मामला हो सकता है कि पर जोड़तोड़ के वितरण को बदल देता है , अर्थात, ।XYP(Y|X)=P(Y)XYP(Y|do(x))P(Y)

अब, हम एक कदम आगे जा सकते हैं। हमारे पास कारण मॉडल हो सकते हैं जहां पर हस्तक्षेप करने से के जनसंख्या वितरण में बदलाव नहीं होता है , लेकिन इसका मतलब यह नहीं है कि जवाबी कार्रवाई का अभाव है! है यही कारण है कि, भले ही , हर व्यक्ति अपने परिणाम के लिए हो गया होता विभिन्न आप अपने बदला था । यह वास्तव में user20160 द्वारा वर्णित मामला है, साथ ही यहां मेरे पिछले उत्तर में भी है।XYP(Y|do(x))=P(Y)YX

इनमें से प्रत्येक पर प्रश्नों का उत्तर देने के लिए आवश्यक जानकारी के संदर्भ में, ये तीन स्तर कार्य-कारण संबंधी कार्यों का एक पदानुक्रम बनाते हैं।


1
धन्यवाद, ठीक वही है जिसकी मुझे तलाश थी। इसलिए मुझे लगता है कि मेरी उलझन यह सोचने के कारण नहीं थी कि सांख्यिकीय स्वतंत्रता का अर्थ दो चर के बीच डी-सेपरेशन भी है। लेकिन यह केवल दूसरे तरीके से काम करता है, सही है?
user1834069

@ user1834069 यह सही है, d- पृथक्करण का अर्थ है स्वतंत्रता, लेकिन स्वतंत्रता का अर्थ d- जुदाई नहीं है। ये दो उदाहरण हैं जहां वितरण ग्राफ के लिए प्रतिकूल है, और आप देख सकते हैं कि यह पैरामीटराइजेशन की पसंद पर निर्भर करता है। यदि हम मापदंडों को बदलते हैं, तो निर्भरता फिर से दिखाई देती है।
कार्लोस सिनेली

अच्छा उदाहरण है। अगर मुझे सही से याद है, तो यह अवलोकन संबंधी डेटा से खनन कारण डेटा खनन की गैर-परीक्षणीय मान्यताओं में से एक है। एसईएम में रैखिक मॉडल के लिए, पर्ल की पुस्तक में यह भी उल्लेख किया गया है कि गुणांक का एक सेट जो कि एक प्रतिकूल वितरण के परिणामस्वरूप होता है, का माप 0. है
विमल

37

मान लीजिए कि हमारे पास दो स्विच द्वारा नियंत्रित एक लाइटबल्ब है। बता दें कि और स्विच की स्थिति को दर्शाता है, जो 0 या 1. हो सकता है। को Lighbulb की स्थिति को सूचित करें, जो 0 (ऑफ) या 1 (ऑन) हो सकता है। हम सर्किट को ऐसे सेट करते हैं जैसे कि lighbulb तब होता है जब दो स्विच अलग-अलग राज्यों में होते हैं, और जब वे एक ही स्थिति में होते हैं। तो, सर्किट अनन्य या फ़ंक्शन को लागू करता है: ।S1S2LL=XOR(S1,S2)

निर्माण के अनुसार, , और से संबंधित है । सिस्टम के किसी भी कॉन्फ़िगरेशन को देखते हुए, यदि हम एक स्विच को फ्लिप करते हैं, तो लाइटबल्ब की स्थिति बदल जाएगी।LS1S2

अब, मान लीजिए कि दोनों स्विच एक बर्नौली प्रक्रिया के अनुसार स्वतंत्र रूप से सक्रिय हैं, जहां राज्य 1 में होने की संभावना 0.5 है। तो, , और और स्वतंत्र हैं। इस मामले में, हम सर्किट के डिज़ाइन से जानते हैं कि और, इसके अलावा, । यही कारण है कि, एक स्विच की स्थिति जानने से हमें इस बारे में कुछ भी पता नहीं चलता है कि लैगबुल चालू या बंद होगा या नहीं। तो और स्वतंत्र हैं, जैसे और ।p(S1=1)=p(S2=1)=0.5S1S2P(L=1)=0.5p(LS1)=p(LS2)=p(L)LS1LS2

लेकिन, जैसा कि ऊपर, और से संबंधित है । इसलिए, सांख्यिकीय स्वतंत्रता में कार्य-कारण की कमी नहीं है।LS1S2


2
उपयोगकर्ता, आप सही कह रहे हैं कि इस उदाहरण में निर्भरता की कमी के कारण कार्य है, जैसा कि मैं यहां बता रहा हूं। आँकड़े ।stackexchange.com / questions / 26300 / , हालांकि इस उदाहरण में हमारे पास यह भी है कि , इसलिए यह ओपी के सवाल का सीधे जवाब नहीं देता है। P(L|do(S1))=P(L)
कार्लोस सिनेली

उपयोगकर्ता, प्रश्न कृपया: बारे में क्या ? यानी क्या यह बराबर है ? मैं व्यक्तिगत रूप से किसी भी , , लेकिन । क्या मैं सही हू? (मैं देख रहा हूं कि यह वास्तव में संबंधित नहीं है, लेकिन मैं अपनी समझ को फिर से जांचना चाहता हूं)p(L|S1,S2)p(L)(vL,v1,v2){0,1}3p(L=vL|S1=v1)=p(L=vL|S2=v2)=0.5 p(L=vL|S1=v1,S2=v2){0,1}
गुफा

0

अपने प्रश्न के आधार पर, आप इस तरह सोच सकते हैं:

P(AB)=P(A)P(B) जब और स्वतंत्र होते हैं। आप इसी तरह इम्प्लीमेंट कर सकते हैंAB

P(AB)/P(A)=P(B|A)=P(B) । इसके अलावा,

P(AB)/P(B)=P(A|B)=P(A) |

इस संबंध में, मेरा मानना ​​है कि स्वतंत्रता का अर्थ कार्य-कारण की कमी है। हालाँकि, निर्भरता अनिवार्य रूप से कार्य-कारण नहीं है।


2
मैं पूछ रहा हूँ कि क्या अर्थ है कि ? (पर्ल डू-कैलकुलस नोटेशन का उपयोग करके)P ( A | d o ( B ) ) = P ( A )P(AB)=P(A)P(B)P(A|do(B))=P(A)
user1834069
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.