यह एक बहुत अच्छा सवाल है। यदि आपका फॉर्मूला सही है, तो पहले सत्यापित करें। आपके द्वारा दी गई जानकारी निम्नलिखित कारण मॉडल से मेल खाती है:
और जैसा कि आपने कहा है कि हम इसके लिए अनुमान बढ़ा सकते हैं पी( य|घओ ( एक्स)) )do-पथरी के नियमों का उपयोग करना। आर में हम आसानी से पैकेज के साथ कर सकते हैं causaleffect
। igraph
आपके द्वारा प्रस्तावित आरेख वाले ऑब्जेक्ट को बनाने के लिए हम पहले लोड करते हैं:
library(igraph)
g <- graph.formula(X-+Y, Y-+X, X-+Z-+Y, W-+X, W-+Z, W-+Y, simplify = FALSE)
g <- set.edge.attribute(graph = g, name = "description", index = 1:2, value = "U")
जहाँ पहले दो पद X-+Y, Y-+X
अप्रभावित कन्फ़्यूडर के प्रतिनिधित्व करते हैंएक्स तथा Y और बाकी शर्तें आपके द्वारा बताए गए निर्देशित किनारों का प्रतिनिधित्व करती हैं।
फिर हम अपना एस्टीमेट मांगते हैं:
library(causaleffect)
cat(causal.effect("Y", "X", G = g, primes = TRUE, simp = T, expr = TRUE))
∑W,Z(∑X′P(Y|W,X′,Z)P(X′|W))P(Z|W,X)P(W)
जो वास्तव में आपके सूत्र के साथ मेल खाता है --- एक मनाया कन्फ्यूडर के साथ फ्रोनटूर का मामला।
अब चलिए अनुमान के हिस्से में जाते हैं। यदि आप रैखिकता (और सामान्यता) मान लेते हैं, तो चीजें बहुत सरल हो जाती हैं। मूल रूप से आप जो करना चाहते हैं वह पथ के गुणांक का अनुमान लगाना हैX→Z→Y।
चलो कुछ डेटा का अनुकरण करते हैं:
set.seed(1)
n <- 1e3
u <- rnorm(n) # y -> x unobserved confounder
w <- rnorm(n)
x <- w + u + rnorm(n)
z <- 3*x + 5*w + rnorm(n)
y <- 7*z + 11*w + 13*u + rnorm(n)
हमारे सिमुलेशन में परिवर्तन के वास्तविक कारण प्रभाव पर ध्यान दें X पर Y21 है। आप दो प्रतिगमन चलाकर इसका अनुमान लगा सकते हैं। प्रथम Y∼Z+W+X का प्रभाव पाने के लिए Z पर Y और फिर Z∼X+W का प्रभाव पाने के लिए X पर Z। आपका अनुमान दोनों गुणांक का उत्पाद होगा:
yz_model <- lm(y ~ z + w + x)
zx_model <- lm(z ~ x + w)
yz <- coef(yz_model)[2]
zx <- coef(zx_model)[2]
effect <- zx*yz
effect
x
21.37626
और अनुमान के लिए आप उत्पाद की मानक त्रुटि (असममित) की गणना कर सकते हैं:
se_yz <- coef(summary(yz_model))[2, 2]
se_zx <- coef(summary(zx_model))[2, 2]
se <- sqrt(yz^2*se_zx^2 + zx^2*se_yz^2)
जो आप परीक्षण या विश्वास अंतराल के लिए उपयोग कर सकते हैं:
c(effect - 1.96*se, effect + 1.96*se) # 95% CI
x x
19.66441 23.08811
आप (गैर / अर्ध) -परमेटिक आकलन भी कर सकते हैं, मैं बाद में अन्य प्रक्रियाओं सहित इस उत्तर को अपडेट करने का प्रयास करूंगा।