हाल ही के एक पेपर में नॉर्टन एट अल। (2018) राज्य है कि
एक ही अध्ययन से अलग-अलग बाधाओं की तुलना नहीं की जा सकती है जब सांख्यिकीय मॉडल के परिणामस्वरूप अनुपात अनुपात अनुमानों में अलग-अलग व्याख्यात्मक चर होते हैं क्योंकि प्रत्येक मॉडल में एक अलग मनमाना स्केलिंग कारक होता है। न ही एक अध्ययन से बाधाओं के अनुपात की तुलना दूसरे अध्ययन से अंतर अनुपात के परिमाण के साथ की जा सकती है, क्योंकि विभिन्न नमूनों और विभिन्न मॉडल विनिर्देशों में अलग-अलग मनमाना स्केलिंग कारक होंगे। एक और निहितार्थ यह है कि कई अध्ययनों में किसी दिए गए जुड़ाव के अनुपातों के परिमाण को मेटा-विश्लेषण में संश्लेषित नहीं किया जा सकता है।
एक छोटा सिमुलेशन इसे दिखाता है (R कोड प्रश्न के निचले भाग में है)। मान लें कि सच्चा मॉडल है:
आगे कल्पना करें कि उपरोक्त मॉडल द्वारा उत्पन्न एक ही डेटा का विश्लेषण चार अलग-अलग शोधकर्ताओं द्वारा लॉजिस्टिक रिग्रेशन का उपयोग करके किया जाता है। शोधकर्ता 1 में केवल एक सहसंयोजक के रूप में शामिल हैं, शोधकर्ता 2 में और दोनों शामिल हैं। चार शोधकर्ताओं के के लिए अंतर अनुपात के औसत सिम्युलेटेड अनुमान थे:
res_1 res_2 res_3 res_4
1.679768 1.776200 2.002157 2.004077
यह स्पष्ट है कि केवल शोधकर्ता 3 और 4 को लगभग का सही अंतर मिलता है जबकि शोधकर्ताओं को 1 और 2 का नहीं। यह रैखिक प्रतिगमन में नहीं होता है, जिसे आसानी से एक समान सिमुलेशन (यहां नहीं दिखाया गया है) द्वारा दिखाया जा सकता है। मुझे यह स्वीकार करना चाहिए कि यह परिणाम मेरे लिए काफी आश्चर्यजनक था, हालांकि यह समस्या अच्छी तरह से जानी जाती है । हर्नान एट अल। (2011) इसे पूर्वाग्रह के बजाय "गणितीय विषमता" कहते हैं।[ २ ] [ ३ ]
मेरे सवाल:
- यदि ऑड्स अनुपात मूल रूप से अध्ययन और मॉडल में अतुलनीय है, तो हम बाइनरी परिणामों के लिए विभिन्न अध्ययनों के परिणामों को कैसे जोड़ सकते हैं?
- अनगिनत मेटा-विश्लेषणों के बारे में क्या कहा जा सकता है जिन्होंने विभिन्न अध्ययनों से बाधाओं को संयोजित किया है जहां प्रत्येक अध्ययन संभवतः कोवरिएट्स के एक अलग सेट के लिए समायोजित किया गया है? क्या वे अनिवार्य रूप से बेकार हैं?
संदर्भ
[१]: नॉर्टन ईसी, डॉव्ड बीई, मैकिएजेव्स्की एमएल (२०१on): ऑड्स अनुपात - करंट बेस्ट प्रैक्टिस एंड यूज़। JAMA 320 (1): 84-85।
[२]: नॉर्टन ईसी, डॉव बीई (२०१on): लॉग ऑड्स एंड इंटरप्रिटेशन ऑफ लॉज मॉडल। स्वास्थ्य सेवा Res। 53 (2): 859-878।
[३]: हर्नान एमए, क्लेटन डी, कीडिंग एन (२०११): सिम्पसन का विरोधाभास सुलझा हुआ। इंट जे एपिडेमिओल 40: 780-785।
प्रकटीकरण
सवाल (आर कोड सहित) एक सवाल का संशोधित संस्करण है जिसे उपयोगकर्ता टाइमस्टैडर द्वारा डेटामेथोड्स पर प्रस्तुत किया गया है ।
आर कोड
set.seed(142857)
n_sims <- 1000 # number of simulations
out <- data.frame(
treat_1 = rep(NA, n_sims)
, treat_2 = rep(NA, n_sims)
, treat_3 = rep(NA, n_sims)
, treat_4 = rep(NA, n_sims)
)
n <- 1000 # number of observations in each simulation
coef_sim <- "x1" # Coefficient of interest
# Coefficients (log-odds)
b0 <- 1
b1 <- log(2)
b2 <- log(2.5)
b3 <- log(3)
b4 <- 0
for(i in 1:n_sims){
x1 <- rbinom(n, 1, 0.5)
x2 <- rnorm(n)
x3 <- rnorm(n)
x4 <- rnorm(n)
z <- b0 + b1*x1 + b2*x2 + b3*x3 + b4*x4
pr <- 1/(1 + exp(-z))
y <- rbinom(n, 1, pr)
df <- data.frame(y = y, x1 = x1, x2 = x2, x3 = x3, x4 = x4)
model1 <- glm(y ~ x1, data = df, family = "binomial")
model2 <- glm(y ~ x1 + x2, data = df, family = "binomial")
model3 <- glm(y ~ x1 + x2 + x3, data = df, family = "binomial")
model4 <- glm(y ~ x1 + x2 + x3 + x4, data = df, family = "binomial")
out$treat_1[i] <- model1$coefficients[coef_sim]
out$treat_2[i] <- model2$coefficients[coef_sim]
out$treat_3[i] <- model3$coefficients[coef_sim]
out$treat_4[i] <- model4$coefficients[coef_sim]
}
# Coefficients
colMeans(out)
exp(colMeans(out)) # Odds ratios