मैं एक समायोजित जोखिम अनुपात का अनुमान लगाने में दिलचस्पी रखता हूं, जो एक तर्कपूर्ण प्रतिगमन का उपयोग करके एक समायोजित बाधाओं के अनुपात का अनुमान लगाता है। कुछ साहित्य (जैसे, यह ) इंगित करता है कि ह्यूबर-व्हाइट मानक त्रुटियों के साथ पॉइसन प्रतिगमन का उपयोग यह करने के लिए एक मॉडल-आधारित तरीका है
मुझे इस बात पर साहित्य नहीं मिला है कि लगातार सहसंयोजकों के लिए समायोजन कैसे प्रभावित करता है। निम्नलिखित सरल सिमुलेशन दर्शाता है कि यह मुद्दा इतना सीधा नहीं है:
arr <- function(BLR,RR,p,n,nr,ce)
{
B = rep(0,nr)
for(i in 1:nr){
b <- runif(n)<p
x <- rnorm(n)
pr <- exp( log(BLR) + log(RR)*b + ce*x)
y <- runif(n)<pr
model <- glm(y ~ b + x, family=poisson)
B[i] <- coef(model)[2]
}
return( mean( exp(B), na.rm=TRUE ) )
}
set.seed(1234)
arr(.3, 2, .5, 200, 100, 0)
[1] 1.992103
arr(.3, 2, .5, 200, 100, .1)
[1] 1.980366
arr(.3, 2, .5, 200, 100, 1)
[1] 1.566326
इस मामले में, वास्तविक जोखिम अनुपात 2 है, जो कोवरिएट प्रभाव छोटा होने पर मज़बूती से पुनर्प्राप्त किया जाता है। लेकिन, जब कोवरिएट प्रभाव बड़ा होता है, तो यह विकृत हो जाता है। मुझे लगता है कि यह उत्पन्न होता है क्योंकि कोवरिएट प्रभाव ऊपरी बाध्य (1) के खिलाफ धक्का दे सकता है और यह अनुमान को दूषित करता है।
मैंने देखा है, लेकिन समायोजित जोखिम अनुपात आकलन में निरंतर कोवरियों के लिए समायोजन पर कोई साहित्य नहीं पाया है। मुझे इस साइट पर निम्नलिखित पोस्ट की जानकारी है:
- बाइनरी परिणामों के लिए सापेक्ष जोखिम का अनुमान लगाने के लिए पॉइसन प्रतिगमन
- बाइनरी डेटा के लिए पॉइसन रिग्रेशन
लेकिन वे मेरे सवाल का जवाब नहीं देते। क्या इस पर कोई कागजात हैं? क्या कोई ज्ञात सावधानी है जिसका प्रयोग किया जाना चाहिए?