जीएलएम मापदंडों पर अनुमान के लिए स्वतंत्रता सुधार की डिग्री का उपयोग किया जाना चाहिए?


11

यह सवाल यहां मार्टिज़न के जवाब से प्रेरित है ।

मान लीजिए कि हम एक पैरामीटर परिवार के लिए एक द्विपद या पॉइसन मॉडल की तरह जीएलएम फिट करते हैं और यह एक पूर्ण संभावना प्रक्रिया है (जैसा कि कहने के लिए विरोध किया जाता है, क्वासिपोइसन)। फिर, विचरण माध्य का एक कार्य है। द्विपद के साथ: और पॉइसन var [ X ] = E [ X ] के साथvar[X]=E[X]E[1X]var[X]=E[X]

रैखिक रिग्रेशन के विपरीत जब अवशिष्टों को सामान्य रूप से वितरित किया जाता है, तो इन गुणांकों के परिमित, सटीक नमूने वितरण का पता नहीं चलता है, यह परिणामों और सहसंयोजकों का संभवतः जटिल संयोजन है। इसके अलावा, माध्य के GLM के अनुमान का उपयोग करते हुए , जिसका उपयोग परिणाम के विचरण के लिए प्लगइन अनुमान के रूप में किया जाता है।

रैखिक प्रतिगमन की तरह, हालांकि, गुणांकों में एक स्पर्शोन्मुख सामान्य वितरण होता है, और इसलिए परिमित नमूना इंजेक्शन में हम सामान्य वक्र के साथ उनके नमूना वितरण को अनुमानित कर सकते हैं।

मेरा सवाल है: हम परिमित नमूनों में गुणांक के नमूना वितरण के लिए टी-वितरण सन्निकटन का उपयोग करके कुछ भी हासिल करते हैं? एक तरफ, हम विचरण को जानते हैं , फिर भी हम सटीक वितरण को नहीं जानते हैं, इसलिए एक टी अंदाजा गलत विकल्प की तरह लगता है जब एक बूटस्ट्रैप या जैकनाइफ अनुमानक इन विसंगतियों के लिए ठीक से खाता हो सकता है। दूसरी ओर, शायद टी-वितरण का मामूली रूढ़िवाद केवल व्यवहार में पसंद किया जाता है।


1
अच्छा प्रश्न। आप बार्टलेट सुधार को देखना चाह सकते हैं ।
बेन बोलकर

1
मुझे लगता है कि यह प्रश्न बीमार है, जब MLE या QMLE का उपयोग करते हुए आपके पास केवल asymptotically औचित्य और अनुमान है। यह पूछना कि यदि परिमित सेटिंग में A या B बेहतर है, तो इसका उत्तर नहीं दिया जा सकता है, यह हमेशा सांसारिक को उबालता है "डेटा पर निर्भर करता है और आप किन मान्यताओं को बनाने के लिए तैयार हैं"। व्यक्तिगत रूप से मुझे बूटस्ट्रैपिंग पसंद है, और जब भी मैं इसका उपयोग कर सकता हूं, लेकिन यह अधिक गलत नहीं है कि मानक जेड या टी आधारित परीक्षण का उपयोग करना - यह आपको छोटी डेटा समस्या से बचने की अनुमति नहीं देता है, और इसलिए आप अभी भी धारणाएं बना रहे हैं (बस अलग-अलग हैं) )
२१

जवाबों:


3

संक्षिप्त उत्तर: अभी तक पूर्ण उत्तर नहीं है, लेकिन आप संबंधित प्रश्न से संबंधित निम्न वितरणों में रुचि रख सकते हैं: यह z- परीक्षण (जैसा कि glm द्वारा उपयोग किया जाता है) और टी-टेस्ट की तुलना करता है।

    layout(matrix(1:2,1,byrow=TRUE))

    # trying all 100 possible outcomes if the true value is p=0.7
    px <- dbinom(0:100,100,0.7)
    p_model = rep(0,101)
    p_model2 = rep(0,101)
    for (i in 0:100) {
      xi = c(rep(1,i),rep(0,100-i))
      model = glm(xi ~ 1, offset=rep(qlogis(0.7),100), family="binomial")
      p_model[i+1] = 1-summary(model)$coefficients[4]
      model2 <- glm(xi ~ 1, family = "binomial")
      coef <- summary(model2)$coefficients
      p_model2[i+1] = 1-2*pt(-abs((qlogis(0.7)-coef[1])/coef[2]),99,ncp=0)
    }


    # plotting cumulative distribution of outcomes z-test
    outcomes <- p_model[order(p_model)]
    cdf <- cumsum(px[order(p_model)])
    plot(1-outcomes,1-cdf, 
         ylab="cumulative probability", 
         xlab= "calculated glm p-value",
         xlim=c(10^-4,1),ylim=c(10^-4,1),col=2,cex=0.5,log="xy")
    lines(c(0.00001,1),c(0.00001,1))
    for (i in 1:100) {
      lines(1-c(outcomes[i],outcomes[i+1]),1-c(cdf[i+1],cdf[i+1]),col=2)
    #  lines(1-c(outcomes[i],outcomes[i]),1-c(cdf[i],cdf[i+1]),col=2)
    }

    title("probability for rejection with z-test \n as function of set alpha level")


    # plotting cumulative distribution of outcomes t-test
    outcomes <- p_model2[order(p_model2)]
    cdf <- cumsum(px[order(p_model2)])
    plot(1-outcomes,1-cdf, 
         ylab="cumulative probability", 
         xlab= "calculated glm p-value",
         xlim=c(10^-4,1),ylim=c(10^-4,1),col=2,cex=0.5,log="xy")
    lines(c(0.00001,1),c(0.00001,1))
    for (i in 1:100) {
      lines(1-c(outcomes[i],outcomes[i+1]),1-c(cdf[i+1],cdf[i+1]),col=2)
      #  lines(1-c(outcomes[i],outcomes[i]),1-c(cdf[i],cdf[i+1]),col=2)
    }

    title("probability for rejection with t-test \n as function of set alpha level")
    [![p-test vs t-test][1]][1]

और केवल एक छोटा सा अंतर है। और जेड-टेस्ट भी वास्तव में बेहतर है (लेकिन यह हो सकता है क्योंकि टी-टेस्ट और जेड-टेस्ट दोनों "गलत" हैं और संभवतः जेड-टेस्ट की त्रुटि इस त्रुटि की भरपाई करती है)।

यहाँ छवि विवरण दर्ज करें

दीर्घ उत्तर: ...

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.