पोइसन GLM परिणामों में पैरामीटर अनुमानों की व्याख्या कैसे करें [बंद]


14
Call:
glm(formula = darters ~ river + pH + temp, family = poisson, data = darterData)

Deviance Residuals:
    Min      1Q   Median     3Q    Max
-3.7422 -1.0257   0.0027 0.7169 3.5347

Coefficients:
              Estimate Std.Error z value Pr(>|z|)
(Intercept)   3.144257  0.218646  14.381  < 2e-16 ***
riverWatauga -0.049016  0.051548  -0.951  0.34166
pH            0.086460  0.029821   2.899  0.00374 **
temp         -0.059667  0.009149  -6.522  6.95e-11 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for poisson family taken to be 1)
Null deviance: 233.68 on 99 degrees of freedom
Residual deviance: 187.74 on 96 degrees of freedom
AIC: 648.21

मैं जानना चाहता हूं कि उपरोक्त तालिका में प्रत्येक पैरामीटर अनुमान की व्याख्या कैसे की जाए।


व्याख्या समान है: आंकड़े
.stackexchange.com/a/126225/7071

6
यह प्रश्न ऑफ़-टॉपिक प्रतीत होता है क्योंकि यह R आउटपुट के बारे में बिना किसी बुद्धिमान प्रश्न के पीछे की व्याख्या करने के बारे में है। यह वह श्रेणी है "मैं अपना कंप्यूटर आउटपुट वहां डंप करता हूं और आप मेरे लिए स्टेट एनालिसिस चलाते हैं" ...
शीआन

1
आपका फैलाव पैरामीटर इंगित करता है कि आपके मॉडल के साथ कुछ समस्याएं हैं। शायद आपको इसके बजाय एक क्वासिपोइसन वितरण का उपयोग करने पर विचार करना चाहिए। मुझे यकीन है कि आपके पैरामीटर का अनुमान काफी बदल जाएगा और इसलिए व्याख्या होगी। यदि आप "प्लॉट (मॉडल)" चलाते हैं, तो आपको अपने अवशेषों के कुछ प्लॉट मिलेंगे, अपने वास्तविक मॉडल की व्याख्या शुरू करने से पहले अवांछित पैटर्न के लिए इन प्लॉटों पर एक नज़र डालें। जल्दी से अपने मॉडल के फिट की साजिश रचने के लिए आप विज़िग्राम पैकेज से "विज़ग्राम (मॉडेलिट)" का भी उपयोग कर सकते हैं
रॉबी

3
@ शीआन, हालांकि प्रश्न विरल और आवश्यक संपादन है, मुझे नहीं लगता कि यह बंद विषय है। इन प्रश्नों पर विचार करें जिन्हें ऑफ-टॉपिक नहीं माना जाता है: आर की एलएम () आउटपुट की व्याख्या , और द्विपद रिग्रेशन के लिए आर के आउटपुट की व्याख्या । हालाँकि यह एक डुप्लिकेट प्रतीत होता है ।
गूँग - मोनिका

2
यह कैसे एक पॉइसन प्रतिगमन में गुणांक की व्याख्या करने का एक डुप्लिकेट है ? कृपया जुड़े हुए धागे को पढ़ें। यदि आपके पास अभी भी पढ़ने के बाद एक प्रश्न है, तो यहां वापस आएं और अपने प्रश्न को संपादित करने के लिए यह बताएं कि आपने क्या सीखा है और आपको अभी भी क्या जानने की जरूरत है, तो हम आपको बिना किसी अन्य सामग्री की नकल किए बिना आवश्यक जानकारी प्रदान कर सकते हैं जो पहले से ही मदद नहीं की थी आप।
गूँग - मोनिका

जवाबों:


28

मुझे नहीं लगता कि आपके प्रश्न का शीर्षक ठीक-ठीक वही है जो आप पूछ रहे हैं।

एक जीएलएम में मापदंडों की व्याख्या कैसे करें का प्रश्न बहुत व्यापक है क्योंकि जीएलएम मॉडल का एक बहुत व्यापक वर्ग है। याद रखें कि GLM एक प्रतिसाद चर मॉडल है जो घातीय परिवार से एक ज्ञात वितरण का पालन करने के लिए माना जाता है, और यह कि हमने एक उलटा फ़ंक्शन जैसे कि के लिए भविष्यवक्ता चर । इस मॉडल में, किसी विशेष पैरामीटर की व्याख्या के परिवर्तन की दर है के संबंध में । परिभाषितyg

E[y|x]=g1(x0+x1β1++xJβJ)
Jxβjg(y)xjμE[y|x]=g1(x)और संकेतन को साफ रखने के लिए। फिर, किसी भी , अब को परिभाषित करें को शून्य का सदिश और वीं स्थिति में एक एकल , ताकि उदाहरण के लिए यदि तो । तब ηxβj{1,,J}
βj=ηxj=g(μ)xj.
ejJ11jJ=5e3=(0,0,1,0,0)
βj=g(E[y|x+ej])g(E[y|x])

जिसका मतलब सिर्फ इतना है कि में इकाई वृद्धि के पर का प्रभाव ।βjηxj

आप इस तरह से संबंध भी : और

E[y|x]xj=μxj=dμdηηxj=μηβj=dg1dηβj
E[y|x+ej]E[y|x]Δjy^=g1((x+ej)β)g1(xβ)

बारे में कुछ भी जाने बिना , हम इसे प्राप्त कर सकते हैं। पर प्रभाव है , की तब्दील सशर्त मतलब पर में एक इकाई वृद्धि की, , और की सशर्त मतलब पर प्रभाव में एक इकाई वृद्धि की है ।gβjηyxjyxjg1(β)


लेकिन आप विशेष रूप से आर के डिफ़ॉल्ट लिंक फ़ंक्शन का उपयोग करके पॉइसन रिग्रेशन के बारे में पूछ रहे हैं, जो इस मामले में प्राकृतिक लघुगणक है। यदि ऐसा है, तो आप एक विशिष्ट प्रकार के GLM के बारे में पूछ रहे हैं जिसमें और । फिर हम एक विशिष्ट व्याख्या के संबंध में कुछ कर्षण प्राप्त कर सकते हैं।yPoisson(λ)g=ln

ऊपर मैंने जो कहा, उससे हम जानते हैं कि । और जब से हम जानते हैं, हम उस भी जानते हैं । हम यह भी जानते हैं कि , इसलिए हम कह सकते हैं कि μxj=dg1dηβjg(μ)=ln(μ)g1(η)=eηdeηdη=eη

μxj=E[y|x]xj=ex0+x1β1++xJβJβj

जो अंत में कुछ मूर्त का अर्थ है:

में एक बहुत छोटे परिवर्तन को देखते हुए , फिटेड द्वारा बदल जाता है ।xjy^y^βj

नोट: यह अनुमान वास्तव में 0.2 के रूप में बड़े बदलावों के लिए काम कर सकता है, यह इस बात पर निर्भर करता है कि आपको कितनी सटीकता की आवश्यकता है।

और अधिक परिचित इकाई परिवर्तन व्याख्या का उपयोग करते हुए, हमारे पास: जिसका अर्थ है

Δjy^=ex0+x1β1++(xj+1)βj++xJβJex0+x1β1++xJβJ=ex0+x1β1++xJβJ+βjex0+x1β1++xJβJ=ex0+x1β1++xJβJejβex0+x1β1++xJβJ=ex0+x1β1++xJβJ(ejβ1)

में एक इकाई परिवर्तन को देखते हुए , सज्जित द्वारा परिवर्तन ।वाई वाई ( β j - 1 )xjy^y^(ejβ1)

यहां ध्यान देने योग्य तीन महत्वपूर्ण टुकड़े हैं:

  1. भविष्यवक्ताओं में बदलाव का प्रभाव प्रतिक्रिया के स्तर पर निर्भर करता है।
  2. भविष्यवाणियों में एक योजक परिवर्तन प्रतिक्रिया पर एक गुणा प्रभाव पड़ता है।
  3. आप केवल उन्हें पढ़कर (जब तक आप अपने सिर में मनमाने ढंग से गणना नहीं कर सकते) गुणांक की व्याख्या नहीं कर सकते।

इसलिए आपके उदाहरण में, पीएच को 1 से बढ़ाने का प्रभाव को को बढ़ाना है ; कि करने के लिए, है गुणा द्वारा । ऐसा लगता है कि आपका परिणाम समय की किसी निश्चित इकाई (जैसे, एक सप्ताह) में आपके द्वारा देखे गए डार्ट्स की संख्या है। इसलिए यदि आप 6.7 के पीएच पर एक सप्ताह में 100 तिमाहियों का अवलोकन कर रहे हैं, तो नदी के पीएच को 7.7 तक बढ़ाने का मतलब है कि अब आप सप्ताह में 109 तिमाहियों को देखने की उम्मीद कर सकते हैं।y ( 0.09 - 1 ) y0.091.09lny^y^(e0.091) y^e0.091.09


मैंने यहाँ कुछ ट्वीक्स बनाये, @ssdecontrol। मुझे लगता है कि वे आपके पोस्ट को फॉलो करना थोड़ा आसान कर देंगे, लेकिन अगर आप उन्हें पसंद नहीं करते हैं, तो उन्हें मेरी माफी के साथ रोल करें।
गूँग - मोनिका

मैं आपको यह नहीं बता सकता कि मेरे जवाब से स्पष्ट रूप से मुझे उत्तर को संशोधित करने की आवश्यकता है। आप अभी भी किस उलझन में हैं?
छायाकार

रेखीय प्रतिगमन की तरह समीकरण में उन संख्याओं को प्लग करें
छायाकार

1
@skan नहीं, मेरा मतलब है । और एक एकल अवलोकन का प्रतिनिधित्व करने वाले यादृच्छिक चर हैं। , द्वारा अनुक्रमित एक वेक्टर है ; एक यादृच्छिक विशेषता है जो उस अवलोकन के लिए एक विशिष्ट विशेषता / प्रतिगामी / इनपुट / का प्रतिनिधित्व करता है। xE[y|x]xx j x jyxjxj
छायाकार

2
और इसे उखाड़ फेंके नहीं। एक बार जब आप एक जीएलएम में सभी टुकड़ों को समझ लेते हैं, तो यहां जोड़तोड़ केवल कैलकुलस सिद्धांतों का एक सीधा अनुप्रयोग है। यह वास्तव में उतना ही सरल है जितना कि आप जिस चर में रुचि रखते हैं उसके संबंध में व्युत्पन्न लेना।
छायाकार

3

मेरा सुझाव होगा कि एक छोटी सी ग्रिड बनाएं जिसमें दो नदियों के संयोजन और प्रत्येक कोवरिएट्स के दो या तीन मान हों, फिर predictअपने ग्रिड के साथ फ़ंक्शन का उपयोग करें newdata। फिर परिणामों को रेखांकन करें। यह उन मूल्यों को देखने के लिए बहुत स्पष्ट है जो वास्तव में मॉडल की भविष्यवाणी करते हैं। आप माप के मूल पैमाने पर भविष्यवाणियों को वापस बदलना या नहीं कर सकते हैं या नहीं कर सकते हैं type = "response"


1
जितना मुझे यह दृष्टिकोण पसंद है (मैं इसे हर समय करता हूं) मुझे लगता है कि यह समझ बनाने के लिए उल्टा है।
छायाकार
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.