आर में लॉजिस्टिक रिग्रेशन आउटपुट की व्याख्या करना


13

मैं R का उपयोग करते हुए कई लॉजिस्टिक रिग्रेशन पर काम कर रहा हूं glm। भविष्यवक्ता चर निरंतर और श्रेणीबद्ध होते हैं। मॉडल के सारांश का एक उद्धरण निम्नलिखित दिखाता है:

Coefficients:
               Estimate Std. Error z value Pr(>|z|)
(Intercept)   2.451e+00  2.439e+00   1.005   0.3150
Age           5.747e-02  3.466e-02   1.658   0.0973 .
BMI          -7.750e-02  7.090e-02  -1.093   0.2743
...
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

विश्वास अंतराल:

                  2.5 %       97.5 %
(Intercept)  0.10969506 1.863217e+03
Age          0.99565783 1.142627e+00
BMI          0.80089276 1.064256e+00
...

विषम अनुपात:

                 Estimate Std. Error   z value Pr(>|z|)
(Intercept)  1.159642e+01  11.464683 2.7310435 1.370327
Age          1.059155e+00   1.035269 5.2491658 1.102195
B            9.254228e-01   1.073477 0.3351730 1.315670
...

पहला आउटपुट दिखाता है कि महत्वपूर्ण है। हालांकि, लिए विश्वास अंतराल में मूल्य 1 शामिल है और लिए अंतर अनुपात 1 के बहुत करीब है। पहले आउटपुट से महत्वपूर्ण पी-मूल्य क्या है? है परिणाम या नहीं के एक भविष्यवक्ता?AgeAgeAgeAge


8
यह केवल 10% आत्मविश्वास स्तर पर महत्वपूर्ण है, लेकिन आत्मविश्वास अंतराल 5% हैं।
निक सब्बे

तो 10% के लिए विश्वास अंतराल 1 तो शामिल नहीं होगा?
सब्रेवुल्फी

पी-मान (अंतिम कॉलम पहली तालिका) मौका है कि प्राप्त परिणाम या इससे भी बदतर हो जाएगा यदि अशक्त परिकल्पना सच थी। विश्वास अंतराल एक ऐसा क्षेत्र है जो 95% समय में सही मूल्य रखता है। यदि यह परिकल्पित सही मूल्य नहीं रखता है, तो सबसे अधिक 5% संभावना है कि हमें प्राप्त परिणाम या बदतर होगा, यदि परिकल्पना सच है। तो इससे आपका p- मान 5% से कम होगा। पी-वैल्यू और विश्वास अंतराल (आंकड़े 101) के बीच बहुत करीबी रिश्ता है। लेकिन संक्षेप में: हाँ, 10% के लिए CI में 1. शामिल होंगे
निक सब्बे

ऐसा प्रतीत होता है कि आप रैखिकता ग्रहण कर रहे हैं। यह कैसे उचित है?
फ्रैंक हारेल

जवाबों:


8

साइट पर यहां प्रश्नों का एक मेजबान है जो मॉडल आउटपुट की व्याख्या के साथ मदद करेगा (यहां तीन अलग-अलग उदाहरण हैं, 1 2 3 , और मुझे यकीन है कि संग्रह के माध्यम से खोदने पर और भी बहुत कुछ है)। यहां लॉजिस्टिक रिग्रेशन के लिए गुणांक की व्याख्या करने के तरीके पर यूसीएलए सांख्यिकी वेबसाइट पर एक ट्यूटोरियल भी है ।

यद्यपि आयु गुणांक के लिए अंतर-अनुपात एक के करीब है, यह जरूरी नहीं है कि इसका मतलब प्रभाव छोटा हो (चाहे प्रभाव छोटा हो या बड़ा अक्सर एक सामान्य प्रश्न है जितना कि यह एक अनुभवजन्य है)। अधिक सूचित राय बनाने के लिए टिप्पणियों के बीच उम्र में विशिष्ट भिन्नता जानने की आवश्यकता होगी।


ट्यूटोरियल के लिंक के लिए धन्यवाद, जो व्यापक दिखता है। मैंने अपना प्रश्न पोस्ट करने से पहले यहां खोजा था। लिंक 1 और 3 मेरे प्रश्न से संबंधित नहीं हैं।
सब्रेवॉल्फ़

@ सबेरेवॉल्फी, लिंक 1 और आगे की व्याख्या करें कि मूल इकाइयों के संदर्भ में गुणांक की व्याख्या कैसे करें, लिंक 3 संभावनाओं के संदर्भ में प्रभावों की व्याख्या करने के लिए चरणों का वर्णन करता है (जो वास्तव में आपके प्रश्न पर लागू होता है, और उस प्रश्न में सुझाए गए प्लॉट मेरे लिए एक उचित प्रतिक्रिया यह कहते हुए कि प्रत्यक्ष प्रभाव का आकार आयु में भिन्नता को जाने बिना व्याख्या करना कठिन है)।
एंडी डब्ल्यू

5
मान लें कि आयु को वर्षों में मापा जाता है, तो 1.059 का अंतर अनुपात 20 वर्ष की आयु और 50 वर्ष बीच के अंतर में अंतर को दर्शाता है । मैं इसे छोटा प्रभाव नहीं कहूंगा। हालाँकि, मुझे लगता है कि आप मनुष्यों के बारे में बात कर रहे थे। यदि इसके बजाय ये चूहे हैं तो 30 साल की अवधि बहुत मददगार नहीं है और आपको तदनुसार प्रभाव के आकार के मूल्यांकन को बदलने की आवश्यकता होगी। (1.059301)×100%=458%
Maarten Buis

यूसीएलए लिंक मृत है, लेकिन यह संभवतः मेल खाता है (कम से कम इसकी सामग्री मुझे इस प्रश्न को समझने में मदद करती है)।
एमबीआर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.