GLM में इंटरसेप्ट शब्द की व्याख्या कैसे करें?


20

मैं आर का उपयोग कर रहा हूं और मैं अपने डेटा का जीएलएम के साथ द्विपद लिंक के साथ विश्लेषण कर रहा हूं।

मैं जानना चाहता हूं कि आउटपुट टेबल में इंटरसेप्ट का मतलब क्या है। मेरे एक मॉडल के लिए अवरोधन काफी अलग है, हालांकि चर नहीं है। इसका क्या मतलब है?

इंटरसेप्ट क्या है। मुझे नहीं पता कि मैं सिर्फ खुद को भ्रमित कर रहा हूं, लेकिन इंटरनेट पर खोज कर रहा है, बस कुछ नहीं कह रहा है, यह है, इसे नोटिस करें ... या नहीं।

कृपया मदद करें, एक बहुत निराश छात्र


glm(formula = attacked_excluding_app ~ treatment, family = binomial, 
    data = data)
Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-2.3548   0.3593   0.3593   0.3593   0.3593  
Coefficients:
                         Estimate Std. Error z value Pr(>|z|)   
(Intercept)                 2.708      1.033   2.622  0.00874 **
treatmentshiny_non-shiny    0.000      1.461   0.000  1.00000

(Dispersion parameter for binomial family taken to be 1)
Null deviance: 14.963  on 31  degrees of freedom
Residual deviance: 14.963  on 30  degrees of freedom
(15 observations deleted due to missingness)
AIC: 18.963
Number of Fisher Scoring iterations: 5

1
लिंक फ़ंक्शन क्या है जिसे आप glm में निर्दिष्ट करते हैं?
टॉमस

5
अवरोधन निर्भर चर का अनुमानित मूल्य है जब सभी स्वतंत्र चर 0. हैं। आपके मॉडल के बारे में अधिक जानकारी के बिना, मैं यह नहीं कह सकता कि क्या यह आपके मामले में सार्थक है।
पीटर Flom - को पुनः स्थापित मोनिका

जवाबों:


21

अवरोधन अवधि, GLM समीकरण के रैखिक भाग में अवरोधन है, तो मतलब के लिए अपने मॉडल है है, जहां ग्राम आपके लिंक समारोह है और एक्स β अपने रेखीय मॉडल है। इस रैखिक मॉडल में एक "अवरोधन शब्द" है, अर्थात:[Y]=जी-1(एक्सβ)जीएक्सβ

एक्सβ=सी+एक्स1β1+एक्स2β2+

आपके मामले में अवरोधन काफी गैर-शून्य है, लेकिन चर नहीं है, इसलिए यह कह रहा है कि

एक्सβ=सी0

क्योंकि आपका लिंक फ़ंक्शन द्विपद है, तब

जी(μ)=ln(μ1-μ)

और इसलिए इंटरसेप्ट टर्म के साथ, आपके माध्य के लिए फिट मॉडल है:

[Y]=11+-सी

आप देख सकते हैं कि यदि तो यह Y = 1 या 0, यानी E [ Y ] = 1 प्राप्त करने के केवल 50:50 अवसर से मेल खाता हैसी=0[Y]=11+1=0.5

तो आपका परिणाम यह कह रहा है कि आप परिणाम की भविष्यवाणी नहीं कर सकते हैं, लेकिन एक वर्ग (1 या 0) अन्य की तुलना में अधिक संभावना है।


2
आपने मुझे E [Y] = .... :) से डरा दिया। उत्तर के लिए धन्यवाद, मैं करता हूं (दयालु) समझें कि आप क्या कह रहे हैं। आपने कहा कि इंटरसेप्ट सिग है। गैर-शून्य, लेकिन संस्करण। नहीं है, यह p = 1.00 है !? वैरिएबल पी-वैल्यू का क्या प्रभाव पड़ता है जो मैं रीसट के बारे में कह सकता हूं?
शमूएल वाल्ड्रॉन

2
यदि कोई चर p- मान छोटा नहीं है, तो आमतौर पर उस चर को मॉडल में शामिल नहीं किया जाएगा। आपके मामले में चर का गैर-शून्य मान होने का अनुमान भी नहीं है, इसलिए पी-मान 1.00 है। मूल रूप से "उपचार" और "अटैक_एक्सक्लूडिंग_एप्प" के बीच कोई संबंध नहीं है। रिश्ते की अनुपस्थिति यहाँ बहुत सही है कि यह लगभग संदिग्ध है, हालांकि आपके पास एक छोटा डेटासेट है। यह आपके डेटा को देखने के लायक हो सकता है, और यह देखना कि क्या यह उचित है।
Corone

2
+1 जवाब के लिए (और टिप्पणी में सुझाव दें कि डेटासेट में कुछ अजीब हो रहा है) हालांकि मैं आपकी टिप्पणी के उद्घाटन से असहमत हूं "यदि कोई चर पी-मान छोटा नहीं है, तो आमतौर पर उस चर को शामिल नहीं किया जाएगा।" नमूना।" यह जरूरी नहीं है - अक्सर कोई भी किसी रिश्ते की भयावहता की रिपोर्ट करना चाहता है, भले ही वह "महत्वपूर्ण" न हो और (अधिक से अधिक, यदि आप एक रिश्ते को शुरू करने के लिए मॉडलिंग करना चाहते थे, तो एक अशक्त परिणाम है) अभी भी रिपोर्ट करना महत्वपूर्ण है।)
जेम्स स्टेनली

1
@ नाम - बहुत अच्छा बिंदु, एक को हमेशा यह बताना चाहिए कि आपने कौन से चर का परीक्षण किया है - मुझे स्पष्ट होना चाहिए था, मेरा मतलब केवल यह था कि एक आम तौर पर उस चर को शामिल नहीं किया जाएगा जब एक पूर्वानुमान बनाने के लिए मॉडल का उपयोग करने की कोशिश की जाती है (क्योंकि आमतौर पर इसका मतलब होगा ओवरफिटिंग। )।
कोरोन

@Corone - मैं में / बहिष्कार चर और कम से धागा से उनके संबंध के बारे में यहाँ अपनी टिप्पणी में रुचि खासकर हूँ stats.stackexchange.com/questions/17624/...
rolando2

5

यह मुझे लगता है कि डेटा के साथ कुछ समस्या हो सकती है। यह अजीब है कि गुणांक के लिए पैरामीटर अनुमान 0.000 होगा। ऐसा लगता है कि आपके DV और आपके IV दोनों द्विभाजित हैं और आपके DV के अनुपात आपकी IV के साथ बिल्कुल भिन्न नहीं हैं। क्या यह सही है?

अवरोधन, जैसा कि मैंने अपनी टिप्पणी में उल्लेख किया है (और @corone के उत्तर का अर्थ है) का मान DV है जब IV 0. है। आपका IV कोड कैसे बनाया गया था? हालाँकि, यह तथ्य है कि गुणांक का अनुमान 0.000 है, इसका तात्पर्य है कि IV में कोई अंतर नहीं है।

लॉग(पी1-पी)


हाय वहाँ दोस्तों, फिर से टिप्पणी के लिए धन्यवाद। डेटा पॉइंट लगभग समान हैं। मैं इसे एक रिपोर्ट में बता रहा हूं और फिर भी इसे उजागर करना है। यही कारण है कि परिणाम अजीब लगते हैं। इस डेटा (GLM) और मेरी रिपोर्ट (GLMM) में अन्य डेटा सेट के साथ मैं चलने से पहले मैं (# TEAM2x2x2x2) पूरी तरह से चल रहा हूं। मुझे लगता है कि मेरी मुख्य समस्या यह जान रही है कि मुझे रिपोर्ट करने के लिए क्या चाहिए, क्या मैं इंटरसेप्ट के लिए या IV के लिए आंकड़ों का उल्लेख करता हूं? नीचे मेरा (उम्मीद है कि अधिक मानक) जीएलएमएम फिर से द्विपद लिंक के साथ है।
शमूएल वाल्ड्रॉन

लैप्लस सन्निकटन फॉर्मूला द्वारा सामान्यीकृत रैखिक मिश्रित मॉडल फिट: अटैक ~ ट्रीटमेंट + ट्रायल + ट्रीटमेंट * ट्रायल + (1 | बर्ड) डेटा: डेटा AIC BIC logLik deviance 139.6 153.8 -64.78 129.6 यादृच्छिक प्रभाव: समूह का नाम Variance Std.Dev बर्ड (अवरोधन) 0.87795 0.93699 अवलोकन की संख्या: 128, समूह: पक्षी, 32
शमूएल वाल्ड्रॉन

निश्चित प्रभाव: एसटीडी एसडी। त्रुटि z मान Pr (> | z |) (अवरोधक) 3.19504 0.90446 3.533 .000412 *** Treatmentshiny_non-shiny 0.02617 1.26964 0.021 .983558 परीक्षण -1.5383 0.36705 -4.192 2.76e-05 *** उपचार: परीक्षण 0.16909 0.49501 0.342-7327। --- सिगिफ। कोड: 0 ' ' 0.001 ' ' 0.01 ' ' 0.05 '।' 0.1 '' 1 निश्चित प्रभाव का सहसंबंध: (Intr) Trtm_- परीक्षण Trtmntshn_- -0.712 परीक्षण -0.895 0.638 Trtmnts _-: T 0.664 -0.896 -0.742
सैमुअल वाल्ड्रॉन

3

आपके मामले में, इंटरसेप्ट का भव्य मतलब है attacked_excluding_app, सभी डेटा की परवाह किए बिना treatment। गुणांक की तालिका में महत्व परीक्षण यह परीक्षण कर रहा है कि क्या यह शून्य से काफी अलग है। यह प्रासंगिक है या नहीं यह इस बात पर निर्भर करता है कि क्या आपके पास यह शून्य होने की उम्मीद करने के लिए कुछ प्राथमिक कारण है या नहीं।

उदाहरण के लिए, कल्पना कीजिए कि आपने रक्तचाप पर उनके प्रभाव के लिए एक दवा और एक प्लेसबो का परीक्षण किया था। प्रत्येक विषय के लिए, आप उनके रक्तचाप में परिवर्तन (उपचार के बाद दबाव - उपचार से पहले दबाव) की गणना करते हैं और इसे अपने विश्लेषण में निर्भर चर के रूप में मानते हैं। फिर आप पाते हैं कि उपचार का प्रभाव (ड्रग बनाम प्लेसीबो) गैर-महत्वपूर्ण है लेकिन यह कि अवरोधन काफी है> 0 - यह आपको बताएगा कि औसतन, दो माप समय के बीच आपके विषयों का रक्तचाप बढ़ गया। यह दिलचस्प हो सकता है और आगे की जांच की आवश्यकता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.