मैं एक द्विपद उपस्कर प्रतिगमन का उपयोग करने के लिए पहचानता हूं कि यदि उपयोगकर्ता किसी वस्तु पर क्लिक करेगा has_x
या has_y
इसकी संभावना को प्रभावित करेगा या नहीं । मेरा मॉडल निम्नलिखित है:
fit = glm(formula = has_clicked ~ has_x + has_y,
data=df,
family = binomial())
मेरे मॉडल से यह आउटपुट:
Call:
glm(formula = has_clicked ~ has_x + has_y,
family = binomial(), data = active_domains)
Deviance Residuals:
Min 1Q Median 3Q Max
-0.9869 -0.9719 -0.9500 1.3979 1.4233
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -0.504737 0.008847 -57.050 < 2e-16 ***
has_xTRUE -0.056986 0.010201 -5.586 2.32e-08 ***
has_yTRUE 0.038579 0.010202 3.781 0.000156 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 217119 on 164182 degrees of freedom
Residual deviance: 217074 on 164180 degrees of freedom
AIC: 217080
Number of Fisher Scoring iterations: 4
जैसा कि प्रत्येक गुणांक महत्वपूर्ण है, इस मॉडल का उपयोग करके मैं यह बताने में सक्षम हूं कि इनमें से किसी भी संयोजन का मूल्य निम्नलिखित दृष्टिकोण का उपयोग कर रहा है:
predict(fit, data.frame(has_x = T, has_y=T), type = "response")
मुझे समझ नहीं आ रहा है कि मैं Std पर कैसे रिपोर्ट कर सकता हूँ। भविष्यवाणी की त्रुटि।
मैं तो बस का उपयोग करने की आवश्यकता है ? या क्या मुझे यहाँ वर्णित दृष्टिकोण का उपयोग करके एस ई को बदलने की आवश्यकता है ?
यदि मैं दोनों चर के लिए मानक-त्रुटि को समझना चाहता हूं तो मैं उस पर कैसे विचार करूंगा?
इस प्रश्न के विपरीत , मुझे यह समझने में दिलचस्पी है कि त्रुटि के ऊपरी और निचले सीमा एक प्रतिशत में क्या हैं। उदाहरण के लिए, मेरी भविष्यवाणी से पता चलता है True,True
कि मैं ३ can % का मान रख सकता हूं कि यह ९ ५ % सी I के लिए है ? (मेरी बात समझाने के लिए 0.3% चुना गया)