मुझे एयरलाइन उड़ानों के बारे में कुछ डेटा मिला है (नामक एक डेटा फ्रेम में flights
) और मैं यह देखना चाहूंगा कि क्या फ्लाइट के समय में काफी देरी से आने की संभावना पर कोई प्रभाव पड़ता है (मतलब 10 या अधिक मिनट)। मुझे लगा कि मैं भविष्यवाचक के रूप में उड़ान के समय के साथ लॉजिस्टिक रिग्रेशन का उपयोग करूंगा और प्रतिक्रिया के रूप में प्रत्येक उड़ान में काफी देरी हुई (बर्नोलीज़ का एक गुच्छा)। मैंने निम्नलिखित कोड का उपयोग किया है ...
flights$BigDelay <- flights$ArrDelay >= 10
delay.model <- glm(BigDelay ~ ArrDelay, data=flights, family=binomial(link="logit"))
summary(delay.model)
... लेकिन निम्न आउटपुट मिला।
> flights$BigDelay <- flights$ArrDelay >= 10
> delay.model <- glm(BigDelay ~ ArrDelay, data=flights, family=binomial(link="logit"))
Warning messages:
1: In glm.fit(x = X, y = Y, weights = weights, start = start, etastart = etastart, :
algorithm did not converge
2: In glm.fit(x = X, y = Y, weights = weights, start = start, etastart = etastart, :
fitted probabilities numerically 0 or 1 occurred
> summary(delay.model)
Call:
glm(formula = BigDelay ~ ArrDelay, family = binomial(link = "logit"),
data = flights)
Deviance Residuals:
Min 1Q Median 3Q Max
-3.843e-04 -2.107e-08 -2.107e-08 2.107e-08 3.814e-04
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) -312.14 170.26 -1.833 0.0668 .
ArrDelay 32.86 17.92 1.833 0.0668 .
---
Signif. codes: 0 â***â 0.001 â**â 0.01 â*â 0.05 â.â 0.1 â â 1
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 2.8375e+06 on 2291292 degrees of freedom
Residual deviance: 9.1675e-03 on 2291291 degrees of freedom
AIC: 4.0092
Number of Fisher Scoring iterations: 25
इसका क्या मतलब है कि एल्गोरिथ्म अभिसरण नहीं किया था? मैंने सोचा कि यह हो सकता है क्योंकि BigDelay
मूल्यों थे TRUE
और FALSE
बजाय 0
और 1
, लेकिन उसके बाद मैं सब कुछ परिवर्तित मैं एक ही त्रुटि मिली। कोई विचार?