मैंने निम्नलिखित कोड का उपयोग करके एक लॉजिस्टिक रिग्रेशन बनाया है:
full.model.f = lm(Ft_45 ~ ., LOG_D)
base.model.f = lm(Ft_45 ~ IP_util_E2pl_m02_flg)
step(base.model.f, scope=list(upper=full.model.f, lower=~1),
direction="forward", trace=FALSE)
मैंने तब अंतिम मॉडल बनाने के लिए आउटपुट का उपयोग किया है:
final.model.f = lm(Ft_45 ~ IP_util_E2pl_m02_flg + IP_util_E2_m02_flg +
AE_NumVisit1_flg + OP_NumVisit1_m01_flg + IP_TotLoS_m02 +
Ft1_45 + IP_util_E1_m05_flg + IP_TotPrNonElecLoS_m02 +
IP_util_E2pl_m03_flg + LTC_coding + OP_NumVisit0105_m03_flg +
OP_NumVisit11pl_m03_flg + AE_ArrAmb_m02_flg)
तब मैंने पूर्वानुमान फ़ंक्शन का उपयोग करके डेटा के एक अलग सेट के लिए परिणामों की भविष्यवाणी की है:
log.pred.f.v <- predict(final.model.f, newdata=LOG_V)
मैं एक मनभावन आरओसी वक्र की स्थापना का उपयोग करने में सक्षम रहा हूं और संवेदनशीलता और विशिष्टता स्थापित करने के लिए एक तालिका बनाई है जो मुझे प्रतिक्रियाएं देती है जो मुझे उम्मीद है।
हालाँकि, मैं जो करने की कोशिश कर रहा हूँ वह डेटा की प्रत्येक पंक्ति के लिए स्थापित है, जिसकी सम्भावना फीट_45 की है। 1. यदि मैं log.pred.fv के आउटपुट को देखता हूँ, उदाहरण के लिए,:
1 -0.171739593
2 -0.049905948
3 0.141146419
4 0.11615669
5 0.07342591
6 0.093054334
7 0.957164383
8 0.098415639
.
.
.
104 0.196368229
105 1.045208447
106 1.05499112
जैसा कि मेरे पास केवल एक अस्थायी समझ है जो मैं कर रहा हूं मैं यह समझने के लिए संघर्ष कर रहा हूं कि नकारात्मक और उच्चतर 1 व्याख्या कैसे करें क्योंकि मैं 0 और 1 के बीच होने की संभावना की उम्मीद करूंगा।
तो मेरा सवाल यह है कि मैं सिर्फ एक कदम याद कर रहा हूं, जहां मुझे आउटपुट को बदलने की आवश्यकता है या क्या मैं पूरी तरह से गलत हो गया हूं। आप की पेशकश करने में सक्षम किसी भी मदद के लिए अग्रिम धन्यवाद।