हमारे पास एक द्विआधारी परिणाम और कुछ कोवरिएट्स के साथ डेटा है। मैंने डेटा को मॉडल करने के लिए लॉजिस्टिक रिग्रेशन का इस्तेमाल किया। बस एक साधारण विश्लेषण, असाधारण कुछ भी नहीं। अंतिम आउटपुट एक खुराक-प्रतिक्रिया वक्र माना जाता है जहां हम दिखाते हैं कि एक विशिष्ट कोवरिएट के लिए संभावना कैसे बदलती है। कुछ इस तरह:
लॉजिस्टिक रिग्रेशन चुनने के लिए हमें एक आंतरिक समीक्षक (शुद्ध सांख्यिकीविद् नहीं) से कुछ आलोचना मिली। लॉजिस्टिक रिग्रेशन मानता है (या परिभाषित करता है) कि प्रायिकता स्केल पर S- आकार के वक्र का विभेदन बिंदु प्रायिकता 0.5 पर है। उन्होंने तर्क दिया कि यह मानने का कोई कारण नहीं होगा कि विभक्ति बिंदु वास्तव में संभाव्यता 0.5 पर था और हमें एक अलग प्रतिगमन मॉडल चुनना चाहिए जो विभक्ति बिंदु को ऐसे भिन्न करने की अनुमति देता है कि वास्तविक स्थिति डेटा चालित हो।
पहले तो मुझे उनकी दलील से बचना पड़ा, क्योंकि मैंने इस बिंदु पर कभी नहीं सोचा। मेरे पास कोई तर्क नहीं था कि यह मान लेना क्यों उचित होगा कि विभक्ति बिंदु 0.5 पर है। कुछ शोध करने के बाद, मेरे पास अभी भी इस प्रश्न का उत्तर नहीं है।
मैं 5-पैरामीटर लॉजिस्टिक प्रतिगमन में आया था, जिसके लिए विभक्ति बिंदु एक अतिरिक्त पैरामीटर है, लेकिन ऐसा लगता है कि इस प्रतिगमन मॉडल का उपयोग आमतौर पर खुराक-प्रतिक्रिया घटता है जब एक निरंतर परिणाम के साथ होता है। मुझे यकीन नहीं है कि यह द्विआधारी प्रतिक्रिया चर के लिए बढ़ाया जा सकता है और कैसे।
मुझे लगता है कि मेरा मुख्य प्रश्न यह क्यों या जब यह मान लेना ठीक है कि लॉजिस्टिक रिग्रेशन के लिए विभक्ति बिंदु 0.5 पर है? क्या इससे भी फर्क पड़ता है? मैंने कभी किसी को लॉजिस्टिक रिग्रेशन मॉडल को फिट करते हुए नहीं देखा और स्पष्ट रूप से विभक्ति बिंदु के मामले पर चर्चा की। क्या खुराक प्रतिक्रिया वक्र बनाने के लिए कोई विकल्प हैं जहां 0.5 पर विभक्ति बिंदु आवश्यक नहीं है?
पूर्णता के लिए, उपरोक्त चित्र बनाने के लिए R कोड:
dat <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv")
dat$rank <- factor(dat$rank)
logit <- glm(admit ~ gre + gpa + rank, family = binomial(link = "logit"), data = dat)
newdata <- data.frame(gre = seq(-2000,8000,1), gpa = 2.5, rank = factor(1,c(1,2,3,4)))
pp <- predict(logit, newdata, type = "response", se.fit = TRUE)
plot(newdata$gre, pp$fit, type="l", col="black", lwd=2,ylab="Probability", xlab="Dose")
1 संपादित करें:
स्कॉर्टची ने टिप्पणियों में से एक में कहा: बस समीक्षक ने तर्क दिया कि जैविक रूप से यह अधिक संभावना हो सकती है कि वक्रता में परिवर्तन 0.5 से पहले होता है। इसलिए यह मानने के खिलाफ कि प्रतिरोध बिंदु 0.5 पर है।
2 संपादित करें:
फ्रैंक हरेल की टिप्पणी की प्रतिक्रिया के रूप में:
उदाहरण के लिए, मैंने अपने मॉडल को एक द्विघात और एक घन शब्द को शामिल करने के लिए ऊपर संशोधित किया gre
(जो इस उदाहरण में "खुराक" है)।
logit <- glm(admit ~ gre+I(gre^2)+I(gre^3)+ gpa + rank, family = binomial(link = "logit"), data = dat)
newdata <- data.frame(admit=1, gre = seq(-2000,8000,1), gpa = 2.5, rank = factor(1,c(1,2,3,4)))
pp <- predict(logit, newdata, type = "response", se.fit = TRUE)
plot(newdata$gre, pp$fit, type="l", col="black", lwd=2,xlim=c(-2000,4000),ylab="Probability", xlab="Dose")
इस तथ्य के बावजूद कि gre
इस मामले में एक द्विघात और एक घन शब्द जोड़ना संभव नहीं है , हम देखते हैं कि खुराक-प्रतिक्रिया वक्र का रूप बदल गया है। वास्तव में अब हमारे पास लगभग 0.25 और 0.7 के पास दो विभक्ति बिंदु हैं।