पर्यवेक्षित अधिगम में संभाव्यता के लिए एक विश्वास स्तर को जांचने के लिए (एक एसवीएम या ओवरसम्प्ट डेटा का उपयोग करके एक निर्णय पेड़ से विश्वास को मैप करने के लिए) एक विधि प्लॉट की स्केलिंग (जैसे, बूस्टिंग के लिए कैलिब्रेटेड संभावनाओं को प्राप्त करना ) का उपयोग करना है।
मूल रूप से एक नक्शे के लिए लॉजिस्टिक प्रतिगमन का उपयोग करता है के लिए [ 0 ; १ ] । आश्रित चर ही सच्चा लेबल है और भविष्यवक्ता बिना पढ़े मॉडल से विश्वास है। जो मुझे समझ में नहीं आता है वह 1 या 0. के अलावा किसी अन्य लक्ष्य चर का उपयोग है। विधि एक नए "लेबल" के निर्माण के लिए कहता है:
सिग्मॉइड ट्रेन सेट पर ओवरफिटिंग से बचने के लिए, एक आउट-ऑफ-सैंपल मॉडल का उपयोग किया जाता है। देखते हैं तो सकारात्मक उदाहरण और एन - ट्रेन सेट में नकारात्मक उदाहरण के लिए, प्रत्येक प्रशिक्षण उदाहरण के लिए प्लैट अंशांकन लक्ष्य मूल्यों का उपयोग करता y + और y - (बजाय 1 और 0 क्रमशः), जहां y + = एन + + 1
मुझे समझ में नहीं आता कि यह नया लक्ष्य कैसे उपयोगी है। क्या लॉजिस्टिक रिग्रेशन केवल डिपेंडेंट वैरिएबल को एक बाइनरी लेबल (चाहे जो भी लेबल दिया गया हो) के इलाज के लिए जा रहा है?
अपडेट करें:
मैंने पाया एसएएस में से निर्भर बदल रहा है कि कुछ और ही मॉडल (का उपयोग कर में वापस लौट करने के लिए )। शायद मेरी त्रुटि या शायद एसएएस की बहुमुखी प्रतिभा की कमी है। मैं एक उदाहरण के रूप में आर में मॉडल को बदलने में सक्षम था:PROC GENMOD
data(ToothGrowth)
attach(ToothGrowth)
# 1/0 coding
dep <- ifelse(supp == "VC", 1, 0)
OneZeroModel <- glm(dep~len, family=binomial)
OneZeroModel
predict(OneZeroModel)
# Platt coding
dep2 <- ifelse(supp == "VC", 31/32, 1/32)
plattCodeModel <- glm(dep2~len, family=binomial)
plattCodeModel
predict(plattCodeModel)
compare <- cbind(predict(OneZeroModel), predict(plattCodeModel))
plot(predict(OneZeroModel), predict(plattCodeModel))