लॉजिस्टिक रिग्रेशन समस्या के लिए निर्णय_फंक्शन, प्रेडिक्ट_प्रब्बा और प्रेडिक्ट फंक्शन के बीच क्या अंतर है?


10

मैं स्केलेरन प्रलेखन से गुजर रहा हूं लेकिन मैं लॉजिस्टिक रिग्रेशन के संदर्भ में इन कार्यों के उद्देश्य को नहीं समझ पा रहा हूं। इसके लिए decision_functionयह कहता है कि हाइपरप्लेन और परीक्षण उदाहरण के बीच की दूरी। यह विशेष जानकारी कैसे उपयोगी है? और यह कैसे predictऔर predict-probaतरीकों से संबंधित है ?

जवाबों:


29

स्मरण करो कि लॉजिस्टिक प्रतिगमन का कार्यात्मक रूप है

f(x)=11+e(β0+β1x1++βkxk)

इसी से लौटा है predict_proba

घातांक के अंदर का शब्द

d(x)=β0+β1x1++βkxk

क्या द्वारा दिया जाता है decision_function। प्रलेखन में संदर्भित "हाइपरप्लेन" है

β0+β1x1++βkxk=0

यह शब्दावली समर्थन वेक्टर मशीनों से एक पकड़ है, जो शाब्दिक रूप से एक अलग हाइपरप्लेन का अनुमान लगाती है। लॉजिस्टिक रिग्रेशन के लिए यह हाइपरप्लेन एक कृत्रिम निर्माण का एक सा है, यह समान संभाव्यता का विमान है, जहां मॉडल ने निर्धारित किया है कि दोनों लक्ष्य वर्ग समान रूप से संभावित हैं।

predictसमारोह एक वर्ग नियम का उपयोग कर निर्णय देता है

f(x)>0.5

सोपबॉक्सिंग के जोखिम पर, predictफ़ंक्शन के बहुत कम वैध उपयोग हैं, और मैं दूसरों के काम की समीक्षा करते समय इसे त्रुटि के संकेत के रूप में उपयोग करता हूं। मैं इसे स्केलेरन में एक डिज़ाइन त्रुटि कहने के लिए काफी दूर जाऊँगा ( predict_probaफ़ंक्शन को कॉल किया जाना चाहिए था predict, और बुलाया predictजाना चाहिए था predict_class, अगर कुछ भी हो)।


उत्तर के लिए धन्यवाद @ मैथ्यू, लेकिन क्या आप इस बिंदु को थोड़ा और स्पष्ट कर सकते हैं "लॉजिस्टिक रिग्रेशन के लिए, यह हाइपरप्लेन थोड़ा कृत्रिम निर्माण है, यह समान संभावना का विमान है, जहां मॉडल ने निर्धारित किया है कि दोनों लक्ष्य वर्ग समान रूप से संभावना रखते हैं । " ?
15

यह स्पष्टीकरण रोचक और सहायक है। मेरी इच्छा है कि स्केलेरोन ने इसे बेहतर तरीके से समझाया। मुझे समझ में नहीं आ रहा है कि लॉजिस्टिक फ़ंक्शन 1 / (1 + e ^ -x) में x का मान जानने का क्या उपयोग है? सभी मैं सोच सकता है कि संभवतः x / (1+ x | |) की तरह एक अलग सिग्मॉइड फ़ंक्शन का उपयोग किया जाए। क्या यहां और है? धन्यवाद!
ldmtwo

मूल रूप से निर्णय फ़ंक्शन को लॉजिस्टिक रिग्रेशन में सिग्मोइड होना चाहिए था। सही बात?
3nomis

2
मुझे लगता है कि @ मैथ्यू एक साबुनबॉक्स पर होने का कारण यह है कि 0.5 का उपयोग करते हुए भविष्यवाणी के लिए दहलीज भोली है। पहली चीज जो करनी चाहिए वह है क्रॉस-वेलिडेशन, आरओसी कर्व्स और एयूसी का उपयोग करना सीखें ताकि एक उचित सीमा सी का चयन किया जा सके, और निर्णय फ़ंक्शन f (x)> c के रूप में उपयोग किया जा सके।
hwrd
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.