लॉजिस्टिक रिग्रेशन को लॉजिस्टिक क्लासिफिकेशन क्यों नहीं कहा जाता है?


75

चूंकि लॉजिस्टिक रिग्रेशन एक सांख्यिकीय वर्गीकरण मॉडल है जो श्रेणीबद्ध निर्भर चर के साथ काम करता है, इसे लॉजिस्टिक वर्गीकरण क्यों नहीं कहा जाता है ? क्या "प्रतिगमन" नाम को निरंतर आश्रित चर से निपटने वाले मॉडल के लिए आरक्षित नहीं किया जाना चाहिए?


5
लॉजिस्टिक रिग्रेशन मॉडल के जीएलएम परिवार का है।
स्टीफन लॉरेंट

10
आप इसका उपयोग संभावनाओं को पुनः प्राप्त करने के लिए कर सकते हैं।
एमरे

25
जबकि लॉजिस्टिक रिग्रेशन निश्चित रूप से वर्गीकरण के लिए उपयोग किया जा सकता है, इसकी संभावनाओं पर एक सीमा का परिचय देकर, यह शायद ही इसका एकमात्र उपयोग है - या यहां तक ​​कि इसका प्राथमिक उपयोग भी। इसके लिए विकसित किया गया था - और इसका उपयोग - प्रतिगमन उद्देश्यों के लिए किया जाता है जिनका वर्गीकरण से कोई लेना-देना नहीं है। मेरा तर्क है कि यह अभी भी आसानी से है जो इसे ज्यादातर के लिए उपयोग किया जाता है, लेकिन मुझे लगता है कि यह इस बात पर निर्भर करता है कि आप क्या देखते हैं।
Glen_b

6
आपको यह पेपर लॉजिस्टिक रिग्रेशन के विकास पर दिलचस्प लग सकता है, खासकर जब से यह एक रिग्रेशन तकनीक के रूप में इस्तेमाल होने वाली समस्याओं के बारे में कुछ समझ देता है।
Glen_b

जवाबों:


102

लॉजिस्टिक रिग्रेशन सशक्त रूप से अपने आप में एक वर्गीकरण एल्गोरिथ्म नहीं है। यह एक निर्णय नियम के संयोजन में केवल एक वर्गीकरण एल्गोरिथ्म है जो परिणाम की अनुमानित संभावनाओं को द्विगुणित करता है। रसद प्रतिगमन है प्रतिगमन मॉडल है क्योंकि यह एक सुविधाओं के multilinear समारोह (एक के परिवर्तन) के रूप में वर्ग की सदस्यता की संभावना का आकलन करता।

फ्रैंक हैरेल ने इस वेबसाइट पर कई उत्तर पोस्ट किए हैं जो एक वर्गीकरण एल्गोरिथ्म के रूप में लॉजिस्टिक प्रतिगमन के संबंध में नुकसान की सूचना देते हैं। उनमें से:

यदि मैं सही ढंग से याद करता हूं, तो उसने एक बार मुझे इन (और अधिक!) बिंदुओं पर अधिक विस्तार के लिए प्रतिगमन रणनीतियों पर अपनी पुस्तक की ओर इशारा किया, लेकिन मैं उस विशेष पोस्ट को खोजने के लिए प्रतीत नहीं हो सकता।


1
अगर ऐसा है, तो सभी (या अधिकांश) सहपाठी वर्ग में पहले (जहाँ तक मुझे पता है) में होने की संभावनाओं की भविष्यवाणी करते हैं और फिर इस संभावना को कक्षाओं में बदल देते हैं .. क्या वे नहीं?
6

9
@ सामान्य प्रतिउत्तर: SVM कक्षा की संभावनाओं की गणना बिल्कुल नहीं करता है, यह सिर्फ एक अवलोकन और एक हाइपरप्लेन के बीच की दूरी को मापता है।
साइकोरैक्स 12

@ एमएल में पूरी तरह से इनको प्रोबेबिलिस्टिक क्लासिफायर कहा जाता है; पेड़ और बेतरतीब जंगल नहीं हैं, xgboost है - कम से कम लॉगलॉस के साथ)
seanv507

12

संक्षेप में, प्रतिगमन एक सशर्त अपेक्षा की गणना की समस्या है । डेटा कैसे उत्पन्न किया गया था, इस धारणा के आधार पर इस अपेक्षा से लिया गया रूप अलग है:E[Y|X=x]

  • आम तौर पर शास्त्रीय रेखीय प्रतिगमन के साथ पैदावार वितरित करने के लिए (Y | X = x) मान लें।
  • एक पॉइसन वितरण मानने से पॉइसन रिग्रेशन प्राप्त होता है।
  • बर्नौली वितरण मान लेने से लॉजिस्टिक रिग्रेशन प्राप्त होता है।

शब्द "रिग्रेशन" का उपयोग आम तौर पर इस से अधिक किया गया है, जिसमें क्वांटाइल रिग्रेशन जैसे दृष्टिकोण शामिल हैं, जो दिए गए परिमाण का अनुमान लगाता है ।(Y|X=x)


-3

पहले से ही प्रदान किए गए अच्छे उत्तरों के अलावा, एक और विचार यह है कि लॉजिस्टिक रिग्रेशन संभाव्यता (जो निरंतर मूल्य है ) की भविष्यवाणी करता है, जिसे 0 से 1 तक की सीमा मिली है ।

यहाँ छवि विवरण दर्ज करें

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.