हां, रेग्युलराइजेशन का उपयोग सभी रैखिक तरीकों में किया जा सकता है, जिसमें प्रतिगमन और वर्गीकरण दोनों शामिल हैं। मैं आपको बताना चाहता हूं कि प्रतिगमन और वर्गीकरण के बीच बहुत अधिक अंतर नहीं हैं: एकमात्र अंतर नुकसान फ़ंक्शन है।
विशेष रूप से, रैखिक विधि के तीन प्रमुख घटक हैं, हानि फ़ंक्शन, नियमितीकरण, एल्गोरिदम । जहां नुकसान फ़ंक्शन प्लस नियमितीकरण अनुकूलन फॉर्म में समस्या का उद्देश्य फ़ंक्शन है और एल्गोरिथ्म इसे हल करने का तरीका है (उद्देश्य फ़ंक्शन उत्तल है, हम इस पोस्ट में चर्चा नहीं करेंगे)।
L(y^,y)=(y^−y)2L(y^,y)=|y^−y|L(⋅)yy^
L(y^,y)=log(1+exp(−y^y))L(y^,y)=(1−y^y)+y{−1,1}y^y^
नियमितीकरण सेटिंग में, आपने एल 1 और एल 2 नियमितीकरण के बारे में उल्लेख किया है, ऐसे अन्य रूप भी हैं, जिनकी चर्चा इस पोस्ट में नहीं की जाएगी।
इसलिए, एक उच्च स्तर में एक रैखिक विधि है
minimizew ∑x,yL(w⊤x,y)+λh(w)
यदि आप लॉजिंग फ़ंक्शन को रिग्रेशन सेटिंग से लॉजिस्टिक लॉस में बदल देते हैं, तो आपको लॉजिस्टिक रिग्रेशन को नियमित करने के साथ मिल जाता है।
उदाहरण के लिए, रिज प्रतिगमन में, अनुकूलन समस्या है
minimizew ∑x,y(w⊤x−y)2+λw⊤w
यदि आप नुकसान फ़ंक्शन को लॉजिस्टिक लॉस के साथ बदलते हैं, तो समस्या बन जाती है
minimizew ∑x,ylog(1+exp(−w⊤x⋅y))+λw⊤w
यहां आपको L2 नियमितीकरण के साथ लॉजिस्टिक रिग्रेशन है।
यह एक खिलौना संश्लेषित बाइनरी डेटा सेट में कैसा दिखता है। बाईं आकृति रैखिक मॉडल (निर्णय सीमा) वाला डेटा है। सही आंकड़ा उद्देश्य फ़ंक्शन समोच्च है (एक्स और वाई अक्ष 2 मापदंडों के लिए मूल्यों का प्रतिनिधित्व करता है।)। डेटा सेट दो गाऊसी से उत्पन्न हुआ था, और हम लॉजिस्टिक प्रतिगमन मॉडल को बिना अवरोधन के फिट करते हैं, इसलिए केवल दो पैरामीटर हैं जिन्हें हम सही उप-आकृति में कल्पना कर सकते हैं।
नीली रेखाएं नियमितीकरण के बिना लॉजिस्टिक प्रतिगमन हैं और काली रेखाएं एल 2 नियमितीकरण के साथ लॉजिस्टिक प्रतिगमन हैं। सही आंकड़े में नीले और काले बिंदु उद्देश्य फ़ंक्शन के लिए इष्टतम पैरामीटर हैं।
λ0
यहाँ एल 1 नियमितीकरण के साथ एक और उदाहरण है।
ध्यान दें कि, इस प्रयोग का उद्देश्य यह दर्शाने की कोशिश कर रहा है कि लॉजिस्टिक रिग्रेशन में नियमितीकरण कैसे काम करता है, लेकिन तर्क नहीं कि नियमित मॉडल बेहतर है।
λλ0
wxyy^=f(x)=w⊤x1
yy∈{−1,1}
y^=w⊤xy^yy^=w⊤x{−1,1}y^
y∈{0,1}
कोड मेरे अन्य उत्तर में यहां पाया जा सकता है।
क्या इस बात का कोई सहज स्पष्टीकरण है कि लॉजिस्टिक प्रतिगमन सही पृथक्करण मामले के लिए काम क्यों नहीं करेगा? और नियमितिकरण को जोड़ने से इसे ठीक क्यों किया जाएगा?