ओपी गलती से मानता है कि इन दो कार्यों के बीच संबंध नमूनों की संख्या (यानी एकल बनाम सभी) के कारण है। हालाँकि, वास्तविक अंतर यह है कि हम अपने प्रशिक्षण लेबल का चयन कैसे करते हैं।
बाइनरी वर्गीकरण के मामले में हम लेबल दे सकते हैं या ।y= ± 1y= 0 , 1
जैसा कि पहले ही कहा जा चुका है, लॉजिस्टिक फ़ंक्शन एक अच्छा विकल्प है क्योंकि इसमें प्रायिकता का रूप है, अर्थात और के रूप में । यदि हम लेबल लेते हैं तो हम असाइन कर सकते हैं σ( z))σ( - z) = 1 - σ( z))σ( z)) ∈ ( 0 , 1 )z→ ± ∞y= 0 , 1
P ( y)= 1 | z)P ( y)= 0 | z)= σ( z)) = 11 + ई- z= 1 - σ( z)) = 11 + ईz
जिसे और अधिक कॉम्पैक्ट रूप से रूप में लिखा जा सकता है ।P ( y)| z) = σ( z))y( 1 - σ( z)) )1 - वाई
लॉग-लाइक को अधिकतम करना अधिक आसान है। लॉग-लाइक को अधिकतम करना नकारात्मक लॉग-लाइबिलिटी को कम करने के समान है। के लिए नमूने , प्राकृतिक लघुगणक और कुछ सरलीकरण लेने के बाद, हम पता लगाना होगा:मीटर{ एक्समैं, वाईमैं}
l ( z)) = - लॉग( ∏मैंमीटरP ( y)मैं| zमैं) ) = - ∑मैंमीटरलॉग( पी(वाई)मैं| zमैं) ) = ∑मैंमीटर−yizi+log(1+ezi)
इस जुपिटर नोटबुक पर पूर्ण व्युत्पत्ति और अतिरिक्त जानकारी पाई जा सकती है । दूसरी ओर, हमने इसके बजाय लेबल का उपयोग किया हो सकता है । यह स्पष्ट है कि तब हम असाइन कर सकते हैंy=±1
P(y|z)=σ(yz).
यह भी स्पष्ट है कि । इससे पहले कि हम इस मामले में कम से कम नुकसान समारोह के रूप में एक ही कदम के बादP(y=0|z)=P(y=−1|z)=σ(−z)
L ( z)) = - लॉग( ∏jमीटरP ( y)j| zj) ) = - ∑jमीटरलॉग( पी(वाई)j| zj) ) = ∑jमीटरलॉग( 1 + ई- yzj)
जहां हम पारस्परिक संकेत से प्रेरित होने वाले पारस्परिक कदम उठाने के बाद अंतिम चरण का अनुसरण करते हैं। जबकि हमें इन दो रूपों की बराबरी नहीं करनी चाहिए, यह देखते हुए कि प्रत्येक रूप में अलग-अलग मूल्य लेता है, फिर भी ये दोनों समान हैं:y
- yमैंzमैं+log(1+ezi)≡log(1+e−yzj)
मामला दिखाने के लिए तुच्छ है। यदि , तो बाएं हाथ की ओर और पर दाहिने हाथ की ओर।yi=1yi≠1yi=0yi=−1
जबकि मूलभूत कारण हो सकते हैं कि हमारे दो अलग-अलग रूप क्यों हैं (देखें कि दो अलग-अलग लॉजिस्टिक लॉस फॉर्मूलेशन / नोटेशन क्यों हैं? ), पूर्व चुनने का एक कारण व्यावहारिक विचार के लिए है। पूर्व में हम संपत्ति के का उपयोग तुच्छ रूप से और गणना करने के लिए कर सकते हैं , दोनों को अभिसरण विश्लेषण के लिए आवश्यक है (यानी हेस्सियन की गणना करके नुकसान फ़ंक्शन के उत्तलता का निर्धारण करने के लिए )।∂σ(z)/∂z=σ(z)(1−σ(z))∇l(z)∇2l(z)