काज हानि बनाम लॉजिस्टिक नुकसान के फायदे और नुकसान / सीमाएं


14

काज हानि को का उपयोग करके परिभाषित किया जा सकता है और लॉग नुकसान को लॉग ( 1 + exp ( - y i w T x i ) के रूप में परिभाषित किया जा सकता है )अधिकतम(0,1-yमैंwटीएक्समैं)लॉग(1+exp(-yमैंwटीएक्समैं))

मेरे पास निम्नलिखित प्रश्न हैं:

  1. क्या काज के नुकसान के कोई नुकसान हैं (जैसे कि http://www.unc.edu/~yfliu/papers/rsvm.pdf में उल्लिखित आउटलेर्स के प्रति संवेदनशील )?

  2. एक की तुलना में दूसरे के अंतर, फायदे, नुकसान क्या हैं?

जवाबों:


22

लॉगरिदमिक नुकसान कम करने के लिए अच्छी तरह से व्यवहार किया जा सकता है संभाव्य आउटपुट।

काज हानि दोहरी पर कुछ (गारंटी नहीं) स्पार्सिटी की ओर जाता है, लेकिन यह संभाव्यता आकलन में मदद नहीं करता है। इसके बजाय, यह गर्भपात को दंडित करता है (यही कारण है कि मार्जिन निर्धारित करने के लिए यह बहुत उपयोगी है): कम हिंग-नुकसान मार्जिन मिसालिफिकेशन के पार कम हो जाता है।

इसलिए, संक्षेप:

  • लॉगरिदमिक नुकसान सटीकता की कीमत पर बेहतर संभावना आकलन की ओर जाता है

  • काज हानि से बेहतर सटीकता की संभावना होती है और संभाव्यता के बारे में बहुत कम संवेदनशीलता की कीमत पर कुछ विरलता होती है


1
+1। लॉजिस्टिक नुकसान को कम करना द्विपद की संभावना को अधिकतम करने से मेल खाता है। चुकता-त्रुटि हानि को कम करना, गाऊसी संभावना को अधिकतम करने से मेल खाता है (यह सिर्फ ओएलएस प्रतिगमन है; 2-वर्ग वर्गीकरण के लिए यह वास्तव में एलडीए के बराबर है)। क्या आप जानते हैं कि अगर कम से कम काज हानि किसी अन्य संभावना को अधिकतम करने से मेल खाती है? Ie वहाँ कोई संभावित मॉडल काज नुकसान के लिए इसी है?
अमीबा का कहना है कि

1
@amoeba यह एक दिलचस्प सवाल है, लेकिन एसवीएम स्वाभाविक रूप से सांख्यिकीय मॉडलिंग पर आधारित नहीं हैं। ऐसा कहने के बाद, Glen_b द्वारा इस उत्तर की जाँच करें । पूरा धागा इसके बारे में है, लेकिन इसके बजाय एप्सिलॉन-असंवेदनशील काज के लिए।
फायरबग

4

@Firebug का एक अच्छा जवाब था (+1)। वास्तव में, मेरे यहाँ एक समान प्रश्न था।

लगभग 0-1 नुकसान के लिए वर्गीकरण में विभिन्न नुकसान कार्यों को चुनने के प्रभाव क्या हैं

मैं सिर्फ लॉजिस्टिक लॉस के एक और बड़े फायदे पर और अधिक जोड़ना चाहता हूं: संभाव्य व्याख्या। एक उदाहरण, यहां पाया जा सकता है

विशेष रूप से, सांख्यिकी साहित्य में लॉजिस्टिक प्रतिगमन एक शास्त्रीय मॉडल है। (देखें, "लॉजिस्टिक रिग्रेशन" नाम का क्या अर्थ है? नामकरण के लिए।) लॉजिस्टिक लॉस से संबंधित कई महत्वपूर्ण अवधारणाएं हैं, जैसे कि अधिकतम संभावना लॉग अनुमान, संभावना अनुपात परीक्षण, साथ ही द्विपद पर मान्यताओं। यहाँ कुछ संबंधित चर्चाएँ हैं।

आर में संभावना अनुपात परीक्षण

लॉजिस्टिक रिग्रेशन को लॉजिस्टिक क्लासिफिकेशन क्यों नहीं कहा जाता है?

क्या लॉजिस्टिक रिग्रेशन पर विचार होता है?

लॉगिट और प्रोबेट मॉडल के बीच अंतर


1

चूँकि @ hxd1011 ने क्रॉस एन्ट्रॉपी का लाभ जोड़ा है, मैं इसकी एक खामी जोड़ूंगा।

क्रॉस एन्ट्रापी त्रुटि संभावना वितरणों के बीच कई दूरी उपायों में से एक है, लेकिन इसका एक दोष यह है कि लंबी पूंछ वाले वितरणों को खराब घटनाओं के साथ खराब तरीके से तैयार किया जा सकता है, जो अप्रत्याशित घटनाओं के लिए बहुत अधिक वजन होता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.