मैं एन-कक्षाओं में वस्तुओं के एक सेट को वर्गीकृत करने के लिए एक तंत्रिका नेटवर्क का प्रशिक्षण दे रहा हूं। प्रत्येक वस्तु एक ही समय में कई वर्गों (मल्टी-क्लास, मल्टी-लेबल) से संबंधित हो सकती है।
मैंने पढ़ा है कि बहु-वर्ग की समस्याओं के लिए आम तौर पर एमएमएस के बजाय हानि फ़ंक्शन के रूप में सॉफ्टमैक्स और श्रेणीबद्ध क्रॉस एन्ट्रापी का उपयोग करने की सिफारिश की जाती है और मैं समझता हूं कि कम या ज्यादा क्यों।
मल्टी-लेबल की मेरी समस्या के लिए यह निश्चित रूप से सॉफ्टमैक्स का उपयोग करने के लिए समझ में नहीं आएगा क्योंकि प्रत्येक वर्ग की संभावना दूसरे से स्वतंत्र होनी चाहिए। इसलिए मेरी अंतिम परत सिर्फ सिग्मॉइड इकाइयाँ हैं जो हर वर्ग के लिए एक संभाव्यता सीमा 0..1 में अपने इनपुट को स्क्वैश करती हैं।
अब मुझे यकीन नहीं है कि इसके लिए मुझे कौन से नुकसान का उपयोग करना चाहिए। श्रेणीगत क्रॉसेंट्रॉपी की परिभाषा को देखते हुए मेरा मानना है कि यह इस समस्या पर अच्छी तरह से लागू नहीं होगा क्योंकि यह केवल न्यूरॉन्स के उत्पादन को ध्यान में रखेगा जो 1 होना चाहिए और दूसरों की उपेक्षा करता है।
बाइनरी क्रॉस एन्ट्रापी लगता है जैसे यह बेहतर फिट होगा, लेकिन मैं केवल एक आउटपुट न्यूरॉन के साथ बाइनरी वर्गीकरण समस्याओं के लिए इसका उल्लेख करता हूं।
यदि यह मायने रखता है तो मैं प्रशिक्षण के लिए अजगर और केरस का उपयोग कर रहा हूं।