उदाहरण: मेरे पास नौकरी के विवरण में एक वाक्य है: "यूके में जावा वरिष्ठ इंजीनियर"।
मैं इसे 2 श्रेणियों के रूप में भविष्यवाणी करने के लिए एक गहरे शिक्षण मॉडल का उपयोग करना चाहता हूं: English
और IT jobs
। यदि मैं पारंपरिक वर्गीकरण मॉडल का उपयोग करता हूं, तो यह केवल softmax
अंतिम स्तर पर फ़ंक्शन के साथ 1 लेबल की भविष्यवाणी कर सकता है । इस प्रकार, मैं दोनों श्रेणियों के साथ "हां" / "नहीं" की भविष्यवाणी करने के लिए 2 मॉडल तंत्रिका नेटवर्क का उपयोग कर सकता हूं, लेकिन अगर हमारे पास अधिक श्रेणियां हैं, तो यह बहुत महंगा है। तो क्या हमारे पास एक ही समय में 2 या अधिक श्रेणियों की भविष्यवाणी करने के लिए कोई deeplearning या मशीन लर्निंग मॉडल है?
"संपादित करें": पारंपरिक दृष्टिकोण से 3 लेबल के साथ, यह [1,0,0] द्वारा एन्कोड किया जाएगा, लेकिन मेरे मामले में, यह [1,1,0] या [1,1,1] द्वारा एन्कोड किया जाएगा
उदाहरण: यदि हमारे पास 3 लेबल हैं, और इन सभी लेबल के साथ एक वाक्य फिट हो सकता है। इसलिए अगर सॉफ्टमैक्स फ़ंक्शन से आउटपुट [0.45, 0.35, 0.2] है तो हमें इसे 3 लेबल या 2 लेबल में वर्गीकृत करना चाहिए, या एक हो सकता है? जब हम यह करते हैं तो मुख्य समस्या यह है: 1, या 2, या 3 लेबल में वर्गीकृत करने के लिए अच्छी सीमा क्या है?