Multiclass और Multilabel Problem में क्या अंतर है


52

एक बहुभाषी समस्या और बहुभाषी समस्या के बीच अंतर क्या है?


दोनों कार्य Vowpal Wabbit सॉफ्टवेयर पैकेज (कमांड-लाइन, पायथन बाइंडिंग उपलब्ध हैं) के साथ पूरा किया जा सकता है।
व्लादिस्लाव्स डोवेल्केस

मैंने इस अवधारणा को सीखा और इस पोस्ट के साथ अपनी समझ का निर्माण किया , उन्होंने बहु-लेबल वर्गीकरण को बहुत ही सुरुचिपूर्ण तरीके से समझाया।
user235077

जवाबों:


45

मुझे संदेह है कि बहु-वर्ग समस्याओं में कक्षाएं परस्पर अनन्य हैं, जबकि बहु-लेबल समस्याओं के लिए प्रत्येक लेबल एक अलग वर्गीकरण कार्य का प्रतिनिधित्व करता है, लेकिन कार्य किसी तरह से संबंधित हैं (इसलिए उन्हें अलग-अलग करने के बजाय एक साथ निपटने में एक लाभ है। )। उदाहरण के लिए, प्रसिद्ध लेप्टोग्रैस्पस केकड़ों के डाटासेट में नर और केकड़े के दो रंगों के मादा के उदाहरण हैं। आप इसे चार वर्गों (पुरुष-नीले, महिला-नीले, पुरुष-नारंगी, महिला-नारंगी) या बहु-लेबल समस्या के रूप में देख सकते हैं, जहां एक लेबल पुरुष / महिला और दूसरा नीला होगा /संतरा। बहु-लेबल समस्याओं में अनिवार्य रूप से एक पैटर्न एक से अधिक वर्ग का हो सकता है।


@Dirkran आपके स्पष्टीकरण के लिए धन्यवाद। क्या आप किसी अन्य स्रोत को जानते हैं, जहाँ मैं csie.ntu.edu.tw/~cjlin/libsvmtools/datasets/multilabel.html और mulan.siveforge.net/datasets.html
शिक्षार्थी

@ मुझे खेद है कि यह कुछ ऐसा नहीं है जिस पर मैंने बहुत काम किया है। आप मल्टी-टास्क लर्निंग पर एक नज़र डालना चाहते हैं, जिसमें मल्टी-लेबल लर्निंग की कुछ समानताएँ हैं। शायद इसके लिए इस्तेमाल किए जाने वाले कुछ डेटासेट बहु-लेबल सीखने के लिए बेंचमार्क के रूप में भी उपयोगी हो सकते हैं।
डिक्रान मार्सुपियल

26

बहुरंगी वर्गीकरण का मतलब दो से अधिक वर्गों के साथ एक वर्गीकरण कार्य है; उदाहरण के लिए, फलों की छवियों के एक समूह को वर्गीकृत करें जो संतरे, सेब या नाशपाती हो सकते हैं। मल्टीक्लास वर्गीकरण यह धारणा बनाता है कि प्रत्येक नमूना एक और केवल एक लेबल को सौंपा गया है: एक फल या तो एक सेब या नाशपाती हो सकता है लेकिन एक ही समय में दोनों नहीं।

मल्टीलेबेल वर्गीकरण प्रत्येक नमूने को लक्ष्य लेबल का एक सेट प्रदान करता है। यह एक डेटा-पॉइंट के गुणों की भविष्यवाणी के रूप में सोचा जा सकता है जो पारस्परिक रूप से अनन्य नहीं हैं, जैसे कि ऐसे विषय जो किसी दस्तावेज़ के लिए प्रासंगिक हैं। एक पाठ किसी भी समय धर्म, राजनीति, वित्त या शिक्षा के बारे में हो सकता है या इनमें से कोई भी नहीं हो सकता है।

Http://scikit-learn.org/stable/modules/multiclass.html से लिया गया


18

अन्य उत्तरों के पूरक के लिए, यहां कुछ आंकड़े दिए गए हैं। एक पंक्ति = एक नमूने के लिए अपेक्षित आउटपुट।

multiclass

एक स्तंभ = एक वर्ग (एक गर्म एन्कोडिंग)

यहाँ छवि विवरण दर्ज करें

Multilabel

एक स्तंभ = एक वर्ग

यहाँ छवि विवरण दर्ज करें


आपने देखा:

  • मल्टीलेबेल मामले में, एक नमूना को एक से अधिक वर्ग सौंपा जा सकता है।
  • बहुरंगी मामले में, कुल में 2 से अधिक कक्षाएं हैं।

एक साइड नोट के रूप में, कुछ भी आपको मल्टीआउटप-मल्टीस्केल्स वर्गीकरण समस्या से बचाता है , जैसे:

यहाँ छवि विवरण दर्ज करें


7

एक बहु-श्रेणी की समस्या में वर्गों में से एक परिमित, परस्पर-अनन्य संग्रह के उदाहरणों का असाइनमेंट है। उदाहरण के रूप में पहले से ही केकड़ों (@ डिक्रान) से दिए गए: पुरुष-नीले, महिला-नीले, पुरुष-नारंगी, महिला-नारंगी। इनमें से प्रत्येक दूसरों के अनन्य है और उन्हें व्यापक रूप से एक साथ लिया गया है।

मल्टी-लेबल समस्या का एक रूप इनको दो लेबल, सेक्स और रंग में विभाजित करना है; जहां लिंग पुरुष या महिला हो सकता है, और रंग नीला या नारंगी हो सकता है। लेकिन ध्यान दें कि यह मल्टी-लेबल समस्या का एक विशेष मामला है क्योंकि हर उदाहरण को हर लेबल मिलेगा (यानी हर केकड़े में सेक्स और रंग दोनों होते हैं)।

मल्टी-लेबल समस्याओं में अन्य मामले भी शामिल होते हैं जो एक चर संख्या के लिए प्रत्येक उदाहरण को असाइन करने की अनुमति देते हैं। उदाहरण के लिए, समाचार पत्र या वायर सेवा में एक लेख को NEWS, POLITICS, SPORTS, MEDICINE, आदि श्रेणियों में सौंपा जा सकता है। एक महत्वपूर्ण खेल प्रतियोगिता के बारे में एक कहानी में लेबल SPORTS का असाइनमेंट मिलेगा। एक और, एक विशेष खेल घटना से प्रकट होने वाले राजनीतिक तनावों को शामिल करते हुए, दोनों लेबल SPORTS और POLITICS प्राप्त कर सकते हैं। जहां मैं अमेरिका में हूं, सुपरबॉवेल के परिणामों को घटना के सामाजिक प्रभाव को देखते हुए SPORTS और NEWS दोनों को लेबल किया जाता है।

ध्यान दें कि लेबलिंग के इस रूप को, लेबल की चर संख्याओं के साथ, केकड़ों के साथ उदाहरण के समान रूप में फिर से तैयार किया जा सकता है; सिवाय इसके कि हर लेबल को LABEL-X या नॉट-LABEL-X माना जाता है। लेकिन सभी तरीकों को इस पुनरावर्तन की आवश्यकता नहीं होती है।


2

और एक और अंतर यह है कि मल्टी-लेबल समस्या के लिए मॉडल को विभिन्न वर्गों के बीच सहसंबंध सीखने की आवश्यकता होती है, लेकिन बहु-विषयक समस्याओं में विभिन्न वर्ग एक-दूसरे से स्वतंत्र होते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.