एक बहुभाषी समस्या और बहुभाषी समस्या के बीच अंतर क्या है?
एक बहुभाषी समस्या और बहुभाषी समस्या के बीच अंतर क्या है?
जवाबों:
मुझे संदेह है कि बहु-वर्ग समस्याओं में कक्षाएं परस्पर अनन्य हैं, जबकि बहु-लेबल समस्याओं के लिए प्रत्येक लेबल एक अलग वर्गीकरण कार्य का प्रतिनिधित्व करता है, लेकिन कार्य किसी तरह से संबंधित हैं (इसलिए उन्हें अलग-अलग करने के बजाय एक साथ निपटने में एक लाभ है। )। उदाहरण के लिए, प्रसिद्ध लेप्टोग्रैस्पस केकड़ों के डाटासेट में नर और केकड़े के दो रंगों के मादा के उदाहरण हैं। आप इसे चार वर्गों (पुरुष-नीले, महिला-नीले, पुरुष-नारंगी, महिला-नारंगी) या बहु-लेबल समस्या के रूप में देख सकते हैं, जहां एक लेबल पुरुष / महिला और दूसरा नीला होगा /संतरा। बहु-लेबल समस्याओं में अनिवार्य रूप से एक पैटर्न एक से अधिक वर्ग का हो सकता है।
बहुरंगी वर्गीकरण का मतलब दो से अधिक वर्गों के साथ एक वर्गीकरण कार्य है; उदाहरण के लिए, फलों की छवियों के एक समूह को वर्गीकृत करें जो संतरे, सेब या नाशपाती हो सकते हैं। मल्टीक्लास वर्गीकरण यह धारणा बनाता है कि प्रत्येक नमूना एक और केवल एक लेबल को सौंपा गया है: एक फल या तो एक सेब या नाशपाती हो सकता है लेकिन एक ही समय में दोनों नहीं।
मल्टीलेबेल वर्गीकरण प्रत्येक नमूने को लक्ष्य लेबल का एक सेट प्रदान करता है। यह एक डेटा-पॉइंट के गुणों की भविष्यवाणी के रूप में सोचा जा सकता है जो पारस्परिक रूप से अनन्य नहीं हैं, जैसे कि ऐसे विषय जो किसी दस्तावेज़ के लिए प्रासंगिक हैं। एक पाठ किसी भी समय धर्म, राजनीति, वित्त या शिक्षा के बारे में हो सकता है या इनमें से कोई भी नहीं हो सकता है।
Http://scikit-learn.org/stable/modules/multiclass.html से लिया गया
अन्य उत्तरों के पूरक के लिए, यहां कुछ आंकड़े दिए गए हैं। एक पंक्ति = एक नमूने के लिए अपेक्षित आउटपुट।
एक स्तंभ = एक वर्ग (एक गर्म एन्कोडिंग)
एक स्तंभ = एक वर्ग
आपने देखा:
एक साइड नोट के रूप में, कुछ भी आपको मल्टीआउटप-मल्टीस्केल्स वर्गीकरण समस्या से बचाता है , जैसे:
एक बहु-श्रेणी की समस्या में वर्गों में से एक परिमित, परस्पर-अनन्य संग्रह के उदाहरणों का असाइनमेंट है। उदाहरण के रूप में पहले से ही केकड़ों (@ डिक्रान) से दिए गए: पुरुष-नीले, महिला-नीले, पुरुष-नारंगी, महिला-नारंगी। इनमें से प्रत्येक दूसरों के अनन्य है और उन्हें व्यापक रूप से एक साथ लिया गया है।
मल्टी-लेबल समस्या का एक रूप इनको दो लेबल, सेक्स और रंग में विभाजित करना है; जहां लिंग पुरुष या महिला हो सकता है, और रंग नीला या नारंगी हो सकता है। लेकिन ध्यान दें कि यह मल्टी-लेबल समस्या का एक विशेष मामला है क्योंकि हर उदाहरण को हर लेबल मिलेगा (यानी हर केकड़े में सेक्स और रंग दोनों होते हैं)।
मल्टी-लेबल समस्याओं में अन्य मामले भी शामिल होते हैं जो एक चर संख्या के लिए प्रत्येक उदाहरण को असाइन करने की अनुमति देते हैं। उदाहरण के लिए, समाचार पत्र या वायर सेवा में एक लेख को NEWS, POLITICS, SPORTS, MEDICINE, आदि श्रेणियों में सौंपा जा सकता है। एक महत्वपूर्ण खेल प्रतियोगिता के बारे में एक कहानी में लेबल SPORTS का असाइनमेंट मिलेगा। एक और, एक विशेष खेल घटना से प्रकट होने वाले राजनीतिक तनावों को शामिल करते हुए, दोनों लेबल SPORTS और POLITICS प्राप्त कर सकते हैं। जहां मैं अमेरिका में हूं, सुपरबॉवेल के परिणामों को घटना के सामाजिक प्रभाव को देखते हुए SPORTS और NEWS दोनों को लेबल किया जाता है।
ध्यान दें कि लेबलिंग के इस रूप को, लेबल की चर संख्याओं के साथ, केकड़ों के साथ उदाहरण के समान रूप में फिर से तैयार किया जा सकता है; सिवाय इसके कि हर लेबल को LABEL-X या नॉट-LABEL-X माना जाता है। लेकिन सभी तरीकों को इस पुनरावर्तन की आवश्यकता नहीं होती है।
और एक और अंतर यह है कि मल्टी-लेबल समस्या के लिए मॉडल को विभिन्न वर्गों के बीच सहसंबंध सीखने की आवश्यकता होती है, लेकिन बहु-विषयक समस्याओं में विभिन्न वर्ग एक-दूसरे से स्वतंत्र होते हैं।