मैं एसवीएम वर्गीकरण सीख रहा हूं और एक समस्या का सामना कर रहा हूं। मुझे यकीन नहीं है कि इस दुविधा के लिए एक शब्दावली है।
मान लें कि हम एसवीएम द्वारा स्वस्थ लोगों (लिंग के दोनों) और जिगर के कैंसर वाले लोगों (दोनों लिंगों) के नमूने देकर रोगी को वर्गीकृत करना चाहेंगे। यदि हम स्वस्थ लोगों के नमूने को कक्षा 1 के रूप में और कक्षा 2 के कैंसर वाले लोगों को लेबल करते हैं, तो हम किसी भी नए रोगी की भविष्यवाणी करने के लिए एक बाइनरी एसवीएम को प्रशिक्षित कर सकते हैं और एक वर्गीकरण 1 प्राप्त कर सकते हैं। अब, एक और परिदृश्य छवि। मान लें कि हम एसवीएम वर्गीकरण से पहले लिंग द्वारा सभी नमूनों को विभाजित करते हैं। प्रत्येक लिंग के लिए, हम अभी भी स्वस्थ रोगियों बनाम कैंसर के रोगियों को 2 वर्गों में लेबल करते हैं और क्रमशः महिला और पुरुष नमूनों के लिए क्लासिफायर 2 और क्लासिफायर 3 प्राप्त करने के लिए एक द्विआधारी एसवीएम को प्रशिक्षित करते हैं। सवाल यह है कि क्या कोई नई महिला रोगी है, जिसे अधिक सटीक भविष्यवाणी प्राप्त करने के लिए, 1 या 2 का उपयोग करना चाहिए? यहाँ मेरे पास तर्कों के लिए दुविधा है
(1) जब नमूनों की संख्या बड़ी होती है, तो भविष्यवाणी अधिक सटीक होनी चाहिए। इस तर्क के आधार पर, वर्गीकरण 1 एक अच्छा विकल्प लगता है।
(२) हालाँकि, यदि हम पहले महिला और पुरुष समूहों में नमूने विभाजित करते हैं, तो नए रोगी (अज्ञात परीक्षण नमूना) के बाद से क्लासिफायर २ बेहतर विकल्प लगता है।
क्या इस तरह की दुविधा की शब्दावली है या किसी को कोई और जानकारी है या इस तरह की समस्या को कैसे हल किया जाए? मुझे यकीन भी नहीं है कि यह एक कानूनी सवाल है और पहले से भोले सवाल के लिए खेद है। धन्यवाद