इस बारे में कोई एकल उत्तर नहीं है कि किसी दिए गए डेटासेट के लिए सबसे अच्छा वर्गीकरण तरीका क्या है । किसी दिए गए डेटासेट पर तुलनात्मक अध्ययन के लिए विभिन्न प्रकार के क्लासिफायर का हमेशा विचार किया जाना चाहिए। डेटासेट के गुणों को देखते हुए, आपके पास कुछ सुराग हो सकते हैं जो कुछ तरीकों को वरीयता दे सकते हैं। हालांकि, यदि संभव हो तो सभी के साथ प्रयोग करना अभी भी उचित होगा।
Naive Bayes Classifier (NBC) और सपोर्ट वेक्टर मशीन (SVM) में प्रत्येक के लिए कर्नेल फ़ंक्शन की पसंद सहित विभिन्न विकल्प हैं। वे दोनों पैरामीटर ऑप्टिमाइज़ेशन के प्रति संवेदनशील हैं (यानी अलग-अलग पैरामीटर चयन उनके आउटपुट को बदल सकते हैं) । इसलिए, यदि आपके पास यह परिणाम है कि एनबीसी एसवीएम से बेहतर प्रदर्शन कर रहा है। यह केवल चयनित मापदंडों के लिए सही है। हालाँकि, एक और पैरामीटर चयन के लिए, आप पा सकते हैं कि SVM बेहतर प्रदर्शन कर रहा है।
सामान्य तौर पर, यदि एनबीसी में स्वतंत्रता की धारणा आपके डेटासेट के चर से संतुष्ट है और वर्ग ओवरलैपिंग की डिग्री छोटी है (यानी संभावित रैखिक निर्णय सीमा), तो एनबीसी को अच्छा हासिल होने की उम्मीद होगी। कुछ डेटासेट के लिए, रैपर फीचर के चयन के साथ अनुकूलन के साथ, उदाहरण के लिए, एनबीसी अन्य सहपाठियों को हरा सकता है। यहां तक कि अगर यह एक तुलनीय प्रदर्शन प्राप्त करता है, तो एनबीसी अपनी उच्च गति के कारण अधिक वांछनीय होगा।
सारांश में, हमें किसी भी वर्गीकरण पद्धति को पसंद नहीं करना चाहिए अगर यह एक संदर्भ में दूसरों से बेहतर प्रदर्शन करता है क्योंकि यह दूसरे में गंभीर रूप से विफल हो सकता है। ( डेटा मिनिंग प्रोब्लम में यह सामान्य है )।