एक वर्गीकरण समस्या को हल करने के लिए एक विशिष्ट दृष्टिकोण उम्मीदवार मॉडल के एक वर्ग की पहचान करना है, और फिर क्रॉस सत्यापन जैसे कुछ प्रक्रिया का उपयोग करके मॉडल का चयन करना है। आमतौर पर कोई भी मॉडल को सबसे अधिक सटीकता के साथ चुनता है, या कुछ संबंधित फ़ंक्शन जो समस्या विशेष जानकारी को एन्कोड करता है, जैसे ।
अंतिम लक्ष्य मानते हुए एक सटीक क्लासिफायर (जहां सटीकता की परिभाषा फिर से, समस्या पर निर्भर है) का उत्पादन करना है, किन परिस्थितियों में उचित स्कोरिंग नियम का उपयोग करके मॉडल का चयन करना बेहतर होता है क्योंकि कुछ अनुचित के विपरीत, सटीकता, सटीक, याद के रूप में। , आदि? इसके अलावा, आइए मॉडल जटिलता के मुद्दों को अनदेखा करें और एक प्राथमिकता मानें कि हम सभी मॉडलों को समान रूप से मानते हैं।
पहले मैंने कभी नहीं कहा होगा। हम जानते हैं, एक औपचारिक अर्थ में, वर्गीकरण प्रतिगमन [1], [2] की तुलना में एक आसान समस्या है और हम बाद में ( ) की तुलना में पूर्व के लिए तंग सीमा प्राप्त कर सकते हैं । इसके अलावा, ऐसे मामले भी होते हैं जब संभावनाओं का सटीक मिलान करने का प्रयास गलत निर्णय सीमाओं या ओवरफिटिंग के परिणामस्वरूप हो सकता है । हालांकि, इस तरह के मुद्दों के संबंध में यहां बातचीत और समुदाय के मतदान पैटर्न के आधार पर , मैं इस दृष्टिकोण पर सवाल उठा रहा हूं।
- देवरोई, ल्यूक। पैटर्न मान्यता का एक संभाव्य सिद्धांत। वॉल्यूम। 31. स्प्रिंगर, 1996., धारा 6.7
- किर्न्स, माइकल जे।, और रॉबर्ट ई। शेपायर। संभाव्य अवधारणाओं के कुशल वितरण-मुक्त शिक्षण। कंप्यूटर विज्ञान, 1990 की नींव। कार्यवाही।, 31 वीं वार्षिक संगोष्ठी। IEEE, 1990।
यह कथन थोड़ा टेढ़ा हो सकता है। मेरा विशेष रूप से मतलब है कि दिए गए फ़ॉर्म को और , यह सशर्त संभाव्यता का सटीक अनुमान लगाने की तुलना में निर्णय सीमा का अनुमान लगाने में आसान लगता है।