बेयस क्लासिफायर के साथ ऐसा क्यों है कि हम सबसे अच्छा प्रदर्शन प्राप्त कर सकते हैं जो हासिल किया जा सकता है? इसके लिए औपचारिक प्रमाण / स्पष्टीकरण क्या है?
आमतौर पर, एक डाटासेट डी से मिलकर माना जाता है n आईआईडी नमूने एक्समैं एक वितरण है कि आपके डेटा उत्पन्न की। एक नमूना दिया इसके बाद, आपको दिए गए आंकड़ों से एक भविष्य कहनेवाला मॉडल का निर्माण एक्समैं , तुम वर्ग की भविष्यवाणी च ( एक्स मैं ) है, जबकि नमूने के असली वर्ग है च ( एक्स मैं ) ।च^( x)मैं)च( x)मैं)
हालांकि, सिद्धांत रूप में, आप एक विशेष मॉडल का चयन करने के लिए नहीं तय कर सकता है च चुना , बल्कि पर विचार सभी संभव मॉडल च एक ही बार में और उन्हें एक में किसी भी तरह के गठबंधन बड़ा मॉडल एफ ।च^चुनाच^एफ^
बेशक, डेटा को देखते हुए, कई छोटे मॉडल्स काफी हद तक अनुचित या अनुचित हो सकते हैं (उदाहरण के लिए, मॉडल जो लक्ष्य के केवल एक मूल्य का अनुमान लगाते हैं, भले ही आपके डेटासेट डी में लक्ष्य के कई मूल्य हों )।
किसी भी मामले में, आप नए नमूनों के लक्ष्य मूल्य की भविष्यवाणी करना चाहते हैं, जो कि एक्समैं s के समान वितरण से तैयार किए गए हैं । एक अच्छा उपाय इ अपने मॉडल के प्रदर्शन की होगी
ई ( मॉडल ) = पी[ च( एक्स)) = मॉडल ( एक्स) ] ,
यानी, संभावना है कि आप एक बेतरतीब ढंग से नमूना के लिए सच लक्ष्य मूल्य का अनुमान है एक्स ।
बेयस फॉर्मूला का उपयोग करके, आप गणना कर सकते हैं कि क्या संभावना है कि एक नया सैंपल एक्स में टारगेट वैल्यू v , जिसे डेटा डी दिया गया है :
पी( V | डी ) = Σच^पी( वी ∣ एफ^) पी( च^∣ डी ) ।
उस पर जोर देना चाहिए
- आम तौर पर पी( वी ∣ एफ^) या तो है 0 या 1 , के बाद से च की एक नियतात्मक समारोह है एक्स ,च^एक्स
- आम तौर पर नहीं, लेकिन लगभग हर समय, यह असंभव अनुमान लगाने के लिए है पी( च^∣ डी ) (ऊपर उल्लिखित तुच्छ मामलों को छोड़कर),
- आम तौर पर नहीं है, लेकिन लगभग सभी समय, संभव मॉडलों की संख्या च बहुत बड़ा, के लिए ऊपरी राशि का मूल्यांकन किया जाना है।च^
इसलिए, यह प्राप्त करने के लिए / अनुमान बहुत कठिन है पी( v ∣ D ) अधिकांश मामलों में।
अब, हम Optimal Bayes क्लासिफायरियर की ओर आगे बढ़ते हैं। के लिए किसी दिए गए एक्स , यह मूल्य भविष्यवाणी
v = argmax वी Σ च पी ( v | च ) पी ( च | डी ) ।
के बाद से यह सब संभव लक्ष्य मूल्यों के बीच सबसे संभावित मूल्य है वी , इष्टतम Bayes वर्गीकारक प्रदर्शन को मापने अधिकतम ई ( च ) ।v^= अर्गमाक्सvΣच^पी( वी ∣ एफ^) पी( च^∣ डी ) ।
vई ( एफ^)
जैसा कि हम हमेशा अन्य सभी सहपाठियों के प्रदर्शन की तुलना करने के लिए एक बेंचमार्क के रूप में बेस क्लासिफायर का उपयोग करते हैं।
शायद, आप बेयस क्लासिफायर के भोले संस्करण का उपयोग करते हैं । यह लागू करना आसान है, ज्यादातर समय में अच्छी तरह से काम करता है, लेकिन केवल पी( v ∣ D ) एक भोले अनुमान की गणना करता है ।