बेयस क्लासिफायर आदर्श क्लासिफायरियर क्यों है?


11

यह आदर्श मामला माना जाता है जिसमें श्रेणियों को अंतर्निहित संभावना संरचना पूरी तरह से जानी जाती है।

बेयस क्लासिफायर के साथ ऐसा क्यों है कि हम सबसे अच्छा प्रदर्शन प्राप्त कर सकते हैं जो हासिल किया जा सकता है?

इसके लिए औपचारिक प्रमाण / स्पष्टीकरण क्या है? जैसा कि हम हमेशा अन्य सभी सहपाठियों के प्रदर्शन की तुलना करने के लिए एक बेंचमार्क के रूप में बेस क्लासिफायर का उपयोग करते हैं।

जवाबों:


9

बेयस क्लासिफायर के साथ ऐसा क्यों है कि हम सबसे अच्छा प्रदर्शन प्राप्त कर सकते हैं जो हासिल किया जा सकता है? इसके लिए औपचारिक प्रमाण / स्पष्टीकरण क्या है?

आमतौर पर, एक डाटासेट D से मिलकर माना जाता है n आईआईडी नमूने xi एक वितरण है कि आपके डेटा उत्पन्न की। एक नमूना दिया इसके बाद, आपको दिए गए आंकड़ों से एक भविष्य कहनेवाला मॉडल का निर्माण xi , तुम वर्ग की भविष्यवाणी ( एक्स मैं ) है, जबकि नमूने के असली वर्ग है ( एक्स मैं )f^(xi)f(xi)

हालांकि, सिद्धांत रूप में, आप एक विशेष मॉडल का चयन करने के लिए नहीं तय कर सकता है चुना , बल्कि पर विचार सभी संभव मॉडल एक ही बार में और उन्हें एक में किसी भी तरह के गठबंधन बड़ा मॉडल एफf^chosenf^F^

बेशक, डेटा को देखते हुए, कई छोटे मॉडल्स काफी हद तक अनुचित या अनुचित हो सकते हैं (उदाहरण के लिए, मॉडल जो लक्ष्य के केवल एक मूल्य का अनुमान लगाते हैं, भले ही आपके डेटासेट D में लक्ष्य के कई मूल्य हों )।

किसी भी मामले में, आप नए नमूनों के लक्ष्य मूल्य की भविष्यवाणी करना चाहते हैं, जो कि xi s के समान वितरण से तैयार किए गए हैं । एक अच्छा उपाय e अपने मॉडल के प्रदर्शन की होगी

(नमूना)=पी[(एक्स)=नमूना(एक्स)],
यानी, संभावना है कि आप एक बेतरतीब ढंग से नमूना के लिए सच लक्ष्य मूल्य का अनुमान है एक्स

बेयस फॉर्मूला का उपयोग करके, आप गणना कर सकते हैं कि क्या संभावना है कि एक नया सैंपल एक्स में टारगेट वैल्यू v , जिसे डेटा डी दिया गया है :

पी(v|डी)=Σ^पी(v|^)पी(^|डी)
उस पर जोर देना चाहिए

  • आम तौर पर पी(v|^) या तो है 0 या 1 , के बाद से की एक नियतात्मक समारोह है एक्स ,^एक्स
  • आम तौर पर नहीं, लेकिन लगभग हर समय, यह असंभव अनुमान लगाने के लिए है पी(^|डी) (ऊपर उल्लिखित तुच्छ मामलों को छोड़कर),
  • आम तौर पर नहीं है, लेकिन लगभग सभी समय, संभव मॉडलों की संख्या बहुत बड़ा, के लिए ऊपरी राशि का मूल्यांकन किया जाना है।^

इसलिए, यह प्राप्त करने के लिए / अनुमान बहुत कठिन है पी(v|डी) अधिकांश मामलों में।

अब, हम Optimal Bayes क्लासिफायरियर की ओर आगे बढ़ते हैं। के लिए किसी दिए गए एक्स , यह मूल्य भविष्यवाणी v = argmax वी Σ पी ( v | ) पी ( | डी ) के बाद से यह सब संभव लक्ष्य मूल्यों के बीच सबसे संभावित मूल्य है वी , इष्टतम Bayes वर्गीकारक प्रदर्शन को मापने अधिकतम ( )

v^=argmaxvΣ^पी(v|^)पी(^|डी)
v(^)

जैसा कि हम हमेशा अन्य सभी सहपाठियों के प्रदर्शन की तुलना करने के लिए एक बेंचमार्क के रूप में बेस क्लासिफायर का उपयोग करते हैं।

शायद, आप बेयस क्लासिफायर के भोले संस्करण का उपयोग करते हैं । यह लागू करना आसान है, ज्यादातर समय में अच्छी तरह से काम करता है, लेकिन केवल पी(v|डी) एक भोले अनुमान की गणना करता है ।


क्या बेयस क्लासिफायरियर (भोला बेयस नहीं है) बेयस इष्टतम क्लासिफायरियर के समान है ???? और पूर्व संभावना है? पी(v|)
रुईकी

@RuiQi मुझे नहीं लगता कि जैसे बात नहीं है करते Bayes वर्गीकारक। मैं अनुभवहीन बेयस क्लासिफायर और इष्टतम बेय्स क्लासिफायर से अवगत हूं।
एंटोनी

पी(v|^)v^

0

सीटीसीपी

एक्सएक्सएक्स

पी(सीटी=सीपी)=सब संभव एक्स(एक्स)पी(सीटी=सीपी|एक्स)एक्स

(एक्स)एक्स

एक्स

एक्सपी(सीटी=सीपी|एक्स)एक्स

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.