जवाबों:
KNN एक भेदभावपूर्ण एल्गोरिथ्म है क्योंकि यह किसी दिए गए वर्ग से संबंधित नमूने की सशर्त संभावना को मॉडल करता है । यह देखने के लिए कि कोई व्यक्ति kNN के निर्णय नियम को कैसे प्राप्त करता है।
एक क्लास लेबल बिंदुओं के एक सेट से मेल खाती है जो कि फीचर स्पेस में कुछ क्षेत्र से संबंधित हैं । आप वास्तविक संभावना वितरण से नमूना अंक, आकर्षित तो , स्वतंत्र रूप से, तो उस वर्ग से एक नमूना निकलने की संभावना है,
यदि आपके पास अंक हैं तो क्या होगा ? इस बात की संभावना कि अंक के क्षेत्र में आते हैं, द्विपद वितरण का अनुसरण करते हैं,
जैसा कि यह वितरण तेजी से चरम पर है, ताकि संभावना को इसके माध्य मान द्वारा अनुमानित किया जा सके । एक अतिरिक्त सन्निकटन यह है कि पर प्रायिकता वितरण लगभग स्थिर रहता है, जिससे व्यक्ति से अभिन्न रूप से अनुमानित कर सकता है, जहाँ की कुल मात्रा है क्षेत्र। इस सन्निकटन के तहत ।के आरपी=∫आरपी(एक्स)घएक्स≈पी(एक्स)वीवीपी(एक्स)≈कश्मीर
अब, यदि हमारे पास कई कक्षाएं हैं, तो हम प्रत्येक के लिए एक ही विश्लेषण दोहरा सकते हैं, जो हमें देगा, जहां वर्ग से बिंदुओं की मात्रा है जो उस क्षेत्र में आती है और वर्ग से संबंधित बिंदुओं की कुल संख्या है । सूचना ।
द्विपद वितरण के साथ विश्लेषण को दोहराते हुए, यह देखना आसान है कि हम पूर्व अनुमान लगा सकते हैं ।
नियम का उपयोग करते हुए, जो kNN के लिए नियम है।
@Jpmuc द्वारा उत्तर सटीक प्रतीत नहीं होता है। पीढ़ीगत मॉडल अंतर्निहित वितरण P (x / Ci) को मॉडल करते हैं और फिर बाद में संभावित संभावनाओं को खोजने के लिए बेयस प्रमेय का उपयोग करते हैं। यह वही है जो उस उत्तर में दिखाया गया है और फिर सटीक विपरीत निष्कर्ष निकालता है। : हे
KNN के लिए एक सामान्य मॉडल होने के लिए, हमें सिंथेटिक डेटा उत्पन्न करने में सक्षम होना चाहिए। ऐसा लगता है कि यह तब संभव है जब हमारे पास कुछ प्रारंभिक प्रशिक्षण डेटा हो। लेकिन बिना प्रशिक्षण डेटा के शुरू करना और सिंथेटिक डेटा बनाना संभव नहीं है। तो KNN जेनेरिक मॉडल के साथ अच्छी तरह से फिट नहीं है।
एक तर्क दे सकता है कि KNN एक भेदभावपूर्ण मॉडल है क्योंकि हम वर्गीकरण के लिए भेदभावपूर्ण सीमा खींच सकते हैं, या हम पीछे P (Ci / x) की गणना कर सकते हैं। लेकिन ये सभी जेनरेटर मॉडल के मामले में भी सही हैं। एक सच्चा विवेकशील मॉडल अंतर्निहित वितरण के बारे में कुछ नहीं बताता है। लेकिन KNN के मामले में हम अंतर्निहित वितरण के बारे में बहुत कुछ जानते हैं, infact हम पूरे प्रशिक्षण सेट का भंडारण कर रहे हैं।
तो ऐसा लगता है कि KNN जनरेटिव और भेदभावपूर्ण मॉडल के बीच का रास्ता है। संभवत: यही कारण है कि प्रतिष्ठित लेखों में केएनएन को किसी भी जनरेटिव या भेदभावपूर्ण मॉडल के तहत वर्गीकृत नहीं किया गया है। चलो उन्हें सिर्फ गैर पैरामीट्रिक मॉडल कहते हैं।
मैं एक किताब जो विपरीत (कहते हैं करवाते आ गए हैं यानी एक उत्पादक nonparametric वर्गीकरण मॉडल)
यह ऑनलाइन लिंक है: मर्फी द्वारा मशीन लर्निंग ए प्रोबेबिलिस्टिक पर्सपेक्टिव , केविन पी। (2012)
मैं मानता हूं कि kNN भेदभावपूर्ण है। कारण यह है कि यह स्पष्ट रूप से एक (संभावनावादी) मॉडल को स्टोर करने या सीखने की कोशिश नहीं करता है, जो डेटा की व्याख्या करता है (जैसा कि विरोध किया जाता है, उदाहरण के लिए बेव बेयस)।
Juampa भ्रमित मेरे द्वारा जवाब के बाद से, मेरी समझ के लिए, एक उत्पादक वर्गीकारक एक प्रयास (एक मॉडल का उपयोग कर जैसे) कैसे डेटा उत्पन्न होता है समझाने के लिए कि है, और है कि इसका जवाब कहना है कि यह है विवेकशील इस कारण की वजह से ...