के-एनएन जैसे स्थानीय तरीके कुछ स्थितियों में समझ में आते हैं।
एक उदाहरण जो मैंने स्कूल के काम में किया था, वह सीमेंट सामग्री के विभिन्न मिश्रणों की संपीड़ित शक्ति की भविष्यवाणी के साथ करना था। ये सभी सामग्रियां प्रतिक्रिया या एक-दूसरे के संबंध में अपेक्षाकृत गैर-वाष्पशील थीं और केएनएन ने इस पर विश्वसनीय भविष्यवाणियां कीं। दूसरे शब्दों में, स्वतंत्र चर में से किसी में भी वैयक्तिकृत रूप से या संभवत: पारस्परिक संपर्क द्वारा मॉडल को प्रदान करने के लिए बड़े पैमाने पर भिन्नता नहीं थी।
इसे नमक के एक दाने के साथ लें क्योंकि मुझे एक डेटा जांच तकनीक के बारे में नहीं पता है जो निर्णायक रूप से यह दिखाता है लेकिन सहज रूप से यह उचित लगता है कि यदि आपकी विशेषताओं में कुछ अनुपातों की भिन्नता है, तो मुझे नहीं पता कि क्या अनुपात है, आपके पास एक हो सकता है केएनएन उम्मीदवार। मैं निश्चित रूप से जानना चाहता हूं कि क्या इस प्रभाव के लिए कुछ अध्ययन और परिणामी तकनीकें विकसित हुईं।
यदि आप इसके बारे में सामान्यीकृत डोमेन के दृष्टिकोण से सोचते हैं, तो अनुप्रयोगों का एक व्यापक वर्ग है जहां 'समान' व्यंजनों के समान परिणाम मिलते हैं। यह निश्चित रूप से मिश्रण सीमेंट के परिणामों की भविष्यवाणी करने की स्थिति का वर्णन करने के लिए लग रहा था। मैं कहूंगा कि यदि आपके पास इस विवरण के अनुसार व्यवहार किया गया डेटा है और इसके अलावा आपकी दूरी को मापना भी हाथ में डोमेन के लिए स्वाभाविक था और अंतिम रूप से आपके पास पर्याप्त डेटा था, तो मुझे लगता है कि आपको KNN या किसी अन्य स्थानीय विधि से उपयोगी परिणाम प्राप्त करना चाहिए ।
जब आप स्थानीय तरीकों का उपयोग करते हैं तो आपको बेहद कम पूर्वाग्रह का लाभ मिल रहा है। कभी-कभी सामान्यीकृत योज्य मॉडल (GAM) संतुलन और भिन्नता को अलग-अलग रूप में KNN का उपयोग करके अलग-अलग करके फिटिंग करते हैं:
y^= च1( x)1) + च2( x)2) + ⋯ + चn( x)n) + ϵ
योज्य भाग (प्लस प्रतीक) उच्च विचरण से बचाता है जबकि स्थान पर KNN का उपयोग उच्च पूर्वाग्रह से बचाता है।चn( x)n)
मैं इतनी जल्दी KNN नहीं लिखूंगा। इसकी जगह है।