कर्नेल घनत्व आकलन में कर्नेल बैंडविड्थ


10

मैं कुछ कर्नेल घनत्व अनुमान लगा रहा हूं, भारित बिंदुओं के सेट के साथ (यानी, प्रत्येक नमूने का वजन एक है जो आवश्यक नहीं है), एन आयामों में। इसके अलावा, ये नमूने सिर्फ एक मीट्रिक स्पेस में हैं (यानी, हम उनके बीच की दूरी को परिभाषित कर सकते हैं) लेकिन कुछ और नहीं। उदाहरण के लिए, हम नमूना बिंदुओं के माध्य का निर्धारण नहीं कर सकते हैं, न ही मानक विचलन, और न ही दूसरे की तुलना में एक चर। कर्नेल इस दूरी से प्रभावित होता है, और प्रत्येक नमूने का वजन:

(एक्स)=1।Σwमैंजीटीरोंमैं*Σwमैंजीटीमैं*आरnएल(मैंरोंटीnसी(एक्स,एक्समैं))

इस संदर्भ में, मैं कर्नेल बैंडविड्थ लिए एक मजबूत अनुमान लगाने की कोशिश कर रहा हूं , संभवतः स्थानिक रूप से भिन्न, और अधिमानतः जो प्रशिक्षण डाटासेट पर एक सटीक पुनर्निर्माण देता है । यदि आवश्यक हो, तो हम मान सकते हैं कि फ़ंक्शन अपेक्षाकृत चिकनी है।एक्समैं

मैंने पहले या दूसरे निकटतम पड़ोसी से दूरी का उपयोग करने की कोशिश की लेकिन यह काफी बुरा परिणाम देता है। मैंने लीव-वन-आउट ऑप्टिमाइज़ेशन के साथ प्रयास किया, लेकिन मुझे एनडी में इस संदर्भ के लिए अनुकूलन करने के लिए एक अच्छा उपाय खोजने में कठिनाइयाँ हैं, इसलिए यह बहुत खराब अनुमान लगाता है, विशेष रूप से प्रशिक्षण नमूनों के लिए। मैं सामान्य अनुमान के आधार पर लालची अनुमान का उपयोग नहीं कर सकता क्योंकि मैं मानक विचलन की गणना नहीं कर सकता। मैं anisotropic गुठली पाने के लिए सहसंयोजक matrices का उपयोग कर संदर्भ मिला है, लेकिन फिर से, यह इस क्षेत्र में पकड़ नहीं होगा ...

किसी को एक विचार या एक संदर्भ है?


यदि आप दूरी को माप सकते हैं, तो आप एक साधन को माप सकते हैं। क्या वह सही है? मैं कह सकता हूं कि "मैं शब्दों के लिए कोसाइन डिस्टेंस का उपयोग कर रहा हूं" इसलिए "ए का मतलब शब्द का वास्तव में बहुत अर्थ नहीं है", लेकिन मैं यह नहीं देखता कि यह अभी भी गणना क्यों नहीं की जा सकती है। आप कह सकते हैं कि आप एक सामान्य स्थान पर हैं, इसलिए इसका मतलब निरंतर मूल्यवान नहीं है। माध्य अपरिहार्य क्यों है?
EngrStudent

जवाबों:


3

शुरू करने के लिए एक स्थान सिल्वरमैन का निकटतम पड़ोसी अनुमानक होगा , लेकिन किसी तरह वजन में जोड़ सकता है। (मुझे यकीन नहीं है कि आपका वजन यहाँ के लिए क्या है।) निकटतम पड़ोसी विधि स्पष्ट रूप से दूरी के संदर्भ में तैयार की जा सकती है। मेरा मानना ​​है कि आपकी पहली और दूसरी निकटतम पड़ोसी विधि निकटतम-पड़ोसी विधि के संस्करण हैं, लेकिन कर्नेल फ़ंक्शन के बिना, और एक छोटे मूल्य के साथ ।


2

मैटलैब फाइल एक्सचेंज में, एक kde फ़ंक्शन होता है जो इस धारणा के साथ इष्टतम बैंडविड्थ प्रदान करता है कि गॉसियन कर्नेल का उपयोग किया जाता है: कर्नेल घनत्व अनुमानक

यहां तक ​​कि अगर आप मतलाब का उपयोग नहीं करते हैं, तो आप इष्टतम बैंडविड्थ की गणना करने की अपनी विधि के लिए इस कोड के माध्यम से पार्स कर सकते हैं। यह फ़ाइल विनिमय पर एक उच्च श्रेणीबद्ध फ़ंक्शन है और मैंने इसे कई बार उपयोग किया है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.