मैं कुछ कर्नेल घनत्व अनुमान लगा रहा हूं, भारित बिंदुओं के सेट के साथ (यानी, प्रत्येक नमूने का वजन एक है जो आवश्यक नहीं है), एन आयामों में। इसके अलावा, ये नमूने सिर्फ एक मीट्रिक स्पेस में हैं (यानी, हम उनके बीच की दूरी को परिभाषित कर सकते हैं) लेकिन कुछ और नहीं। उदाहरण के लिए, हम नमूना बिंदुओं के माध्य का निर्धारण नहीं कर सकते हैं, न ही मानक विचलन, और न ही दूसरे की तुलना में एक चर। कर्नेल इस दूरी से प्रभावित होता है, और प्रत्येक नमूने का वजन:
इस संदर्भ में, मैं कर्नेल बैंडविड्थ लिए एक मजबूत अनुमान लगाने की कोशिश कर रहा हूं , संभवतः स्थानिक रूप से भिन्न, और अधिमानतः जो प्रशिक्षण डाटासेट पर एक सटीक पुनर्निर्माण देता है । यदि आवश्यक हो, तो हम मान सकते हैं कि फ़ंक्शन अपेक्षाकृत चिकनी है।
मैंने पहले या दूसरे निकटतम पड़ोसी से दूरी का उपयोग करने की कोशिश की लेकिन यह काफी बुरा परिणाम देता है। मैंने लीव-वन-आउट ऑप्टिमाइज़ेशन के साथ प्रयास किया, लेकिन मुझे एनडी में इस संदर्भ के लिए अनुकूलन करने के लिए एक अच्छा उपाय खोजने में कठिनाइयाँ हैं, इसलिए यह बहुत खराब अनुमान लगाता है, विशेष रूप से प्रशिक्षण नमूनों के लिए। मैं सामान्य अनुमान के आधार पर लालची अनुमान का उपयोग नहीं कर सकता क्योंकि मैं मानक विचलन की गणना नहीं कर सकता। मैं anisotropic गुठली पाने के लिए सहसंयोजक matrices का उपयोग कर संदर्भ मिला है, लेकिन फिर से, यह इस क्षेत्र में पकड़ नहीं होगा ...
किसी को एक विचार या एक संदर्भ है?