अनुकूली कर्नेल घनत्व अनुमानक?


12

क्या कोई अपने अनुभव पर एक अनुकूली कर्नेल घनत्व अनुमानक के साथ रिपोर्ट कर सकता है?
(कई पर्यायवाची शब्द हैं: अनुकूली | परिवर्तनशील | चर-चौड़ाई, केडीई | हिस्टोग्राम | इंटरपोलेटर ...)

परिवर्तनीय कर्नेल घनत्व अनुमान कहता है "हम नमूना स्थान के विभिन्न क्षेत्रों में कर्नेल की चौड़ाई भिन्न करते हैं। दो विधियाँ हैं ..." वास्तव में, अधिक: कुछ त्रिज्या के भीतर पड़ोसी, केएनएन निकटतम पड़ोसी (के आमतौर पर तय), केडी पेड़, मल्टीग्रिड ...
बेशक कोई एक तरीका सब कुछ नहीं कर सकता, लेकिन अनुकूली तरीके आकर्षक लगते हैं।
उदाहरण के लिए देखें परिमित तत्व विधि में एक अनुकूली 2d जाल की अच्छी तस्वीर ।

मैं यह सुनना चाहता हूं कि वास्तविक डेटा के लिए क्या काम किया / क्या नहीं किया, विशेष रूप से> 2 डी या 3 डी में 100k बिखरे हुए डेटा बिंदु।

2 नवंबर जोड़ा गया: यहां "क्लंपी" घनत्व (टुकड़ावाचक x ^ 2 * y ^ 2), निकटतम पड़ोसी अनुमान और स्कॉट के कारक के साथ गौसेन केडीई का एक भूखंड है। हालांकि एक (1) उदाहरण कुछ भी साबित नहीं करता है, यह दर्शाता है कि एनएन तेज पहाड़ियों को यथोचित रूप से फिट कर सकता है (और, केडी पेड़ों का उपयोग करके 2 डी, 3 डी में तेज है ...) वैकल्पिक शब्द


क्या आप "क्या काम करता है" या हाथ में अपनी परियोजना के विशेष लक्ष्यों से आपके मतलब के रूप में अलटेट अधिक संदर्भ दे सकते हैं। मैंने उन्हें स्थानिक बिंदु प्रक्रियाओं को देखने के लिए उपयोग किया है, लेकिन मुझे संदेह है कि यह प्रश्न पूछते समय आपके मन में क्या था।
एंडी डब्ल्यू

जवाबों:


7

लेख * डीजी टेरेल; डीडब्ल्यू स्कॉट (1992)। "चर कर्नेल घनत्व अनुमान"। सांख्यिकी 20: 1236-1265 का विवरण। * विकिपीडिया लेख के अंत में उद्धृत आप स्वयं स्पष्ट रूप से उल्लेख करते हैं कि जब तक कि अवलोकन स्थान बहुत विरल नहीं है, चर कर्नेल विधि को वैश्विक मूल माध्य चुकता त्रुटि (दोनों स्थानीय) के आधार पर अनुशंसित नहीं किया जाता है। (वैश्विक) गॉसियन के लिए यादृच्छिक चर वितरित: (सैद्धांतिक तर्क के माध्यम से) वे ( नमूना आकार है) और (बूटस्ट्रैपिंग परिणामों के माध्यम से) ( ) के आंकड़े का हवाला देते हैंn450np4p आयाम की संख्या) वह सेटिंग्स है जिसमें चर कर्नेल विधि निश्चित चौड़ाई वाले के साथ प्रतिस्पर्धी हो जाती है (आपके प्रश्न से आप इन सेटिंग्स में नहीं हैं)।

इन परिणामों के पीछे अंतर्ज्ञान यह है कि यदि आप बहुत विरल सेटिंग्स में नहीं हैं, तो, दक्षता में नुकसान से आगे निकलने के लिए पूर्वाग्रह में लाभ के लिए स्थानीय घनत्व पर्याप्त रूप से भिन्न नहीं होता है (और इसलिए चर चौड़ाई कर्नेल का एएमईएस सापेक्ष बढ़ जाता है तय चौड़ाई का AMISE)। इसके अलावा, आपके पास (और छोटे आयामों) बड़े आकार को देखते हुए, निश्चित चौड़ाई कर्नेल पहले से ही बहुत स्थानीय होगा, पूर्वाग्रह के मामले में किसी भी संभावित लाभ को कम कर देगा।


धन्यवाद Kwak। "" गॉसियन के लिए यादृच्छिक चर वितरित किए गए "; क्या आप "clumpy" वितरण के लिए नए काम के बारे में जानते हैं?
डेनिस

@ डेनिस:> 'क्लैपी' =? केंद्रित =? गॉसियन की तुलना में संकरी पूंछ के साथ?
user603

मैं कोई भी विशेषज्ञ नहीं हूं, लेकिन पेपर लैंग एट अल में "डेटा सेट क्लंपनेस" की तरह, "इनसाइट्स ऑन फास्ट कर्नेल डेंसिटी एस्टीमेशन एल्गोरिदम", 2004, 8 पी
डेनिस

@डेनिस:> मैं कहूंगा कि यह समस्या को सबसे खराब बनाता है (यानी एनएन कर्नेल को कम क्लैपी डेटा पर बेहतर काम करना चाहिए)। मेरे पास एक सहज स्पष्टीकरण है, लेकिन यह यहां फिट नहीं होगा, साथ ही आप इसे मुख्य बोर्ड पर एक अलग सवाल (इस एक को लिंक करना) के रूप में पूछना चाह सकते हैं।
उपयोगकर्ता 603

0

-1

ढीला / नीचा मूल रूप से एक चर केडीई विधि है, जिसमें करीबी की चौड़ाई निकटतम-पड़ोसी दृष्टिकोण द्वारा निर्धारित की जाती है। मैंने पाया है कि यह किसी भी निश्चित-चौड़ाई वाले मॉडल की तुलना में बहुत अच्छा काम करता है, जब डेटा बिंदुओं का घनत्व स्पष्ट रूप से भिन्न होता है।

केडीई और बहुआयामी डेटा से अवगत होना एक बात है जो आयामीता का अभिशाप है। अन्य चीजें बराबर होती हैं, जब p ~ 10 की तुलना में सेट त्रिज्या के भीतर बहुत कम अंक होते हैं, तो p ~ 2. यदि आपके पास केवल 3 डी डेटा है, तो यह आपके लिए समस्या नहीं हो सकती है, लेकिन यह ध्यान में रखना है।


3
Loess एक चर कर्नेल क्षेत्र विधि है। चर कर्नेल डेंसिटी अनुमान के बारे में पूछा गया प्रश्न।
रोब हंडमैन

उफ़, तुम सही हो। प्रश्न को टाल दें।
होंग ओई

@ रब, मेरे भोले प्रश्नों का बहाना करें: यदि अलग-अलग कर्नेल चौड़ाई है (कभी-कभी) स्थानीय प्रतिगमन / कर्नेल को चौरसाई के लिए अच्छा है, तो घनत्व के आकलन के लिए यह बुरा क्यों है? क्या घनत्व अनुमान f () == घनत्व () के लिए f () आकलन का मामला नहीं है?
डेनिस

@ हाँग ओईई, आपने जो नीडिम का उपयोग किया है, उसमें कितने अंक हैं? धन्यवाद
Denis

@Denis। बड़ा सवाल है। क्या आप कृपया इसे साइट पर एक उचित प्रश्न के रूप में जोड़ सकते हैं और हम देखेंगे कि लोग क्या जवाब दे सकते हैं।
रोब हंडमैन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.