यहाँ दो अलग-अलग प्रश्न प्रतीत होते हैं, जिन्हें मैं विभाजित करने का प्रयास करूँगा:
1) कैसे केएस, कर्नेल स्मूथिंग, केडीई से अलग है, कर्नेल घनत्व अनुमान? खैर, कहते हैं कि मेरे पास एक अनुमानक / चिकनी / प्रक्षेपक है
est( xi, fi -> gridj, estj )
और xi पर "वास्तविक" डेन्सिटीफ () को जानने के लिए भी होता है। फिर रनिंग
est( x, densityf )
को डेन्सिटीफ () का अनुमान देना चाहिए: एक केडीई। यह अच्छी तरह से हो सकता है कि केएस और केडीई का अलग-अलग तरह से मूल्यांकन किया जाता है - अलग चिकनाई मानदंड, अलग मानदंड - लेकिन मुझे मौलिक अंतर नहीं दिखता है। मुझे किसकी याद आ रही है ?
2) कैसे आयाम आकलन या समरेखण को प्रभावित करता है, intuitivly ? यहाँ एक खिलौना उदाहरण है, बस अंतर्ज्ञान की मदद करने के लिए। एक समान ग्रिड में N = 10000 अंक के एक बॉक्स पर विचार करें, और एक खिड़की, एक पंक्ति या वर्ग या घन, W = 64 अंक के भीतर:
1d 2d 3d 4d
---------------------------------------------------------------
data 10000 100x100 22x22x22 10x10x10x10
side 10000 100 22 10
window 64 8x8 4x4x4 2.8^4
side ratio .64 % 8 % 19 % 28 %
dist to win 5000 47 13 7
यहां "साइड रेश्यो" विंडो साइड / बॉक्स साइड है, और "जीतने के लिए डिस्टेंस" बॉक्स में एक यादृच्छिक बिंदु के साथ यादृच्छिक रूप से रखी गई विंडो की औसत दूरी का अनुमान है।
क्या इसका कोई मतलब है? (एक तस्वीर या एप्लेट वास्तव में मदद करेगा: कोई भी?)
विचार यह है कि एक निश्चित-आकार के बॉक्स के भीतर एक निश्चित आकार की खिड़की में बॉक्स के बाकी हिस्सों में 1d 2d 3 डी 4 डी में बहुत भिन्नता है। यह एक समान ग्रिड के लिए है; शायद आयाम पर मजबूत निर्भरता अन्य वितरणों को वहन करती है, शायद नहीं। वैसे भी, यह एक मजबूत सामान्य प्रभाव की तरह दिखता है, जो आयामीता के अभिशाप का एक पहलू है।