"कर्नेल घनत्व का अनुमान" किस बात का दृढ़ संकल्प है?


25

मैं कर्नेल घनत्व के आकलन की बेहतर समझ प्राप्त करने की कोशिश कर रहा हूं।

विकिपीडिया से परिभाषा का उपयोग करना: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definment

f^(एक्स)=1nΣमैं=1nकश्मीर(एक्स-एक्समैं)=1nΣमैं=1nकश्मीर(एक्स-एक्समैं)

आइए को एक आयताकार फ़ंक्शन लेते हैं जो देता है यदि और बीच है और अन्यथा , और (विंडो का आकार) 1 है।1 x - 0.5 0.5 0 hकश्मीर()1एक्स-0.50.50

मैं समझता हूं कि घनत्व दो कार्यों का एक दृढ़ संकल्प है, लेकिन मुझे यकीन नहीं है कि मुझे पता है कि इन दोनों कार्यों को कैसे परिभाषित किया जाए। उनमें से एक को (शायद) डेटा का एक फ़ंक्शन होना चाहिए, जो आर के प्रत्येक बिंदु के लिए बताता है कि उस स्थान में हमारे पास कितने डेटा बिंदु हैं (ज्यादातर )। और दूसरे फ़ंक्शन को संभवतः विंडो आकार के साथ संयुक्त कर्नेल फ़ंक्शन का कुछ संशोधन करना चाहिए। लेकिन मुझे यकीन नहीं है कि इसे कैसे परिभाषित किया जाए।0

कोई सुझाव?

Bellow एक उदाहरण R कोड है, जो (मुझे संदेह है) मैं ऊपर बताई गई सेटिंग्स (दो गाऊसी और मिश्रण के साथ) को दोहराता हूं , जिस पर मुझे एक "प्रमाण" देखने की उम्मीद है कि जो कार्य किए जाने हैं, वे इस तरह से संदिग्ध हैं ।n=100

# example code:
set.seed(2346639)
x <- c(rnorm(50), rnorm(50,2))
plot(density(x, kernel='rectangular', width=1, n = 10**4))
rug(x)

यहाँ छवि विवरण दर्ज करें


3
तल पर आपका गलीचा कुछ मोटा अंतर्ज्ञान देता है। कल्पना करें कि प्रत्येक मूल्य से i = 1 से n एक संबद्ध वजन 1 / n के साथ एक स्पाइक है । अब अपने कर्नेल के आकार और चौड़ाई का उपयोग करके प्रत्येक स्पाइक को धब्बा दें, ताकि स्पाइक को उसी आकार और चौड़ाई पर ले जाया जाए, जिसकी ऊँचाई ऐसी हो कि नीचे का क्षेत्र 1 / n हो । परिणाम जोड़ें और आपके पास कर्नेल घनत्व का अनुमान है। xii=1n1/n1/n
निक कॉक्स

हाय निक, टिप्पणी के लिए धन्यवाद। इस अंतर्ज्ञान में मुझे पहले से ही मिला, यह औपचारिक रूप से परिणति के रूप में बदल रहा है जिसे मैं देखने के लिए उत्सुक था :) (मैं अब व्ह्यूबर के उत्तर से गुजरने के लिए उत्सुक हूं!)
ताल

जवाबों:


27

डेटा के किसी भी बैच के अनुरूप X=(x1,x2,,xn) इसका "अनुभवजन्य कार्य" है

fX(x)=1ni=1nδ(xxi).

इधर, δ एक "सामान्यीकरण समारोह है।" उस नाम के बावजूद, यह बिल्कुल भी एक फ़ंक्शन नहीं है: यह एक नई गणितीय वस्तु है जिसे केवल इंटीग्रल्स के भीतर ही उपयोग किया जा सकता है। इसके परिभाषित करने संपत्ति किसी भी कार्य के लिए वह यह है कि g के पड़ोस में निरंतर है कि कॉम्पैक्ट समर्थन के 0 ,

Rδ(x)g(x)dx=g(0).

(के लिए नाम δ "परमाणु" या "बिंदु" उपाय और "शामिल डिराक डेल्टा समारोह ।" निम्नलिखित गणना इस अवधारणा कार्यों में शामिल हैं के लिए बढ़ा दिया गया है g जो केवल एक तरफ से लगातार कर रहे हैं।)

fX इस लक्षण वर्णन का औचित्य है कि अवलोकन

xfX(y)dy=x1ni=1nδ(yxi)dy=1ni=1nxδ(yxi)dy=1ni=1nRI(yx)δ(yxi)dy=1ni=1nI(xix)=FX(x)

जहाँ FX सामान्य आनुभविक CDF है और I सामान्य विशेषता फ़ंक्शन ( 1 बराबर है जहाँ इसका तर्क सत्य है और 0 अन्यथा)। (मैं R पर परिभाषित कार्यों के लिए कॉम्पैक्ट समर्थन के कार्यों से स्थानांतरित करने के लिए आवश्यक एक प्राथमिक सीमित तर्क छोड़ता I ; क्योंकि मुझे केवल X की सीमा के भीतर मूल्यों के लिए परिभाषित करने की आवश्यकता है , जो कि कॉम्पैक्ट है, यह कोई समस्या नहीं है।)

के घुमाव के fX(x) किसी अन्य समारोह के साथ k के रूप में परिभाषा से, दिया जाता है,

(fXk)(x)=RfX(xy)k(y)dy=R1ni=1nδ(xyxi)k(y)dy=1ni=1nRδ(xyxi)k(y)dy=1ni=1nk(xix).

आज्ञाकारी kernels के लिए k(x)=Kh(x) (जो Kh(x) के समान है ) और अधिकांश कर्नेल सममित हैं) हम दावा किए गए परिणाम को प्राप्त करते हैं: विकिपीडिया सूत्र एक निश्चय है।


1
दो आयामों में स्थिति को (अधिक बोलचाल की शर्तों में) समझाया गया है और जीआईएस साइट पर gis.stackexchange.com/questions/14374/… पर चित्रित किया गया है
व्हिबर

1
प्रिय Whuber, मैं बस के माध्यम से चला गया और खुशी के साथ आपके जवाब पढ़ा! स्पष्टीकरण और विवरण के लिए बहुत बहुत धन्यवाद, आपके उत्तर (यह एक, और सामान्य रूप से आपके अन्य) वास्तव में प्रेरणादायक हैं। तुम्हारा, ताल
ताल गैलिली २३'१३ को

1
δg,xig(xi).

1
@whuber धन्यवाद। वाक्य सामान्यीकृत फ़ंक्शन function बिल्कुल एक फ़ंक्शन नहीं है: यह एक नया गणितीय ऑब्जेक्ट है जिसे केवल इंटीग्रल्स के भीतर ही उपयोग किया जा सकता है। इसे साफ कर दिया। हमेशा की तरह। ;)
जन वेनर

1
@ जान आपकी मदद के लिए धन्यवाद: मैंने इस उत्तर के भीतर उस विचार को शामिल किया है।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.