मैं कर्नेल घनत्व अनुमान करने के लिए R में ' घनत्व ' फ़ंक्शन का उपयोग करने का प्रयास कर रहा हूं । मैं के रूप में ऐसा लगता है वक्र के तहत क्षेत्र जरूरी 1. किसी भी के लिए नहीं है कुछ परेशानी परिणाम की व्याख्या और विभिन्न डेटासेट की तुलना कर रहा हूँ प्रायिकता घनत्व समारोह (पीडीएफ) , हम क्षेत्र की आवश्यकता है ∫ ∞ - ∞ φ ( x ) d x = 1 । मैं मान रहा हूं कि कर्नेल घनत्व का अनुमान पीडीएफ रिपोर्ट करता है। मैं उपयोग कर रहा हूँ integrate.xy से sfsmisc वक्र के तहत क्षेत्र अनुमान लगाने के लिए।
> # generate some data
> xx<-rnorm(10000)
> # get density
> xy <- density(xx)
> # plot it
> plot(xy)
> # load the library
> library(sfsmisc)
> integrate.xy(xy$x,xy$y)
[1] 1.000978
> # fair enough, area close to 1
> # use another bw
> xy <- density(xx,bw=.001)
> plot(xy)
> integrate.xy(xy$x,xy$y)
[1] 6.518703
> xy <- density(xx,bw=1)
> integrate.xy(xy$x,xy$y)
[1] 1.000977
> plot(xy)
> xy <- density(xx,bw=1e-6)
> integrate.xy(xy$x,xy$y)
[1] 6507.451
> plot(xy)
वक्र के नीचे का क्षेत्र हमेशा 1 नहीं होना चाहिए? ऐसा लगता है कि छोटे बैंडवादक एक समस्या हैं, लेकिन कभी-कभी आप विवरणों को पूंछों में दिखाना चाहते हैं और छोटे बैंडवाइड्स की आवश्यकता होती है।
अद्यतन / उत्तर:
> xy <- density(xx,n=2^15,bw=.001)
> plot(xy)
> integrate.xy(xy$x,xy$y)
[1] 1.000015
> xy <- density(xx,n=2^20,bw=1e-6)
> integrate.xy(xy$x,xy$y)
[1] 2.812398