आर में घनत्व फ़ंक्शन से संभाव्यता घनत्व फ़ंक्शन को खोजने / अनुमान लगाने का तरीका


17

मान लीजिए कि मेरे पास Xअज्ञात वितरण के समान एक चर है । मेथेमेटिका में, का उपयोग करके SmoothKernelDensityसमारोह हम एक अनुमान के अनुसार घनत्व function.This अनुमान घनत्व समारोह के साथ साथ इस्तेमाल किया जा सकता हो सकता है PDFकी तरह एक मूल्य की गणना करें प्रायिकता घनत्व समारोह के लिए समारोह Xके रूप में PDF[density,X]यह सोचते हैं कि "घनत्व" का नतीजा है SmoothKernelDensity। यह अच्छा होगा यदि R.This में ऐसी विशेषता है कि यह गणितज्ञ में कैसे काम करता है

http://reference.wolfram.com/mathematica/ref/SmoothKernelDistribution.html

एक उदाहरण के रूप में (गणित के कार्यों पर आधारित):

data = RandomVariate[NormalDistribution[], 100]; #generates 100 values from N(0,1)

density= SmoothKernelDistribution[data]; #estimated density

PDF[density, 2.345] returns 0.0588784 

यहाँ आप पीडीएफ के बारे में अधिक जानकारी पा सकते हैं:

http://reference.wolfram.com/mathematica/ref/PDF.html

मुझे पता है कि मैं density(X)आर में उपयोग करके इसके घनत्व फ़ंक्शन को प्लॉट कर सकता हूं और उपयोग करके ecdf(X)मैं इसके अनुभवजन्य संचयी वितरण फ़ंक्शन को प्राप्त कर सकता हूं। क्या आर में वही काम करना संभव है जो मैंने गणितज्ञ के बारे में बताया था?

किसी भी मदद और विचार की सराहना की है।


density(x)पीडीएफ का एक अनुमान देता है, जैसा कि आप पहले ही नोट कर चुके हैं, लेकिन इसकी उपयुक्तता उस उद्देश्य पर निर्भर करती है जिसके लिए आप घनत्व चाहते हैं। उदाहरण के लिए, ध्यान दें कि विचरण पक्षपाती है (कनवल्शन करने में, आप कर्नेल के विचरण को डेटा के विचरण में जोड़ते हैं, स्वयं एक निष्पक्ष अनुमान है) - ऐसे पूर्वाग्रह-विचरण ट्रेडऑफ़ सर्वव्यापी हैं। अन्य विकल्प हैं, जैसे कि लॉग-स्पेल घनत्व का अनुमान, उदाहरण के लिए - लेकिन फिर से, इसकी उपयुक्तता आंशिक रूप से इस बात पर निर्भर करती है कि आप इसके साथ क्या करना चाहते हैं।
Glen_b -Reinstate मोनिका

@Glen_b मैं वितरण में अन्य मूल्यों की संभावना खोजने के लिए अनुमानित घनत्व का उपयोग करना चाहता हूं। उदाहरण के लिए, मेरे पास 0 से 10. तक के डेटा का वेक्टर है। डेटा सेट में 0 और 10. के बीच केवल 70 अद्वितीय मूल्य हैं। मैं घनत्व को प्लॉट कर सकता हूं। अब मान लीजिए कि मैं X = 7.5 होने की संभावना को खोजने में दिलचस्पी रखता हूं, जो कि अवलोकन किए गए डेटा में नहीं है, एक यादृच्छिक नमूने में। मैं इसे कैसे प्राप्त कर सकता हूं? मुझे पता है कि ecdf(X)मुझे 7.5 के बराबर प्रतिशत मिलता है, लेकिन यह वह नहीं है जिसकी मुझे तलाश है।
अमीन

" X = 7.5 होने की संभावना ढूंढना " - आपकी समस्या है! या तो आपके पास एक निरंतर वितरण है (जिस स्थिति में वास्तविक उत्तर "0" है), या आप ऐसा नहीं करते हैं (जिस स्थिति में आपको घनत्व का उपयोग नहीं करना चाहिए, क्योंकि आपके पास घनत्व नहीं है)।
Glen_b -Reinstate मोनिका

1
ecdf(b)-ecdf(a)पी(<एक्स)<एक्स पी(एक्स=7.5)

1
क्षमा करें, यह एक त्रुटि थी। मेरा मतलब है कि मानों का नमूना अनुपात 7.5 है; मेरे बेटे ने मुझे विचलित कर दिया क्योंकि मैं शब्दों के अंतिम जोड़े को टाइप कर रहा था। किसी अप्राप्य घटना की संभावना का आपका नमूना अनुमान शून्य है। क्या आप पहले आवेदन करना चाहते थे? क्या आप एक बिंदु अनुमान के बजाय अनुपात के लिए एक आत्मविश्वास अंतराल चाहते हैं? आपका वास्तविक मुद्दा अभी तक कोई R मुद्दा नहीं है, आपका मुद्दा सही तरीके से यह बता रहा है कि आप वास्तव में क्या चाहते हैं। आपको शायद अपने प्रश्न को संपादित करना चाहिए, या एक नया पोस्ट करना चाहिए।
Glen_b -Reinstate मोनिका

जवाबों:


35

?densityबताते हैं कि यह approxपहले से ही रैखिक प्रक्षेप करने के लिए उपयोग करता है; ?approxबताते हैं कि approxfunएक उपयुक्त कार्य उत्पन्न करता है:

x <- log(rgamma(150,5))
df <- approxfun(density(x))
plot(density(x))
xnew <- c(0.45,1.84,2.3)
points(xnew,df(xnew),col=2)

यहाँ छवि विवरण दर्ज करें

integrateनमूने में न्यूनतम से नीचे एक उचित दूरी से शुरू करने का उपयोग करके (कई - 4 या 5, शायद - उपयोग किए जाने वाले बैंडविड्थ की - dfआमतौर पर एक उचित दूरी के लिए करते हैं), कोई भी उसी से संबंधित सीएफडी का एक अच्छा अनुमान प्राप्त कर सकता है। df


यह दिलचस्प है। ऐसा लगता है कि df(2.3)अनुमानित घनत्व फ़ंक्शन का मूल्य देता है, x=2.3लेकिन PDFगणितज्ञ में क्या करता है ऊपर के वक्र के नीचे क्षेत्र दे रहा है x=2.3। मुझे इस पर बिल्कुल यकीन नहीं है। यह सिर्फ मेरा अनुमान है। क्या आपने मैथेमेटिका में जो किया था, उसे फिर से तैयार करूं?
अमीन

प्रदर्शन के ऊपर मेरा कार्य "संभावना घनत्व फ़ंक्शन" ... "x पर मूल्यांकन" का कर्नेल-आधारित अनुमान देता है। या तो आप ऐसा चाहते हैं, या आप नहीं। यदि आप नहीं करते हैं, तो आपको यह समझाना होगा कि आप क्या चाहते हैं - सांख्यिकीय शब्दों में, न कि केवल 'इस व्यवहार को पुन: पेश करें'।
Glen_b -Reinstate मोनिका

मुझे लगता है कि मैंने गलती से और अनजाने में यह प्रचार किया है कि घनत्व संभावना है जो नहीं है। मुझे गुमराह होने का मतलब नहीं था। अगर आप सोचते हैं कि PDFगणितज्ञ आपके उत्तर में वर्णित वर्णन के लिए क्या करता है (यानी घनत्व मान का मान पा रहा है) तो मुझे लगता है कि मुझे अपना उत्तर मिल गया है। बस शब्दों का उपयोग करने पर कई भ्रम हैं!
अमीन

2
क्या से PDFपेज यह करता है कहते हैं, यह बात मैं कर उसी तरह दिखाए, लेकिन तरीकों इस मामले में यह अपनी गणना में उपयोग करता है कुछ हद तक और अधिक सटीक होने की संभावना है (थोड़ा महत्व है इस तरह के एक उद्देश्य के अतिरिक्त सटीकता के लिए हालांकि,)। प्रायिकता / घनत्व भेद की कुछ चर्चा के लिए, यहां और यहां देखें
Glen_b -Reinstate मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.