संभावना घनत्व अंतराल का पता लगाएं


9

मेरे पास वेक्टर है

x <- c(1,2,3,4,5,5,5,6,6,6,6,
       7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,7,
       7,7,7,7,7,7,7,7,8,8,8,8,9,9,9,10)

(मेरे वास्तविक वेक्टर की लंबाई> 10,000 है) और मैं उन अंतरालों को खोजना चाहूंगा जहां 90% घनत्व निहित है। क्या quantile(x, probs=c(0.05,0.95), type=5)सबसे उपयुक्त है या कोई अन्य तरीका है?


आपका प्रश्न "जहां अंतराल ..." के बारे में थोड़ा अस्पष्ट है - कई अंतराल हो सकते हैं। क्या आप पूरी तरह से आंतरिक 90% में रुचि रखते हैं, यानी प्रत्येक तरफ सममित रूप से ट्रिमिंग? आखिरकार, न्यूनतम से 90% ile तक, 90% डेटा पर कब्जा कर लिया जाता है, इसी तरह 10% ile से अधिकतम मूल्य तक।
इटरेटर

क्या आप एक छोटे अंतराल, एक सममित अंतराल (प्रत्येक छोर से समान संभावना), या कुछ और देख रहे हैं?
Glen_b -Reinstate मोनिका

जवाबों:


19

जैसा कि ऊपर बताया गया है, अंतराल को परिभाषित करने के कई अलग-अलग तरीके हैं जिसमें 90% घनत्व शामिल है। एक जो अभी तक इंगित नहीं किया गया है वह उच्चतम [पोस्टीरियर] घनत्व अंतराल ( विकिपीडिया ) है, जिसे "सबसे कम अंतराल के लिए परिभाषित किया गया है जिसके लिए अंतिम बिंदुओं के अनुभवजन्य संचयी घनत्व फ़ंक्शन मानों में अंतर नाममात्र संभावना है"।

library(coda)
HPDinterval(as.mcmc(x), prob=0.9)

3

यह निश्चित रूप से सबसे सरल दृष्टिकोण की तरह लगता है। फंक्शन काफी तेज है। मैं इसका उपयोग हर समय उन नमूनों पर करता हूं जो आपके द्वारा उपयोग किए जा रहे सैकड़ों गुना बड़े हैं, और अनुमानों की स्थिरता आपके नमूना आकार में अच्छी होनी चाहिए।

अन्य पैकेजों में फ़ंक्शन हैं जो वर्णनात्मक आंकड़ों के अधिक पूर्ण सेट प्रदान करते हैं। मैं जो उपयोग करता हूं वह है Hmisc::describe, लेकिन describeफ़ंक्शन के साथ कई अन्य पैकेज हैं।


3

आपका रास्ता समझदार लगता है, विशेष रूप से उदाहरण में असतत डेटा के साथ,

quantile(x,probs=c(0.05,0.95), type=5)
 5% 95% 
2.8 9.0

लेकिन एक अन्य तरीका एक गणना घनत्व कर्नेल का उपयोग करना होगा:

dx <- density(x)
dn <- cumsum(dx$y)/sum(dx$y)
li <- which(dn>=0.05)[1]
ui <- which(dn>=0.95)[1]
dx$x[c(li,ui)]
[1] 2.787912 9.163246

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.