मंझला के लिए आत्मविश्वास अंतराल


40

मुझे मंझले और अन्य प्रतिशत पर 95% सीआई ढूंढना है। मैं नहीं जानता कि यह कैसे दृष्टिकोण है। मैं मुख्य रूप से R को एक प्रोग्रामिंग टूल के रूप में उपयोग करता हूं।

जवाबों:


31

यहाँ एक शास्त्रीय आर डाटासेट पर एक चित्रण है:

> x       = faithful$waiting
> bootmed = apply(matrix(sample(x, rep=TRUE, 10^4*length(x)), nrow=10^4), 1, median)
> quantile(bootmed, c(.025, 0.975))
2.5% 97.5% 
 73.5    77 

जो मंझला पर एक (73.5, 77) विश्वास अंतराल देता है।

( नोट: सही संस्करण, जॉन के लिए धन्यवाद । मैंने पहले में का उपयोग किया था, जिससे भ्रम पैदा हो गया था)103nrow


7
मुझे संदेह से संकुचित लगता है। कार्यों के उपयोग से library(boot)इसकी पुष्टि होती है:> boot.ci (बूट (x, फंक्शन (x, i) माध्यिका (x [i), R = 1000)) अंतराल: स्तर सामान्य बेसिक 95% (74.42, 78.22) (75.00) , 78.49) स्तर प्रतिशत BCA 95% (73.51, 77.00) (73.00, 77.00)
onestop

2
आपका स्वागत है शीआन ... एक तरफ के रूप में, मैं हमेशा मैट्रिक्स में मूल एन मान सेट करना पसंद करता हूं क्योंकि यह विभिन्न बूटस्ट्रैप आकारों में एक स्थिर है जो मैं बना सकता हूं। इसलिए, मैंने आमतौर पर ncol = लंबाई (x) कहा होगा। मुझे लगता है कि इस तरह से त्रुटि की संभावना कम है।
जॉन

6
यह द्विपदीय मात्राओं की गणना करने का सिर्फ एक अक्षम तरीका है जैसा कि ऑन्स्टॉप के उत्तर में है
whuber

30

एक अन्य दृष्टिकोण द्विपद वितरण की मात्राओं पर आधारित है।
उदाहरण के लिए:

> x=faithful$waiting
> sort(x)[qbinom(c(.025,.975), length(x), 0.5)]
[1] 73 77

4
मुझे यह एक की सादगी पसंद है ... परिणाम बूटस्ट्रैप विधि के करीब हैं।
डोमिनिक कोम्टिस

1
यह स्पष्ट रूप से निरंतर मामले के लिए बूटस्ट्रैपिंग की तुलना में बहुत अधिक कुशल है, लेकिन एक नुकसान यह है कि यह बंधी हुई रैंकों के लिए जिम्मेदार नहीं है। क्या आपको इसके लिए वर्कअराउंड का पता है?
अली_म

15

बूटस्ट्रैप को फिर से खोलना देखें। बूट फ़ंक्शन के लिए R मदद खोजें। आपके डेटा को रेज़मैपलिंग के आधार पर आप किसी भी चीज़ के लिए आत्मविश्वास के अंतराल का अनुमान लगा सकते हैं।


इस बात से सहमत। यह सबसे अच्छा तरीका है। मेरी राय में, बायोमेडिकल साइंसेज में।
pmjjones

10
जनसंख्या की मात्रा का अनुमान लगाने के लिए चिकने बूटस्ट्रैप को देखने पर विचार करें क्योंकि पारंपरिक बूस्ट के मामले में समस्या है - संदर्भ इस पीडीएफ में पाए जा सकते हैं । यदि आप केवल सैद्धांतिक मदीने में रुचि रखते थे, तो होजेस-लेहमन अनुमानक का उपयोग किया जा सकता है - जैसे कि, आर के wilcox.test(..., conf.int=TRUE)कार्य द्वारा प्रदान किया गया ।
काराकल

4

और अन्य दृष्टिकोण भी हैं: एक विलकॉक्सन रैंक पर आधारित है, निरंतरता सुधार के साथ एक नमूने के लिए लागू किया गया सम परीक्षण। आर में यह आपूर्ति की जा सकती है:

wilcox.test(x,conf.level=0.95,alternative="two.sided",correct=TRUE)

और डेविड ओलिव के सीआई के लिए यहां चर्चा की गई मंझला है:

मेडियन के लिए सी.आई.


1

Qbinom दृष्टिकोण के आधार पर परिणाम छोटे नमूनों के लिए सही नहीं है। मान लीजिए कि x में 10 घटक हैं। फिर क्यूबिनोम (सी (.025,। 975), 10, .5) 2 देता है और 8. परिणामस्वरूप अंतराल ऊपरी पूंछ से उन लोगों के साथ सममित रूप से निचले पूंछ के क्रम के आंकड़ों का इलाज नहीं करता है; आपको 2 और 9, या 3 और 8 मिलना चाहिए। सही उत्तर 2 और 9 है। आप एसएएस में खरीद के खिलाफ जांच कर सकते हैं। यहाँ पकड़ो आपको नीचे और ऊपर .025 संभावना से अधिक की आवश्यकता नहीं है; निचला क्वांटाइल ऐसा नहीं करता है, क्योंकि यह कम से कम .025 कम या कम देता है। आप नीचे की तरफ बच जाते हैं क्योंकि जो गिनती 1 होनी चाहिए, उसे दूसरे क्रम के आंकड़े के साथ मैप किया जाना चाहिए, 0 को गिनना चाहिए, और इसलिए "एक बंद" रद्द करें। यह पाक्षिक रद्द शीर्ष पर नहीं होता है, और इसलिए आपको यहां गलत उत्तर मिलता है। कोड सॉर्ट (x) [qbinom (c (.025,। 975), लंबाई (x),। 5) + c (0,1)] लगभग काम करता है, और .5 को अन्य क्वांटाइल के लिए विश्वास अंतराल प्राप्त करने के लिए अन्य मात्रात्मक मूल्यों द्वारा प्रतिस्थापित किया जा सकता है, लेकिन यह सही नहीं होगा जब कोई ऐसा मौजूद हो जो P [X <= a ] =। 025। देखें, पूर्व के लिए, हिगिंस, नॉनपामेट्रिक स्टेटिसिटेक।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.