1st-centile का नमूना वितरण प्राप्त करने के लिए बूटस्ट्रैप का उपयोग करना


9

मेरे पास आबादी से एक नमूना (आकार 250) है। मुझे जनसंख्या के वितरण की जानकारी नहीं है।

मुख्य प्रश्न: मैं जनसंख्या के 1 सेंट- परसेंटाइल का एक बिंदु अनुमान चाहता हूं , और फिर मैं अपने बिंदु अनुमान के आसपास 95% विश्वास अंतराल चाहता हूं।

मेरा बिंदु अनुमान नमूना 1 सेंट- परसेंटाइल होगा। मैं इसे निरूपित करता हूं ।x

उसके बाद, मैं बिंदु अनुमान के आसपास विश्वास अंतराल बनाने की कोशिश करता हूं। मुझे आश्चर्य है कि अगर यह यहाँ बूटस्ट्रैप का उपयोग करने के लिए समझ में आता है। मैं बूटस्ट्रैप के साथ बहुत अनुभवहीन हूं, इसलिए यदि मैं उपयुक्त शब्दावली आदि का उपयोग करने में विफल रहता हूं तो क्षमा करें।

यहाँ है कि मैं इसे करने की कोशिश की। मैं अपने मूल नमूने से प्रतिस्थापन के साथ 1000 यादृच्छिक नमूने खींचता हूं। मैं उनमें से प्रत्येक से 1 सेंट- परसेंटाइल प्राप्त करता हूं। इस प्रकार मेरे पास 1000 अंक हैं - "1 सेंट- स्पर्सेन्टाइल"। मैं इन 1000 अंकों के अनुभवजन्य वितरण को देखता हूं। मैं इसका मतलब हूं । मैं एक "पूर्वाग्रह" को निम्नानुसार दर्शाता हूं: । मैं मूल नमूने के 1 सेंट- प्रतिसेंटाइल के आसपास 95% विश्वास अंतराल को कॉल करने के निचले बिंदु और उच्च अंत को प्राप्त करने के लिए 1000 अंक के 2.5 वें- केंद्रापसारक और 97.5 वें प्रतिशत को लेता हूं। मैं इन बिंदुओं को निरूपित करता हूं और ।xmeanbias=xmeanxx0.025x0.975

अंतिम शेष चरण मूल नमूने के 1 सेंट- उप-केंद्र के बजाय जनसंख्या के 1 सेंट- प्रति-व्यक्ति के आसपास होने के लिए इस आत्मविश्वास अंतराल को अनुकूलित करना है । इस प्रकार मैं को निचले छोर के रूप में और को ऊपरी छोर के रूप में जनसंख्या के 1 सेंट- परसेंटाइल के बिंदु अनुमान के आसपास 95% विश्वास अंतराल । यह आखिरी अंतराल है जो मैं चाह रहा था।xbias(xmeanx0.025)xbias+(x0.975xmean)

मेरी राय में, एक महत्वपूर्ण बिंदु यह है कि क्या यह 1 सेंट के लिए बूटस्ट्रैप का उपयोग करने के लिए समझ में आता है, जो कि आबादी के अज्ञात अंतर्निहित वितरण की पूंछ के करीब है। मुझे संदेह है कि यह समस्याग्रस्त हो सकता है; न्यूनतम (या अधिकतम) के आसपास एक विश्वास अंतराल के निर्माण के लिए बूटस्ट्रैप का उपयोग करने के बारे में सोचें।

लेकिन शायद यह दृष्टिकोण त्रुटिपूर्ण है? कृपया मुझे बताओ।

संपादित करें:

समस्या के बारे में थोड़ा और सोचने के बाद, मैं देखता हूं कि मेरा समाधान निम्नलिखित है: मूल नमूने का अनुभवजन्य 1 सेंट प्रतिशत जनसंख्या का 1 सेंट प्रतिशतक का पक्षपाती अनुमानक हो सकता है । और यदि ऐसा है, तो बिंदु का अनुमान पूर्वाग्रह-समायोजित होना चाहिए: । अन्यथा पूर्वाग्रह-समायोजित आत्मविश्वास अंतराल, पूर्वाग्रह-अनियोजित बिंदु अनुमान के अनुरूप नहीं होगा। मुझे बिंदु अनुमान और विश्वास अंतराल या उनमें से कोई भी दोनों को समायोजित करने की आवश्यकता है।xbias

यदि, दूसरी ओर, मैंने अनुमान को पक्षपाती नहीं होने दिया, तो मुझे पूर्वाग्रह समायोजन नहीं करना पड़ेगा। यही है, मैं को बिंदु अनुमान के रूप में ले लूंगा और निचले सिरे के रूप में और 95% के ऊपरी छोर के रूप में। विश्वास अंतराल। मुझे यकीन नहीं है कि क्या यह अंतराल समझ में आता है ...xx(xmeanx0.025)x+(x0.975xmean)

तो क्या यह मानने का कोई मतलब है कि नमूना 1 सेंट प्रतिशतक जनसंख्या 1 सेंट प्रतिशत का एक पक्षपाती अनुमान है ? और यदि नहीं, तो क्या मेरा वैकल्पिक समाधान सही है?


: यह सीधे बूटस्ट्रैप प्रश्न का समाधान नहीं है, लेकिन यह आप के लिए उपयोगी हो सकता है onlinecourses.science.psu.edu/stat414/node/231
shadowtalker

जवाबों:


11

एक वितरण के चरम के लिए बूटस्ट्रैप का निष्कर्ष आमतौर पर संदिग्ध है। जब n-out-of-n में size के नमूने में न्यूनतम या अधिकतम बूटस्ट्रैपिंग हो , तो आपके पास मौका है कि आप अपने नमूना चरम अवलोकन को पुन: पेश करेंगे, और इसी तरह लगभग मौका अपने दूसरे चरम अवलोकन को पुन: पेश करने के लिए, और इसी तरह। आपको एक निर्धारक वितरण मिलता है जिसका पूंछ पर अंतर्निहित वितरण के आकार के साथ बहुत कम संबंध है। इसके अलावा, बूटस्ट्रैप आपको अपने नमूने के नीचे कुछ भी नहीं दे सकता है, यहां तक ​​कि जब वितरण में इस मूल्य के नीचे समर्थन होता है (जैसा कि सामान्य रूप से सबसे निरंतर वितरण के साथ मामला होगा)।n1(11/n)n1exp(1)=63.2%exp(1)exp(2)=23.3%

समाधान जटिल और से asymptotics के संयोजन पर निर्भर कर रहे हैं चरम मूल्य सिद्धांत और subsampling n टिप्पणियों की तुलना में कम (वास्तव में, कम तरह से, दर शून्य करने के लिए के रूप में अभिसरण चाहिए )।n


उत्तर मददगार है, लेकिन मुझे इस बात का अंदाजा है कि बूटस्ट्रैप व्यवहार के संबंध में 1 प्रतिशत कितना कम है? मेरा अनुमान है कि बहुत बड़े नमूनों में 1 प्रतिशत को न्यूनतम से "दूर" माना जा सकता है और ऊपर सूचीबद्ध समस्याओं को नजरअंदाज किया जा सकता है, जबकि छोटे नमूनों में 1 प्रतिशत सबसे कम ही होगा और समस्याएं बहुत मायने रखेंगी। इस प्रकार हम कहीं बीच में हैं। मुझे लगता है कि इस संदर्भ में मेरे 250 अवलोकनों के नमूने का आकार बहुत छोटा माना जाना चाहिए।
रिचर्ड हार्डी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.