बूटस्ट्रैप नमूनों का आकार


9

मैं एक नमूना सांख्यिकीय के विचरण का अनुमान लगाने के साधन के रूप में बूटस्ट्रैपिंग के बारे में सीख रहा हूं। मुझे एक बुनियादी संदेह है।

Http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf से उद्धरण :

• हमें कितनी टिप्पणियों को फिर से भरना चाहिए? एक अच्छा सुझाव मूल नमूना आकार है।

मूल नमूने में हम कितनी टिप्पणियों का पुन: उपयोग कर सकते हैं?
यदि मेरे पास 100 का एक नमूना आकार है, और मैं माध्य के विचरण का अनुमान लगाने की कोशिश कर रहा हूं। मैं 100 के कुल नमूने के आकार से 100 के कई बूटस्ट्रैप नमूने कैसे प्राप्त कर सकता हूं ? केवल 1 बूटस्ट्रैप नमूना इस मामले में संभव होगा जो मूल नमूने के बराबर होगा?

मैं स्पष्ट रूप से बहुत बुनियादी कुछ गलत समझ रहा हूँ। मैं समझता हूँ कि संख्या के आदर्श बूटस्ट्रैप नमूने हमेशा अनंत है, और मन में मेरी आवश्यक परिशुद्धता रखने अपने डेटा के लिए मैं अभिसरण के लिए परीक्षण करना होगा बूटस्ट्रैप आवश्यक नमूनों की संख्या निर्धारित करने के लिए।
लेकिन मैं वास्तव में उलझन में हूं कि प्रत्येक व्यक्तिगत बूटस्ट्रैप नमूने का आकार क्या होना चाहिए ।


7
पी के ऊपर। 3, और वहाँ के चित्र, स्पष्ट रूप से और प्रमुखता से बताते हैं कि प्रतिस्थापन के साथ
व्हीबर

लेकिन अगर मेरे बूटस्ट्रैप के नमूने का आकार मेरे पास मौजूद टिप्पणियों की कुल संख्या के समान है, तो मैं क्या बदलूं?
user1265125

सरलीकृत उदाहरण - तो अगर मैं अपने नमूने के रूप में 4,1,3,7,5 हूं। मैं आकार 5 के कई बूटस्ट्रैप नमूने कैसे बना सकता हूं? एकमात्र बूट 5 बूटस्ट्रैप नमूना 4,1,3,7,5 होगा यानी मूल नमूना सेट।
user1265125

1
ओह रुको मैं समझ गया - "• नमूना वितरण का अनुकरण करने के लिए, हम सिर्फ इस" जनसंख्या "से नमूने के कई प्रतियों से बने यादृच्छिक नमूने ले सकते हैं"
user1265125

जवाबों:


16

प्रतिस्थापन के साथ नमूने द्वारा बूटस्ट्रैप का संचालन किया जाता है । ऐसा लगता है कि "प्रतिस्थापन के साथ" शब्द आपके लिए अस्पष्ट है। जैसा कि व्हीबर ने कहा है , प्रतिस्थापन के साथ नमूने का चित्रण पी पर दिया गया है। पेपर का 3 जिसे आप संदर्भित करते हैं (नीचे पुन: प्रस्तुत किया गया है)।

प्रतिस्थापन के साथ नमूने का चित्रण

(स्रोत: http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf )

प्रतिस्थापन के साथ नमूना लेने का सामान्य विचार यह है कि किसी भी मामले को कई बार नमूना किया जा सकता है (ऊपर की छवि पर हरा संगमरमर, आखिरी तस्वीर पर नीला और बैंगनी मार्बल)। यदि आप खुद को इस प्रक्रिया की कल्पना करना चाहते हैं, तो रंगीन मार्बल्स से भरे कटोरे के बारे में सोचें। यह कहें कि आप इस कटोरे से कुछ संख्या में पत्थर निकालना चाहते हैं। यदि आप प्रतिस्थापन के बिना नमूना लेते हैं, तो आप बस कटोरे से पत्थर निकालेंगे और नमूने को एक तरफ रख देंगे। यदि आप प्रतिस्थापन के साथ नमूना लेते हैं , तो आप एक-एक करके मार्बल्स का नमूना लेंगे, एकल संगमरमर को कटोरे से निकालकर, नीचे हस्ताक्षर करके इसे अपनी नोटबुक में रंग दें और फिर इसे वापस कर दें।कटोरा के लिए। इसलिए जब एक ही संगमरमर के प्रतिस्थापन के साथ कई बार नमूना लिया जा सकता है।

तो जब प्रतिस्थापन के बिना नमूना , आप केवल नमूना कर सकते हैंn कटोरे से बाहर पत्थर nपत्थर, जबकि प्रतिस्थापन के साथ नमूने के मामले में आप किसी भी संख्या में पत्थर का नमूना ले सकते हैं (इससे भी बड़ाn) परिमित जनसंख्या से। अगर आपने सैंपल लिएn से बाहर nप्रतिस्थापन के बिना पत्थर आप बिल्कुल उसी नमूने के साथ समाप्त हो जाएंगे, लेकिन फेरबदल के क्रम में। अगर आपने सैंपल लिएn से बाहर nप्रतिस्थापन के साथ पत्थर , हर बार जब आप संभवतः पत्थर के विभिन्न संयोजन का नमूना ले सकते हैं।

नहीं है नमूने के तौर-तरीकों के बिना प्रतिस्थापन आकार की आबादी में से मामलों और नमूने के तौर-तरीकों के साथ प्रतिस्थापन। यदि आप इसके पीछे के गणित के बारे में अधिक पढ़ना चाहते हैं, तो आप 2.1 की जांच कर सकते हैं होसेन पिश्रो-निक द्वारा संभाव्यता ऑनलाइन हैंडबुक के लिए परिचय का संयोजन अध्याय । वुल्फ्राममैथवर्ल्ड पेज पर एक आसान चीटशीट भी है ।(nk)kn(n+k1k)


0

हमें कितने नमूनों का पुन: नमूना लेना चाहिए? एक अच्छा सुझाव मूल नमूना आकार है।

जब मूल नमूना आकार बहुत बड़ा होता है और आप पूर्ण डेटासेट पर किसी मॉडल को प्रशिक्षित नहीं कर सकते / नहीं कर सकते, तो "अच्छा सुझाव" इतना अच्छा नहीं है।

पुनश्च: मैं इसे प्रश्न के रूप में जोड़ना चाहता था लेकिन मुझे कोई टिप्पणी जोड़ने की अनुमति नहीं है ...


1
आप इस सुझाव को क्यों जोड़ना चाहते हैं? यदि यह नियमित कम्प्यूटेशनल प्रयासों के लिए डेटासेट के कारण बहुत बड़ा है, तो यह एक प्रासंगिक व्यावहारिक मुद्दा है, लेकिन यह वास्तव में बूटस्ट्रैपिंग के सिद्धांत पर लागू नहीं होता है जो यहां पूछताछ की गई थी। इसके अलावा, यह 'एक नमूना सांख्यिकीय के विचरण का अनुमान लगाने' के बारे में था। क्या यह वास्तव में एक मॉडल को प्रशिक्षित करने से संबंधित है? (नायब। असभ्य होने के लिए, मैं समझता हूं कि आप अभी तक टिप्पणी पोस्ट नहीं कर सकते हैं, लेकिन यह आपको पोस्ट करने के लिए एक प्रासंगिक उत्तर प्रदान करने से नहीं डिस्चार्ज करता है। आपको बहुत अधिक स्पष्ट होना चाहिए, या अपना स्वयं का प्रश्न पोस्ट करना होगा)
IWS
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.