बूटस्ट्रैपिंग के पेशेवरों और विपक्ष


11

मैंने बस बूटस्ट्रैपिंग की अवधारणा के बारे में सीखा है, और एक भोली सवाल मन में आया: यदि हम हमेशा अपने डेटा के कई बूटस्ट्रैप नमूने उत्पन्न कर सकते हैं, तो अधिक "वास्तविक" डेटा प्राप्त करने के लिए परेशान क्यों हैं?

मुझे लगता है कि मेरे पास एक स्पष्टीकरण है, कृपया मुझे बताएं कि क्या मैं सही हूं: मुझे लगता है कि बूटस्ट्रैपिंग प्रक्रिया विचरण को कम करती है, लेकिन अगर मेरा मूल डेटा बायसेड है, तो मैं कम विचरण और उच्च पूर्वाग्रह के साथ फंस गया हूं, चाहे कितनी भी प्रतिकृतियां हों। मैं ले रहा हूँ।


4
बूटस्ट्रैपिंग से अधिक जानकारी नहीं
बनती है

2
मैं Glen_b से सहमत हूं कि यह अधिक जानकारी नहीं बनाता है लेकिन मैं इस बात से सहमत नहीं हूं कि यह आपको कम जानकारी दे सकता है। जैसा कि मैंने अपने उत्तर में कहा था कि यह हमेशा अच्छा नहीं होता है लेकिन यह किसी भी सांख्यिकीय पद्धति के बारे में कहा जा सकता है।
माइकल आर। चेरिक

1
दिलचस्प सवाल - शायद एक संबंधित अवधारणा बूटस्ट्रैप क्यों काम करती है? । इसे समझने से यह जानने में मदद मिलेगी कि यह कब उपयोगी है। मैंने नमूना वितरण के लिए सामान्य सन्निकटन में सुधार के रूप में बूटस्ट्रैप के बारे में सोचा। यह सामान्य से प्रस्थान को संभाल सकता है जो बहुत चरम पर नहीं हैं। यह अन्य आकर्षक विशेषता है कि आपको विश्लेषणात्मक / बीजीय कार्य करने की आवश्यकता नहीं है - प्रतिकृति आपके लिए यह करती है।
probabilityislogic

जवाबों:


15

बूटस्ट्रैप एक तरह से अनुमान लगाने का एक तरीका है, जिसमें जनसंख्या वितरण के लिए एक पैरामीट्रिक फॉर्म की आवश्यकता नहीं होती है। यह मूल नमूने का इलाज नहीं करता है जैसे कि यह आबादी है यहां तक ​​कि इसमें मूल नमूने से प्रतिस्थापन के साथ नमूना भी शामिल है। यह मानता है कि आकार n के मूल नमूने से प्रतिस्थापन के साथ नमूनाकरण एक बड़ी आबादी से आकार n का नमूना ले रहा है। इसके कई वेरिएंट भी हैं जैसे कि n बूटस्ट्रैप के मी आउट जो कि मी <n n के आकार के नमूने से एम-टाइम री-सैंपल करता है। बूटस्ट्रैप के अच्छे गुण स्पर्शोन्मुख सिद्धांत पर निर्भर करते हैं। जैसा कि दूसरों ने उल्लेख किया है कि मूल नमूने में दी गई जानकारी की तुलना में बूटस्ट्रैप में जनसंख्या के बारे में अधिक जानकारी नहीं है। इस कारण से यह कभी-कभी छोटे नमूनों में अच्छी तरह से काम नहीं करता है।

2007 में विली द्वारा प्रकाशित मेरी पुस्तक "बूटस्ट्रैप मेथड्स: ए प्रैक्टिशनर्स गाइड" का दूसरा संस्करण, मैं उन स्थितियों को इंगित करता हूं जहां बूटस्ट्रैप विफल हो सकता है। इसमें वितरण शामिल है जिसमें परिमित क्षण, छोटे नमूना आकार नहीं होते हैं, वितरण से चरम मूल्यों का आकलन करते हैं और सर्वेक्षण के नमूने में विचरण का अनुमान लगाते हैं जहां जनसंख्या का आकार एन है और एक बड़ा नमूना एन लिया जाता है। कुछ मामलों में बूटस्ट्रैप के वेरिएंट मूल दृष्टिकोण से बेहतर काम कर सकते हैं। यह कुछ अनुप्रयोगों में एन बूटस्ट्रैप के बाहर एम के साथ होता है। विभेदक विश्लेषण में त्रुटि दर का आकलन करने के मामले में, 632 बूटस्ट्रैप अन्य बूटस्ट्रैप विधियों सहित अन्य तरीकों पर सुधार है।

इसका उपयोग करने का एक कारण यह है कि कभी-कभी आप पैरामीट्रिक मान्यताओं पर भरोसा नहीं कर सकते हैं और कुछ स्थितियों में बूटस्ट्रैप अन्य गैर-पैरामीट्रिक विधियों की तुलना में बेहतर काम करता है। यह कुछ नाम रखने के लिए गैर-रेखीय प्रतिगमन, वर्गीकरण, विश्वास अंतराल अनुमान, पूर्वाग्रह आकलन, पी-मूल्यों के समायोजन और समय श्रृंखला विश्लेषण सहित कई प्रकार की समस्याओं पर लागू किया जा सकता है।


6

एक बूटस्ट्रैप नमूना आपको केवल मूल नमूने के बारे में बातें बता सकता है, और आपको वास्तविक आबादी के बारे में कोई नई जानकारी नहीं देगा। यह विश्वास अंतराल और इसी तरह के निर्माण के लिए बस एक गैरपारंपरिक पद्धति है।

यदि आप जनसंख्या के बारे में अधिक जानकारी प्राप्त करना चाहते हैं, तो आपको जनसंख्या से अधिक डेटा एकत्र करना होगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.