बूटस्ट्रैप महत्व परीक्षण के दो तरीके


11

बूटस्ट्रैप का उपयोग करके मैं दो तरीकों का उपयोग करके महत्व परीक्षणों के पी मूल्यों की गणना करता हूं:

  1. अशक्त परिकल्पना के तहत पुनरुत्पादन करना और मूल डेटा से आने वाले परिणामों के रूप में कम से कम चरम की गणना करना
  2. वैकल्पिक परिकल्पना के तहत फिर से शुरू करना और परिणाम को कम से कम मूल परिणाम से दूर के रूप में गिनना जो कि परिकल्पना के अनुरूप मूल्य है।

मेरा मानना ​​है कि 1 सेंट दृष्टिकोण पूरी तरह से सही है क्योंकि यह एपी वैल्यू की परिभाषा का अनुसरण करता है। मैं दूसरे के बारे में कम निश्चित हूं, लेकिन यह आमतौर पर बहुत समान परिणाम देता है और मुझे वाल्ड टेस्ट याद दिलाता है।

क्या मैं सही हू? क्या दोनों विधियाँ सही हैं? क्या वे समान (बड़े नमूनों के लिए) हैं?


दो तरीकों के लिए उदाहरण (डीडिन के सवालों के बाद संपादन और एरिक का जवाब):
उदाहरण 1. चलो दो नमूना टी परीक्षण के समान बूटस्ट्रैप परीक्षण का निर्माण करते हैं। विधि 1 एक नमूने से फिर से निकलेगी (मूल दो को जमा करके)। विधि 2 दोनों नमूनों से स्वतंत्र रूप से फिर से जुड़ जाएगी।

उदाहरण 2. चलो xₐ… x₁ और yₐ… yₐ के बीच सहसंबंध का बूटस्ट्रैप परीक्षण बनाएं। पद्धति 1 कोई सहसंबंध नहीं मानेंगी और (xₔ, y pairs) जोड़े जहां e will cor के लिए अनुमति दे रही हैं। विधि 2 मूल (x, y) जोड़े के बूटस्ट्रैप नमूने को संकलित करेगी।

उदाहरण 3. एक सिक्का उचित है या नहीं यह जांचने के लिए आइए बूटस्ट्रैप टेस्ट का निर्माण करें। विधि 1 Pr (सिर) = Pr (पूंछ) = Pr की स्थापना करते हुए यादृच्छिक नमूने बनाएगी। विधि 2 प्रयोगात्मक सिर / पूंछ मूल्यों के नमूने को फिर से भरेगी और अनुपातों की तुलना the से करेगी।


कौन सी "वैकल्पिक परिकल्पना"? पारंपरिक फिशरियन नामकरण में केवल एक विकल्प नहीं होगा बल्कि विकल्पों का एक अनंत परिवार होगा। और आप उस मामले के लिए "एक परिकल्पना के तहत नमूना" कैसे करते हैं? नमूना डेटा पर किया जाता है। परिकल्पना एक पैरामीटर के बारे में है।
डीडिन

@ ड्विन: धन्यवाद, कृपया मेरे उदाहरण को मेरे प्रश्न के साथ जोड़कर देखें।
विजेता

जवाबों:


8

पहला दृष्टिकोण शास्त्रीय और भरोसेमंद है लेकिन हमेशा इस्तेमाल नहीं किया जा सकता है। अशक्त परिकल्पना मानने वाले बूटस्ट्रैप नमूने प्राप्त करने के लिए, आपको या तो धारण करने के लिए एक सैद्धांतिक वितरण मानने के लिए तैयार होना चाहिए ( यह आपका पहला विकल्प है ) या यह मानने के लिए कि ब्याज की आपकी सांख्यिकीय का समान रूप से आकार है जब शून्य परिकल्पना में स्थानांतरित किया गया ( आपका दूसरा विकल्प) )। उदाहरण के लिए, सामान्य धारणा के तहत दूसरे वितरण में स्थानांतरित होने पर टी-वितरण का आकार समान होता है। हालाँकि, जब द्विपद वितरण के 0.5 की शून्य आवृत्ति को 0.025 में बदलना भी आकृति को बदल देगा।

मेरे अनुभव में, अन्यथा इस मामले में कि आप इन मान्यताओं को बनाने के इच्छुक हैं, आपके पास अक्सर अन्य विकल्प भी होते हैं। आपके उदाहरण 1 में) जहाँ आप यह मान लेते हैं कि दोनों नमूने एक ही आधार आबादी से आ सकते हैं, एक क्रमपरिवर्तन परीक्षण मेरी राय में बेहतर होगा।

एक और विकल्प है (जो आपको आपकी दूसरी पसंद लगती है) जो बूटस्ट्रैप विश्वास अंतराल पर आधारित है। मूल रूप से, यह माना जाता है कि यदि आपके बताए गए कवरेज का महत्व स्तर पर है, तो यह शून्य परिकल्पना के बराबर है -केंफिडेंस अंतराल में शामिल नहीं है। उदाहरण के लिए देखें, यह प्रश्न: आत्मविश्वास अंतराल और परिकल्पना परीक्षण के बीच अंतर क्या है?α(1α)

यह एक बहुत ही लचीली विधि है और कई परीक्षणों के लिए लागू है। हालांकि, अच्छे बूटस्ट्रैप विश्वास अंतरालों का निर्माण करना बहुत महत्वपूर्ण है और केवल वाल्ड-सन्निकटन या प्रतिशतक विधि का उपयोग करने के लिए नहीं। कुछ जानकारी यहाँ है: बूटस्ट्रैप-आधारित आत्मविश्वास अंतराल


1
अच्छा उत्तर। तो दूसरे विकल्प के लिए भी सममिति की आवश्यकता है? मान लें कि आपके आत्मविश्वास का अंतराल 0 से बड़ा है और आप H पर विचार कर रहे हैं कि ऐसा न हो। यह 0. है, तो आपके आत्मविश्वास अंतराल में 0 को देखना इस बात को देखने से अलग है कि औसत मान H नहीं है () ये दो अलग-अलग दिशाओं में हैं, यदि आप मानते हैं कि आप विश्वास अंतराल को स्थानांतरित कर रहे हैं)।
मिशैल

@erik ने इसी तरह के सवाल पर एक इनाम शुरू किया - जो मूल रूप से उपरोक्त टिप्पणी का एक लंबा संस्करण है - जब विकल्प 2 का उपयोग किया जा सकता है और किन शर्तों के तहत? आंकड़े.stackexchange.com/questions/175659/…
जेवियर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.