बूटस्ट्रैप बनाम क्रमपरिवर्तन परिकल्पना परीक्षण


37

कई लोकप्रिय पुनरुत्पादन तकनीकें हैं, जो अक्सर अभ्यास में उपयोग की जाती हैं, जैसे बूटस्ट्रैपिंग, क्रमपरिवर्तन परीक्षण, जैकनाइफ, आदि। इन तकनीकों पर चर्चा करने वाले कई लेख और पुस्तकें हैं, उदाहरण के लिए फिलिप आई गुड (2010) क्रमपरिवर्तन, पैरामीटर और बूटस्ट्रैप टेस्ट परिकल्पनाओं की

मेरा सवाल यह है कि कौन सी resampling तकनीक ने अधिक लोकप्रियता प्राप्त की है और लागू करना आसान है? बूटस्ट्रैपिंग या क्रमपरिवर्तन परीक्षण?


8
लोकप्रियता शायद ही गुणवत्ता का एक अच्छा उपाय है। प्रशंसा पत्र (ग्राहकों) की संख्या को देखते हुए, मैकडॉनल्ड्स किसी भी तीन सितारा मिशेलिन प्रतिष्ठान की तुलना में कहीं अधिक लोकप्रिय (बेहतर?) रेस्तरां है। क्या आप अपने अगले सेमिनार स्पीकर को मैकडॉनल्ड्स में ले जाएंगे, फिर?
StasK

जवाबों:


68

दोनों लोकप्रिय और उपयोगी हैं, लेकिन मुख्य रूप से विभिन्न उपयोगों के लिए। परिकल्पना परीक्षण परिकल्पना के परीक्षण के लिए सबसे अच्छा है और विश्वास अंतराल का अनुमान लगाने के लिए बूटस्ट्रैपिंग सबसे अच्छा है।

क्रमपरिवर्तन परीक्षण विनिमेयता के एक विशिष्ट शून्य परिकल्पना का परीक्षण करते हैं, यानी कि केवल यादृच्छिक नमूना / यादृच्छिककरण देखा गया अंतर बताता है। टी-परीक्षण और एनोवा जैसी चीजों के लिए यह सामान्य मामला है। इसे टाइम सीरीज़ (शून्य परिकल्पना कि कोई सीरियल संबंध नहीं है) या रिग्रेशन (बिना किसी रिश्ते की अशक्त परिकल्पना) जैसी चीज़ों तक विस्तारित किया जा सकता है। क्रमबद्धता परीक्षणों का उपयोग आत्मविश्वास अंतराल बनाने के लिए किया जा सकता है, लेकिन इसके लिए कई और मान्यताओं की आवश्यकता होती है, जो उचित हो सकती हैं या नहीं (इसलिए अन्य तरीके पसंद किए जाते हैं)। मैन-व्हिटनी / विलकॉक्सन परीक्षण वास्तव में क्रमपरिवर्तन परीक्षण का एक विशेष मामला है, इसलिए वे कुछ एहसास से अधिक लोकप्रिय हैं।

बूटस्ट्रैप नमूना प्रक्रिया की परिवर्तनशीलता का अनुमान लगाता है और आत्मविश्वास अंतराल के आकलन के लिए अच्छी तरह से काम करता है। आप इस तरह से परिकल्पना का परीक्षण कर सकते हैं, लेकिन यह उन मामलों के लिए क्रमचय परीक्षण की तुलना में कम शक्तिशाली है जो क्रमपरिवर्तन परीक्षण मान्यताओं को धारण करते हैं।


2
जवाब के लिए धन्यवाद। क्यों बूटस्ट्रैप विश्वास अंतराल क्रमचय परीक्षण की तुलना में कम शक्तिशाली है? कितना है? क्या कोई ऐसी परिस्थितियों को चिह्नित कर सकता है जिसके तहत यह काफी कम शक्तिशाली है? यह एक विश्वास अंतराल दिखाने में सक्षम होने के लिए एक फायदा लगता है, इसलिए इस अर्थ में बूटस्ट्रैप अधिक मूल्यवान लगता है।
dfrankow

2
@dfrankow, 2 विधियाँ विभिन्न मान्यताओं का उपयोग करती हैं। बड़े नमूनों और अंतरों के लिए, वे दोनों ठीक होंगे, लेकिन छोटे नमूनों / अंतरों के साथ क्रमपरिवर्तन परीक्षण में अंतर खोजने और उपयुक्त होने की अधिक संभावना है। यह उत्तर देखें: आंकड़े.stackexchange.com/questions/112147/… उदाहरण के लिए जहां बूटस्ट्रैप भी सही ढंग से आकार में नहीं है (शून्य के सत्य होने पर भी अक्सर अस्वीकार करता है)।
ग्रेग हिमपात

क्या एक क्रमपरिवर्तन परीक्षण बूटस्ट्रैपिंग पर भिन्नता नहीं है?
विकी बी

@ विकी, बूटस्ट्रैपिंग और पर्मुटेशन परीक्षणों को अक्सर एक साथ उल्लिखित किया जाता है, लेकिन प्रतिस्थापन और क्रमपरिवर्तन नमूनों के साथ नमूनों को बिना प्रतिस्थापन के बढ़ाया जाता है, जिससे उन्हें फर्क पड़ता है कि वे क्या कर सकते हैं और वे कितने शक्तिशाली हैं।
ग्रेग स्नो

12

यदि आप आर का उपयोग कर रहे हैं, तो उन्हें लागू करना आसान है। उदाहरण के लिए देखें, http://www.burns-stat.com/pages/Tutor/bootstrap_resampling.html

मैं कहूंगा कि एक तीसरी प्रमुख तकनीक है: क्रॉस सत्यापन। इसका उपयोग मॉडलों की भविष्य कहनेवाला शक्ति का परीक्षण करने के लिए किया जाता है।


8

मेरा प्रश्न यह है कि कौन सी resampling तकनीक ने अधिक लोकप्रियता प्राप्त की है
बूटस्ट्रैपिंग या क्रमपरिवर्तन परीक्षण?

  1. बूटस्ट्रैपिंग ज्यादातर बड़े नमूना मानक त्रुटियों या विश्वास अंतराल उत्पन्न करने के बारे में है; जैसा कि नाम से पता चलता है कि परीक्षण परीक्षण ज्यादातर परीक्षण के बारे में हैं। (हालांकि प्रत्येक को दूसरे कार्य के लिए उपयोग किए जाने के लिए अनुकूलित किया जा सकता है।)

  2. हम लोकप्रियता को कैसे आंकेंगे? यदि हम मनोविज्ञान और शिक्षा जैसे क्षेत्रों को देखें तो हम रैंक आधारित परीक्षणों जैसे कि विल्कोक्सॉन-मैन-व्हिटनी, हस्ताक्षरित रैंक परीक्षण, रैंक-सहसंबंध परीक्षण और इतने पर उपयोग कर सकते हैं। ये सभी क्रमपरिवर्तन परीक्षण हैं (दूसरी ओर ऐसे कई उदाहरण हैं जहां मूल डेटा के क्रमपरिवर्तन परीक्षण इसके बजाय इस्तेमाल किए जा सकते हैं लेकिन आमतौर पर नहीं होते हैं)। कुछ अन्य अनुप्रयोग क्षेत्रों में, क्रमपरिवर्तन परीक्षणों का उपयोग शायद ही कभी किया जाएगा, लेकिन कभी-कभी आवेदन क्षेत्रों में अलग-अलग लोकप्रियता उपयोगिता की तुलना में जो भी क्षेत्र की स्थानीय संस्कृति के बारे में अधिक कहती है।

लागू करने के लिए आसान?

कई मामलों में - विशेष रूप से सरल वाले - वे लगभग समान रूप से आसान हैं - यह अनिवार्य रूप से प्रतिस्थापन के साथ नमूने और प्रतिस्थापन के बिना नमूने के बीच का अंतर है।

कुछ अधिक जटिल मामलों में, बूटस्ट्रैपिंग करना आसान है क्योंकि (परीक्षण के दृष्टिकोण से इसे देखते हुए) यह शून्य के बजाय वैकल्पिक के तहत काम करता है (कम से कम भोली कार्यान्वयन होगा - ऐसा करना ताकि यह अच्छी तरह से काम करे अधिक जटिल हो सकता है)।

अधिक जटिल मामलों में सटीक क्रमपरिवर्तन परीक्षण मुश्किल हो सकता है क्योंकि एक उपयुक्त विनिमेय मात्रा अप्रमाणित हो सकती है - अक्सर एक लगभग विनिमेय मात्रा को सटीकता की कीमत पर प्रतिस्थापित किया जा सकता है (और वास्तव में वितरण मुक्त होने के नाते)।

बूटस्ट्रैपिंग अनिवार्य रूप से शुरू से ही सटीक सटीकता मानदंड (अंतराल की सटीक कवरेज) पर छोड़ देता है, और इसके बजाय बड़े नमूनों में यथोचित अच्छा कवरेज प्राप्त करने की कोशिश करने पर ध्यान केंद्रित करता है (कभी-कभी कम सफलता के साथ समझा जा सकता है; यदि आपने जाँच नहीं की है, तो डॉन 'मान लें कि आपका बूटस्ट्रैप आपके द्वारा अपेक्षित कवरेज देता है)।

क्रमपरिवर्तन परीक्षण छोटे नमूनों पर काम कर सकते हैं (हालांकि महत्व के स्तरों की सीमित पसंद कभी-कभी बहुत छोटे नमूनों के साथ एक समस्या हो सकती है), जबकि बूटस्ट्रैप एक बड़ी-नमूना तकनीक है (यदि आप इसे छोटे नमूनों के साथ उपयोग करते हैं, तो कई मामलों में परिणाम नहीं हो सकते हैं बहुत उपयोगी हो)।

मैं शायद ही कभी उन्हें एक ही समस्या पर प्रतियोगियों के रूप में देखता हूं, और उन्हें अलग-अलग (वास्तविक) वास्तविक समस्याओं पर इस्तेमाल किया है - अक्सर एक प्राकृतिक विकल्प होगा, जिसे देखना होगा।

दोनों के लिए लाभ हैं, लेकिन न तो एक पैनकेया में। यदि आप उनमें से केवल एक पर ध्यान केंद्रित करके सीखने के प्रयास को कम करने की उम्मीद कर रहे हैं, तो आपको निराश होने की संभावना है - यह दोनों resampling टूलबॉक्स के आवश्यक भाग हैं।


1
क्या आप स्पष्ट कर सकते हैं कि " उपयुक्त विनिमेय मात्रा अप्रमाणित हो सकती है " का क्या मतलब है? (स्पष्ट रूप से)
usεr11852 का कहना है कि

1
दो कारकों और एक कोवरिएट के साथ एक प्रयोग में क्रमचय परीक्षण करने की कोशिश करने पर विचार करें (या सिर्फ एक पूर्वानुमान के साथ कई पूर्वानुमान पर विचार करें)। स्वतंत्रता के साथ और बिना किसी प्रभाव के एक अशक्त के तहत, अवलोकन विनिमेय हैं और इसलिए आप उस परिकल्पना का परीक्षण कर सकते हैं लेकिन आपके पास सिर्फ कारकों के क्रमपरिवर्तन परीक्षण का निर्माण करने का एक तरीका नहीं है (क्योंकि आप उम्मीद करते हैं कि सहसंयोजक का प्रभाव होगा और यह अशक्त होने का परीक्षण दिलचस्प नहीं है); इसी तरह आप केवल दो कारकों में से एक के क्रमचय परीक्षण का निर्माण नहीं कर सकते। ... ctd
ग्लेन_ब

1
ctd ... एक स्पष्ट विनिमेय मात्रा है यदि आपको पता है कि जनसंख्या गुणांक आप परीक्षण नहीं कर रहे हैं (और त्रुटियां हमेशा विनिमेय होगी) लेकिन आप उन चीजों का निरीक्षण नहीं कर सकते। यदि आप गुणांक या त्रुटियों का अनुमान लगाते हैं (अर्थात अवशिष्ट) तो मात्राएँ विनिमेय हैं। हालाँकि, कुछ विशेष परिस्थितियों में वे लगभग विनिमेय होंगे (कुछ लोग ऐसा करने की वकालत करते हैं) .... और यदि आप ऐसा करते हैं कि आप बूटस्ट्रैप के लिए कुछ समान हैं, लेकिन प्रतिस्थापन के साथ नमूने के बजाय नमूने के बिना नमूना के साथ।
Glen_b

धन्यवाद; मैं इस पर सावधानी से सोचूंगा। मुझे संदेह है कि मेरे लिए यहां सीखने के लिए कुछ गहरा है। :)
us Monr11852 का कहना है कि मोनिक

1
@ किसी कारण से मैंने एक संदर्भ के लिए आपके अनुरोध को याद किया। एक शुरुआती बिंदु के लिए, यहां कुछ संदर्भों को करना चाहिए: davegiles.blogspot.com/2019/04/…
Glen_b
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.