दो नमूनों के साधनों की तुलना करने के लिए बूटस्ट्रैप टेस्ट कैसे करें?


12

मेरे पास दो भारी तिरछे नमूने हैं और मैं टी-स्टेटिस्टिक का उपयोग करके अपने साधनों की तुलना करने के लिए बूटस्ट्रैपिंग का उपयोग करने की कोशिश कर रहा हूं।

इसे करने की सही प्रक्रिया क्या है?


मैं जिस प्रक्रिया का उपयोग कर रहा हूं

मैं अंतिम चरण में मूल / देखे गए डेटा की मानक त्रुटि का उपयोग करने के बारे में चिंतित हूं, जब मुझे पता है कि यह सामान्य रूप से वितरित नहीं है।

यहाँ मेरे कदम हैं:

  • बूटस्ट्रैप - प्रतिस्थापन के साथ बेतरतीब ढंग से नमूना (एन = 1000)
  • टी-वितरण बनाने के लिए प्रत्येक बूटस्ट्रैप के लिए टी-स्टेटिस्टिक की गणना करें:
    T(b)=(X¯b1X¯b2)(X¯1X¯2)σxb12/n+σxb22/n
  • टी-डिस्ट्रीब्यूशन के और सेंटीमीटर प्राप्त करके टी आत्मविश्वास अंतराल का अनुमान लगाएंα/21α/2
  • विश्वास अंतराल प्राप्त करें:

    CIL=(X¯1X¯2)T_CIL.SEoriginal
    CIU=(X¯1X¯2)+T_CIU.SEoriginal
    जहां
    SE=σX12/n+σX22/n
  • यह देखने के लिए कि आत्मविश्वास का अंतराल निर्धारित करता है कि साधनों में महत्वपूर्ण अंतर है (यानी गैर-शून्य)

मैंने विल्कोक्सन रैंक-योग को भी देखा है लेकिन यह बहुत भारी तिरछी वितरण (उदाहरण 75 वें == 95 वें प्रतिशत) के कारण बहुत उचित परिणाम नहीं दे रहा है। इस कारण से मैं बूटस्ट्रैप्ड टी-टेस्ट का और विस्तार करना चाहूंगा।

तो मेरे सवाल हैं:

  1. क्या यह एक उपयुक्त पद्धति है?
  2. जब मुझे पता है कि यह भारी तिरछा है, तो क्या देखा गया डेटा एसई का उपयोग करना उचित है?

संभावित डुप्लिकेट: किस विधि को प्राथमिकता दी जाती है, एक बूटस्ट्रैपिंग टेस्ट या एक नॉनपैमेट्रिक रैंक-आधारित टेस्ट?


नमूने कितने बड़े हैं?
माइकल एम।


जवाबों:


16

मैं बस एक नियमित बूटस्ट्रैप टेस्ट करूंगा:

  • अपने डेटा में t-आंकड़े की गणना करें और इसे संग्रहीत करें
  • डेटा को ऐसे बदलें कि अशक्त-परिकल्पना सच हो। इस स्थिति में, समूह 1 के लिए समूह 1 में माध्य को घटाएं और समग्र माध्य को जोड़ें, और समूह 2 के लिए भी ऐसा ही करें, इस तरह दोनों समूह में माध्य समग्र माध्य होगा।
  • इस डेटासेट से बूटस्ट्रैप के नमूने लें, संभवतः 20,000 के क्रम में।
  • इन बूटस्ट्रैप नमूनों में से प्रत्येक में टी-स्टेटिस्टिक की गणना करें। इन टी-आँकड़ों का वितरण आपके तिरछे डेटा में t-आँकड़ा के नमूना वितरण का बूटस्ट्रैप अनुमान है यदि अशक्त-परिकल्पना सत्य है।
  • बूटस्ट्रैप टी-आँकड़ों का अनुपात जो आपके देखे गए टी-स्टेटिस्टिक से अधिक या उसके बराबर है, -वेल्यू का आपका अनुमान है । आप को देख कर थोड़ा बेहतर कर सकते हैं बूटस्ट्रैप टी आँकड़े बताते हैं कि से बड़े होते हैं या मनाया टी आंकड़ा के बराबर की संख्या से विभाजित बूटस्ट्रैप नमूनों की संख्या । हालाँकि, अंतर तब छोटा होने वाला है जब बूटस्ट्रैप नमूनों की संख्या बड़ी है।p(+1)(+1)

आप उस पर और अधिक पढ़ सकते हैं:

  • एसी डेविसन और डीवी हिंकले के अध्याय 4 (1997) बूटस्ट्रैप के तरीके और उनके अनुप्रयोग । कैम्ब्रिज: कैम्ब्रिज यूनिवर्सिटी प्रेस।

  • ब्रैडले एफ्रॉन और रॉबर्ट जे टिब्शिरानी (1993) का एक परिचय का अध्याय 16 बूटस्ट्रैप का एक परिचय । बोका रत्न: चैपमैन एंड हॉल / सीआरसी।

  • बूटस्ट्रैप परिकल्पना परीक्षण पर विकिपीडिया प्रविष्टि।


यह अनिवार्य रूप से Im क्या कर रहा है, लेकिन मूल / देखे गए टी-स्टेटिस्टिक समय के अनुपात को देखते हुए> = बूटेड टी-स्टेटिस्टिक है। क्या पहले उदाहरण में भारी तिरछे डेटा पर टी-टेस्ट करना ठीक है, लेकिन यह एक कारण है कि मैं क्यों प्रचार करना चाहता हूं।
CatsLoveJazz

2
तकनीकी रूप से, बूटस्ट्रैप टेस्ट के लिए आपको बस एक टेस्ट-स्टेटिस्टिक की आवश्यकता होती है ताकि कोई समस्या न हो। मूल रूप से, एक टी-परीक्षण साधनों की तुलना करता है और तिरछे डेटा के मध्यस्थों में अक्सर साधनों की तुलना में अधिक सार्थक होते हैं। तो साधनों के बजाय मध्यस्थों की तुलना करने वाला एक परीक्षण अधिक समझ में आ सकता है। हालाँकि, यह आपकी अशक्त परिकल्पना पर निर्भर करता है, जो आपकी पसंद और आपकी पसंद है।
Maarten Buis

ठीक है धन्यवाद, इसका मतलब है कि हम परीक्षण करना चाहते हैं क्योंकि हमारे अन्य सभी आउटपुट इस रूप में हैं।
CatsLoveJazz
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.