"अन्वेषक का इरादा" और थ्रेसहोल्ड / पी-मान


21

मैं जॉन क्रुश्के की "डूइंग बायेसियन डेटा एनालिसिस" स्लाइड्स पढ़ रहा हूं , लेकिन वास्तव में टी-टेस्ट और / या संपूर्ण नल-परिकल्पना महत्व परीक्षण ढांचे की उनकी व्याख्या के बारे में एक प्रश्न है। उनका तर्क है कि पी-वैल्यू बीमार परिभाषित हैं क्योंकि वे अन्वेषक के इरादों पर निर्भर करते हैं।

विशेष रूप से, वह दो प्रयोगशालाओं का उदाहरण (पृष्ठ 3-6) देता है जो दो उपचारों की तुलना में समान डेटा सेट एकत्र करते हैं। एक प्रयोगशाला 12 विषयों (6 प्रति शर्त) से डेटा एकत्र करने के लिए प्रतिबद्ध है, जबकि दूसरा एक निश्चित अवधि के लिए डेटा एकत्र करता है, जो 12 विषयों का उत्पादन करने के लिए भी होता है। स्लाइड, महत्वपूर्ण के अनुसार के लिए -value इन दो डेटा संग्रह योजनाओं के बीच अलग है: पूर्व के लिए है, लेकिन बाद के लिए !p < 0.05 t crit = 2.33 t crit = 2.45टीp<0.05tcrit=2.33टीcrit=2.45

एक ब्लॉग पोस्ट - जो मुझे अब नहीं मिल रहा है - ने सुझाव दिया कि निश्चित अवधि परिदृश्य में स्वतंत्रता की अधिक डिग्री है क्योंकि वे 11, 13 या किसी भी अन्य विषयों से डेटा एकत्र कर सकते थे, जबकि निश्चित-एन परिदृश्य, द्वारा परिभाषा, एन=12

क्या कोई मुझे समझा सकता है:

  • इन स्थितियों के बीच महत्वपूर्ण मूल्य अलग क्यों होगा?

  • (यह एक मुद्दा है) मान लें कि किसी को रोकने के विभिन्न मापदंडों के प्रभावों के लिए सही करने / तुलना करने के बारे में कैसे जाना जाएगा?

मुझे पता है कि महत्व के आधार पर स्टॉपिंग मानदंड स्थापित करना (जैसे, तक नमूना ) टाइप I त्रुटि की संभावना को बढ़ा सकता है, लेकिन यह यहां नहीं जा रहा है, क्योंकि न तो नियम रोकना परिणाम पर निर्भर करता है विश्लेषण।p<0.05

जवाबों:


11

यहाँ कुछ अधिक जानकारी है: http://doingbayesiandataanalysis.blogspot.com/2012/07/sampling-distributions-of-t-when.html

एक अधिक संपूर्ण चर्चा यहां प्रदान की गई है: http://www.indiana.edu/~kruschke/BEST/ यह लेख थ्रेशोल्ड एन पर रुकने, थ्रेशोल्ड अवधि पर रुकने और थ्रेशोल्ड टी मान पर रुकने के लिए p मानों पर विचार करता है।


वाह! घोड़े के मुंह से सीधे, जैसा कि यह था ... यह निश्चित रूप से एक दिलचस्प विचार है जो मेरे साथ नहीं हुआ था। अतिरिक्त सूचना के लिए धन्यवाद।
मैट क्रूस

मैं यह जोड़ना चाहता था कि डॉ। क्रूसके की पुस्तक (अध्याय 11 में) में इस पर चर्चा की गई है ।
मैट क्राउज

13

: मैं अंत में कागज स्लाइड के साथ जुड़े नीचे ट्रैक किए गए Kruschke (2010) , यह भी लेखक (CiteSeerX के माध्यम से) से सीधे उपलब्ध यहाँ , के बाद से पत्रिका व्यापक रूप से नहीं किया जाता है। स्पष्टीकरण थोड़ा सा है, लेकिन मुझे अभी भी यकीन नहीं है कि मैं इसे खरीदूंगा।

फिक्स्ड-एन मामले में, महत्वपूर्ण -value की गणना निम्नानुसार की जाती है: 2 N नमूने बेतरतीब ढंग से (उसी) आबादी से खींचे जाते हैं और एक t -value की गणना की जाती है। अशक्त वितरण के निर्माण के लिए इस प्रक्रिया को कई बार दोहराया जाता है। अंत में, t c r i t उस वितरण का 95 वां प्रतिशत होना तय है।t2Nttcrit

निश्चित अवधि के मामले के लिए, वह मानता है कि विषय एक औसत दर पर आते हैं । नल वितरण का निर्माण दो चरणों को दोहराकर किया जाता है। पहले चरण में, प्रत्येक स्थिति N 1 और N 2 के लिए विषयों की संख्या पैरामीटर λ के साथ एक ऑक्यूपेशन वितरण से तैयार की गई है । अगले, एन 1 और एन 2 आबादी से यादृच्छिक ड्रॉ का उपयोग टी- गणना की गणना के लिए किया जाता है । यह कई बार दोहराया जाता है, और t c r i t को उस वितरण का 95 वां प्रतिशत माना जाता है।λN1N2λN1N2ttcrit

यह थोड़ा ... चीकू ... मुझे लगता है। जैसा कि मैं इसे समझता हूं, एक भी डिस्टिडियेशन नहीं है; इसके बजाय यह डिस्ट्रीब्यूशन का परिवार है, जिसका आकार आंशिक रूप से डिग्री-ऑफ-फ्रीडम पैरामीटर द्वारा निर्धारित किया गया है। नियत- N स्थिति के लिए, प्रति समूह N विषय होते हैं और एक बिना टी-टेस्ट के लिए उपयुक्त t -value होता है, जो कि 2 N - 2 डिग्री की स्वतंत्रता के साथ होता है, जो संभवतः उसके अनुकरण को दोहराता है। tNNt2N2

अन्य स्थिति में, ऐसा लगता है कि " "-समान वितरण वास्तव में कई अलग-अलग नमूनों का संयोजन हैtमें विशिष्ट ड्रॉ के आधार पर tहै। Λ = एन सेट करके, कोई व्यक्ति 2 एन - एन के बराबर स्वतंत्रताकीऔसतडिग्रीप्राप्त कर सकता है, लेकिन यह काफी पर्याप्त नहीं है। उदाहरण के लिए, की औसत टी के लिए -distributions ν = 1 और ν = 5 होना प्रतीत नहीं होता है टी स्वतंत्रता के 3 डिग्री के साथ -distribution।tλ=N2NNtν=1ν=5t

संक्षेप में:

  • लेखक केवल सीडीएफ से गणना के बजाय, सिमुलेशन द्वारा उत्पन्न कर रहा था ।tcrit
  • जिस तरह से लेखक ने निश्चित अवधि के परिदृश्य का अनुकरण किया है, ऐसा लगता है कि यह इसी -distribution की पूंछ को हल्का कर सकता है।t
  • मैं इस बात पर अडिग हूं कि यह वास्तव में एक समस्या है, लेकिन अगर किसी को अन्यथा लगता है तो जवाब पढ़ने / स्वीकार करने / स्वीकार करने में खुशी होगी।

आप अपने स्वयं के प्रश्न का उत्तर देने में सक्षम हैं और इसे चेक मार्क क्यों दे सकते हैं? ऐसा प्रतीत नहीं होता है कि आपको खुद को रेप पॉइंट देने में सक्षम होना चाहिए!
माइकल आर। चेर्निक

5
अपने खुद के सवाल का जवाब देने के लिए कुछ भी गलत नहीं है , माइकल।
CHL

@MichaelChernick, मेरा मानना ​​है कि यदि आपको अपना स्वयं का उत्तर स्वीकार नहीं है, तो आपको कोई प्रतिनिधि नहीं मिलेगा। उस समय, ऐसा करना सही बात लगती थी, क्योंकि मैंने कम से कम दो सप्ताह के अंतराल में उत्तर को ट्रैक कर लिया था, लेकिन मैंने जॉन के। क्रस्चके के जवाब को स्वीकार कर लिया है क्योंकि वह स्पष्ट रूप से अपने दम पर प्राधिकरण है। स्लाइड :-)
मैट क्रुज

दिलचस्प धन्यवाद। लेकिन मुझे नहीं लगता कि किसी को किसी भी समय अपने स्वयं के उत्तर की जांच करनी चाहिए, भले ही वह सही और सर्वश्रेष्ठ प्रतीत हो। हमने स्थापित किया है कि आपके स्वयं के उत्तर की जाँच करने से आपको निरस्त अंक नहीं मिलते हैं।
माइकल आर। चेरनिक

3
चूंकि एक उत्तर को चिह्नित करने के रूप में स्वीकार किया जाता है, इसलिए सही समाधान (भविष्य के आगंतुकों के लिए) को इंगित करने के अलावा कोई अन्य उद्देश्य नहीं है, खासकर जहां कोई अन्य प्रस्तावित नहीं किया गया है, मुझे इसके साथ कोई समस्या नहीं है। व्यक्तिगत रूप से, मैंने इस उत्तर को बहुत पहले ही बदल दिया है, क्योंकि मैं इस बात की सराहना करता हूं कि ओपी हमें अपने स्वयं के अनुसंधान से लाभ देता है। और मुझे इस धागे का अनुसरण करने और अपने निर्णय को अपडेट करने के सरल तथ्य के लिए एक अतिरिक्त वोट नहीं दे पाने के लिए वास्तव में खेद है। पुनश्च "हमने स्थापित किया है ..." संदर्भित करता है कि अपने आप को प्रतिष्ठा अंक देना क्यों संभव है?
२१'१२ को
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.