आत्मविश्वास अंतराल का उपयोग करते समय क्या हमें कई तुलना समायोजन को संबोधित करना चाहिए?


27

मान लीजिए कि हमारे पास कई तुलनात्मक परिदृश्य हैं जैसे कि जोड़ी वाइज आँकड़ों पर पोस्ट हॉक इंजेक्शन, या एक बहु प्रतिगमन की तरह, जहां हम कुल मीटर तुलना कर रहे हैं । यह भी मान लीजिए, कि हम विश्वास अंतराल का उपयोग करके इन गुणकों में अनुमान का समर्थन करना चाहते हैं।

1. क्या हम CI से कई तुलनात्मक समायोजन लागू करते हैं? यही है, जैसे कि कई तुलनाएं α को पुनर्परिभाषित करने के लिए परिवार की त्रुटि दर (एफडब्ल्यूईआर) या गलत खोज दर (एफडीआर) को बाध्य करती हैं, आत्मविश्वास का अर्थ (या विश्वसनीयता 1 , या अनिश्चितता, या भविष्यवाणी, या हीनता) करती है। ... अपने अंतराल उठाओ) इसी तरह कई तुलनाओं से बदल जाते हैं? मुझे एहसास है कि यहाँ एक नकारात्मक उत्तर मेरे शेष प्रश्नों को लूट लेगा।

2. क्या परिकल्पना परीक्षण से लेकर अंतराल के आकलन तक कई तुलनात्मक समायोजन प्रक्रियाओं के सीधे अनुवाद हैं? उदाहरण के लिए, समायोजन को बदलने पर ध्यान केंद्रित करेंगे सीआई-स्तर विश्वास अंतराल में अवधि: सीआईθ=(θ^±टी(1-सीआई-स्तर) / 2σ^θ) ?

3. हम सीआई के लिए स्टेप-अप या स्टेप-डाउन कंट्रोल प्रक्रियाओं को कैसे संबोधित करेंगे? परिकल्पना परीक्षण दृष्टिकोण से निष्कर्ष के लिए कुछ परिवार-वार त्रुटि दर समायोजन 'स्थिर' हैं, ठीक उसी समायोजन को प्रत्येक अलग-अलग इंजेक्शन में किया जाता है। उदाहरण के लिए, बोनफेरोनी समायोजन को अस्वीकृति मानदंड में परिवर्तन करके बनाया गया है:

  • अस्वीकार करता है, तो पीα2 से:
  • अस्वीकार करता है, तो पीα2मीटर ,

लेकिन Holm-Bonferroni स्टेप-अप समायोजन 'स्थिर' नहीं है, बल्कि इसके द्वारा किया गया है:

  • पहला आदेश पी -values ​​सबसे छोटा से सबसे बड़ा, और फिर
  • अस्वीकार करता है, तो पी1-(1-α2)1मीटर+1-मैं , (जब तकमैंपीके क्रम को अनुक्रमित करताहूं) तक
  • हम एक अशक्त परिकल्पना को अस्वीकार करने में विफल होते हैं, और स्वचालित रूप से सभी बाद की अशक्त परिकल्पनाओं को अस्वीकार करने में विफल होते हैं।

चूँकि अस्वीकृति / विफलता सीआई के साथ नहीं हो रही है (अधिक औपचारिक रूप से, नीचे दिए गए संदर्भ देखें) इसका मतलब यह है कि स्टेपवाइज प्रक्रियाएं अनुवाद नहीं करती हैं (यानी सभी एफडीआर विधियों सहित)? मुझे यहाँ पर यह कहना चाहिए कि मैं यह नहीं पूछ रहा हूँ कि सीआई को परिकल्पना परीक्षणों में कैसे अनुवाद किया जाए ('दृश्य परिकल्पना परीक्षण' के प्रतिनिधियों का उल्लेख उस गैर-तुच्छ प्रश्न पर मिलता है)।

4. उन अन्य अंतरालों में से किसी के बारे में जो मैंने 1 में पालन-पोषण का उल्लेख किया है?


1 गोश, मुझे यकीन है कि मुझे इस शब्द का उपयोग करके उन रॉकिन की मीठी, मीठी बायेसियन शैलियों से परेशानी नहीं होगी। :)


संदर्भ
अफ़शरत, डी। और प्रेस्टन, आर। (2010)। आश्रित डेटा के लिए आत्मविश्वास अंतराल: सांख्यिकीय महत्व के साथ गैर-ओवरलैप के बराबर। कम्प्यूटेशनल सांख्यिकी और डेटा विश्लेषण , 54 (10): 2296–2305।

कमिंग, जी। (2009)। आँख से इंजेक्शन: स्वतंत्र आत्मविश्वास अंतराल के ओवरलैप को पढ़ना। चिकित्सा में सांख्यिकी , 28 (2): 205–220।

पायटन, एमई, ग्रीनस्टोन, एमएच, और शेंकर, एन (2003)। अति आत्मविश्वास अंतराल या मानक त्रुटि अंतराल: सांख्यिकीय महत्व के संदर्भ में उनका क्या मतलब है? जर्नल ऑफ कीट साइंस , 3 (34): 1-6।

ट्रिवन, डब्ल्यूडब्ल्यू और लुईस, सी (2008)। सांख्यिकीय तुल्यता स्थापित करने का एक अनुमानित आत्मविश्वास अंतराल विधि, जो ट्राइटन (2001) कमी कारक को सही करता है। मनोवैज्ञानिक तरीके , १३ (३): २2२-२। 13।


मेरे पास अब पूर्ण उत्तर पर शोध करने का समय नहीं है, इसलिए मैं एक टिप्पणी में उत्तर दूंगा।
हार्वे मोटुलस्की

[अंतिम टिप्पणी को काट दिया गया। [मेरे पास अब पूर्ण उत्तर पर शोध करने का समय नहीं है, इसलिए मैं एक टिप्पणी में उत्तर दूंगा। 1) हाँ यह उन्हीं स्थितियों में समझ में आता है जैसे परिकल्पना परीक्षण के लिए कई तुलनाएँ समझ में आती हैं। 2. बोन्फ्रोनी, तुकी और डननेट कई तुलनाओं को आसानी से आत्मविश्वास अंतराल बनाने के लिए अनुकूलित किया जा सकता है जहां आत्मविश्वास का स्तर पूरे परिवार पर लागू होता है। 3. जहां तक ​​मैं बता सकता हूं, होल्म विधि से आत्मविश्वास अंतराल बनाने की कोई संभावना नहीं है। 4. मेरे पास कोई सुराग नहीं है!
हार्वे मोटुलस्की

2
पीα

जवाबों:


9

एक उत्कृष्ट विषय जो दुख की बात है, पर्याप्त ध्यान नहीं दिया गया है।

कई मापदंडों और आत्मविश्वास अंतराल पर चर्चा करते समय, एक साथ निष्कर्ष और चयन के बीच अंतर किया जाना चाहिए निष्कर्ष के । रेफरी। [2] इस मामले का एक उत्कृष्ट प्रदर्शन देता है।

1-α
चयनात्मक आत्मविश्वास अंतराल का मतलब है कि चयनित मापदंडों का एक सबसेट कवर किया गया है।

इन दो अवधारणाओं को संयोजित किया जा सकता है: मान लीजिए कि आप केवल उन मापदंडों पर अंतराल का निर्माण करते हैं जिनके लिए आपने अशक्त परिकल्पना को अस्वीकार कर दिया था। आप स्पष्ट रूप से चयनात्मक इंजेक्शन के साथ काम कर रहे हैं। आप चयनित मापदंडों के एक साथ कवरेज की गारंटी दे सकते हैं, या चयनित मापदंडों के सीमांत कवरेज की गारंटी दे सकते हैं। पूर्व में एफडब्ल्यूडीआर नियंत्रण, और एफडीआर नियंत्रण के उत्तरार्ध का समकक्ष होगा।

अब इस बिंदु पर अधिक: सभी परीक्षण प्रक्रियाओं में उनके साथ अंतराल नहीं है। परिवार कल्याण प्रक्रियाओं और उनके साथ के अंतराल के लिए, [3] देखें। अफसोस की बात है कि यह संदर्भ थोड़ा पुराना है। BH FDR नियंत्रण के अंतराल समकक्ष के लिए, [1] और [४] में एक आवेदन (जिसमें मामले की संक्षिप्त समीक्षा भी शामिल है) देखें। कृपया ध्यान दें कि यह एक ताजा और सक्रिय अनुसंधान क्षेत्र है ताकि आप निकट भविष्य में और अधिक परिणाम की उम्मीद कर सकें।

[१] बेनजामिनी, वाई।, और डी। येकुतेली। "गलत डिस्कवरी दर-चयनित पैरामीटर्स के लिए कई कॉन्फिडेंस अंतराल को समायोजित करता है।" जर्नल ऑफ द अमेरिकन स्टेटिस्टिकल एसोसिएशन 100, नं। 469 (2005): 71–81।

[२] कॉक्स, DR "मल्टीपल कम्पेरिजन मेथड्स पर एक रिमार्क।" टेक्नोमेट्रिक्स,, सं। 2 (1965): 223–24।

[३] होचबर्ग, वाई।, और एसी तम्हाने। एकाधिक तुलना प्रक्रियाएं। न्यूयॉर्क, एनवाई, यूएसए: जॉन विले एंड संस, इंक। 1987।

[४] रोसेनब्लट, जेडी, और वाई। बेनजामिनी। “चयनात्मक सहसंबंध; वूडू नहीं। ”न्यूरोइमेज 103 (दिसंबर 2014): 401-10।


1

मैं कभी नहींकई परीक्षण के लिए विश्वास अंतराल समायोजित करें। मैं पी-वैल्यूज़ का बहुत बड़ा प्रशंसक नहीं हूं, क्योंकि मेरा मानना ​​है कि मापदंडों का आकलन करना परिकल्पनाओं के परीक्षण की तुलना में आँकड़ों का बेहतर उपयोग है जो कभी सच नहीं होते हैं। हालाँकि, मैंने माना कि परिकल्पना परीक्षण का अपना मूल्य है, एक यादृच्छिक नियंत्रित परीक्षण के अनुसार, जहां कम से कम कोई यह तर्क दे सकता है कि यदि कोई उपचार काम नहीं करता है, तो अशक्त परिकल्पना सच है। हालाँकि जैसा कि मैंने कहीं और कहा है [1], आमतौर पर इसमें एक प्राथमिक परिणाम होता है। हालांकि, लगातार अंतराल में विश्वास अंतराल, परिकल्पना को शामिल नहीं करते हैं और इसलिए अन्य, संभावित अप्रासंगिक, तुलना के लिए समायोजन की आवश्यकता नहीं है। मान लीजिए कि मैं एक विशेष जीन से जुड़े फेनोटाइप्स का परीक्षण कर रहा था, जो कहता है कि ऊंचाई और रक्तचाप। मैं' d यह जानना पसंद करता है कि जीन के साथ और बिना उन लोगों के बीच ऊंचाई में कितना बड़ा अंतर है, और मैंने इसका कितना अच्छा अनुमान लगाया है। मुझे नहीं लगता कि इस तथ्य से कि मैंने रक्तचाप को मापा है, इससे कोई लेना-देना नहीं है। जहाँ यह बात हो सकती है कि अगर ये दोनों हमारे द्वारा परीक्षण किए गए सैकड़ों में से एकमात्र महत्वपूर्ण व्यक्ति थे। तब यह संभावना है कि अंतर, संभावित जवाबी प्रयोगों से बड़े हैं, जहां हमने केवल ऊंचाई और रक्तचाप को मापा था, लेकिन क्या यह सैकड़ों प्रयोग थे। हालाँकि उन परिस्थितियों में, कोई भी सरल समायोजन काम नहीं करेगा, और अनजाने में अनुमान देने के लिए बेहतर होगा लेकिन इस तुलना में आप कैसे आए। हमने विश्वास अंतरालों को ओवरलैप करने पर कुछ अवशेष भी प्रकाशित किए हैं। [२] टी देखें कि इस तथ्य से कि मैंने रक्तचाप भी मापा है, इससे कोई लेना-देना नहीं है। जहाँ यह बात हो सकती है कि अगर ये दोनों हमारे द्वारा परीक्षण किए गए सैकड़ों में से एकमात्र महत्वपूर्ण व्यक्ति थे। तब यह संभावना है कि अंतर, संभावित जवाबी प्रयोगों से बड़े हैं, जहां हमने केवल ऊंचाई और रक्तचाप को मापा था, लेकिन क्या यह सैकड़ों प्रयोग थे। हालाँकि उन परिस्थितियों में, कोई भी सरल समायोजन काम नहीं करेगा, और अनजाने में अनुमान देने के लिए बेहतर होगा लेकिन इस तुलना में आप कैसे आए। हमने विश्वास अंतरालों को ओवरलैप करने पर कुछ अवशेष भी प्रकाशित किए हैं। [२] टी देखें कि इस तथ्य से कि मैंने रक्तचाप भी मापा है, इससे कोई लेना-देना नहीं है। जहाँ यह बात हो सकती है कि अगर ये दोनों हमारे द्वारा परीक्षण किए गए सैकड़ों में से एकमात्र महत्वपूर्ण व्यक्ति थे। तब यह संभावना है कि अंतर, संभावित जवाबी प्रयोगों से बड़े हैं, जहां हमने केवल ऊंचाई और रक्तचाप को मापा, लेकिन क्या यह सैकड़ों प्रयोग किए। हालाँकि उन परिस्थितियों में, कोई भी सरल समायोजन काम नहीं करेगा, और अनजाने में अनुमान देने के लिए बेहतर होगा, लेकिन साफ ​​करें कि आपने इन तुलनाओं को कैसे प्राप्त किया। हमने विश्वास अंतरालों को ओवरलैप करने पर कुछ अवशेष भी प्रकाशित किए हैं। [२] अपेक्षित जवाबी प्रयोगों से बड़ा जहां हमने केवल ऊंचाई और रक्तचाप को मापा, लेकिन क्या यह सैकड़ों प्रयोग किए। हालाँकि उन परिस्थितियों में, कोई भी सरल समायोजन काम नहीं करेगा, और अनजाने में अनुमान देने के लिए बेहतर होगा, लेकिन साफ ​​करें कि आपने इन तुलनाओं को कैसे प्राप्त किया। हमने विश्वास अंतरालों को ओवरलैप करने पर कुछ अवशेष भी प्रकाशित किए हैं। [२] अपेक्षित जवाबी प्रयोगों से बड़ा जहां हमने केवल ऊंचाई और रक्तचाप को मापा, लेकिन क्या यह सैकड़ों प्रयोग किए। हालाँकि उन परिस्थितियों में, कोई भी सरल समायोजन काम नहीं करेगा, और अनजाने में अनुमान देने के लिए बेहतर होगा, लेकिन साफ ​​करें कि आपने इन तुलनाओं को कैसे प्राप्त किया। हमने विश्वास अंतरालों को ओवरलैप करने पर कुछ अवशेष भी प्रकाशित किए हैं। [२]

[१] कैंपबेल एमजे और स्विंसबैंक TDV (२०० ९) स्क्वायर वन में सांख्यिकी। 11 वीं एड ऑक्सफोर्ड; बीएमजे बुक्स ब्लैकवेल पब्लिशिंग

[२] जूलियस एसए, कैंपबेल एमजे, वाल्टर्स एसजे (२००)) भविष्य परीक्षण के परिणामों के आधार पर भविष्य के साधनों पर निर्भर करेगा। समकालीन नैदानिक ​​परीक्षण, 28, 352-357।


1
माइक ने सोचा उत्तेजक जवाब के लिए धन्यवाद। बेंजामिनी, होचबर्ग और येकुतिली का तर्क है कि तुलना "अप्रासंगिक" नहीं है, लेकिन वास्तव में एक साथ: "एक साथ सभी मापदंडों के मूल्य के आधार पर कार्रवाई की जानी चाहिए, जब इस प्रकार प्राथमिक कवरेज की आवश्यकता होती है।" नैदानिक ​​परीक्षण में उपचार में उन सभी का निरीक्षण शामिल होने की संभावना है, चाहे वे महत्वपूर्ण रूप से भिन्न हों या नहीं। यह एक स्पष्ट स्थिति है जहां एक साथ कवरेज की आवश्यकता होती है। " (केवल कुछ CI की चयनात्मक प्रस्तुति के मुद्दे को छोड़कर।)
एलेक्सिस

संयोग से, "मैं पी-मूल्यों का बहुत बड़ा प्रशंसक नहीं हूं, क्योंकि मेरा मानना ​​है कि मापदंडों का आकलन करना परिकल्पनाओं के परीक्षण की तुलना में आंकड़ों का बेहतर उपयोग है जो कभी भी सच नहीं हैं," आप आनंद ले सकते हैं कि क्यों लगातार परिकल्पना परीक्षण अस्वीकार करने की दिशा में पूर्वाग्रह बन जाता है। पर्याप्त रूप से बड़े नमूनों के साथ अशक्त परिकल्पना? । चीयर्स।
एलेक्सिस

1
हालांकि मैं आपसे सहमत हूं कि मापदंडों के लिए आत्मविश्वास अंतराल, अधिकांश प्रकार के निष्कर्षों के लिए पी-वैल्यू से बेहतर है, मुझे यकीन नहीं है कि यदि यह जरूरी है कि विश्वास अंतराल के साथ कई तुलनाओं के लिए कोई सुधार आवश्यक नहीं है। अधिकांश आत्मविश्वास अंतराल को अल्फा के उपयोग द्वारा परिभाषित किया गया है, ताकि कवरेज को निर्दिष्ट किया जा सके। यहां तक ​​कि सख्त परिकल्पना परीक्षण ढांचे से तलाक हो गया है, यह मुझे लगता है (उदाहरण के लिए, सिमुलेशन की जांच करने के लिए परेशान किए बिना) कि यह नाममात्र कवरेज (उदाहरण के लिए 95%, इसलिए अल्फा-0.05) जब कई तुलना कर रहे हैं शामिल किया गया।
रयान सीमन्स

2
माइक कैम्पबेल ने कहा कि "विश्वास अंतराल, लगातार परिभाषा में, परिकल्पना को शामिल नहीं करता है और इसलिए अन्य, संभावित अप्रासंगिक, तुलना के लिए समायोजन की आवश्यकता नहीं है।" यह एक अजीब बयान है। हालांकि CI प्रति "हाइपोथिसिस टेस्ट" को प्रतिबिंबित नहीं कर सकते हैं, लेकिन वे सांख्यिकीय परीक्षणों को दर्शाते हैं जिनकी एक निश्चित त्रुटि दर (जैसे, .05) है, और यह त्रुटि दर बढ़ जाती है क्योंकि परीक्षण की संख्या बढ़ जाती है - ठीक उसी मूल गणितीय द्वारा सिद्धांत जो शून्य परिकल्पना परीक्षणों पर लागू होता है। पी-वैल्यू के बजाय सीआई पर ध्यान केंद्रित करके कई तुलनाओं के मुद्दे से बच नहीं सकता है।
बोन्फेरोनी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.