एक समस्या की तुलना एकाधिक क्यों है?


44

मुझे यह समझना मुश्किल है कि वास्तव में कई तुलनाओं के साथ समस्या क्या है । एक सरल सादृश्य के साथ, यह कहा जाता है कि एक व्यक्ति जो कई निर्णय लेगा वह कई गलतियाँ करेगा। तो बहुत ही रूढ़िवादी एहतियात लागू किया जाता है, जैसे बोन्फेरोनी सुधार, ताकि संभावना बनाने के लिए, यह व्यक्ति किसी भी तरह की गलती करेगा, जितना संभव हो उतना कम।

लेकिन हम इस बात की परवाह क्यों करते हैं कि उस व्यक्ति ने उन सभी फैसलों में कोई गलती की है, जो उसने गलत निर्णयों के प्रतिशत के बजाय किया है ?

मुझे समझाने की कोशिश करो कि मुझे एक और सादृश्य के साथ क्या भ्रमित करता है। मान लीजिए कि दो जज हैं, एक 60 साल का है, और दूसरा 20 साल का है। तब बोन्फेरोनी सुधार बताता है कि 20 साल का है, जितना संभव हो उतना रूढ़िवादी होना चाहिए, निष्पादन के लिए निर्णय लेने में, क्योंकि वह एक न्यायाधीश के रूप में कई और वर्षों तक काम करेगा, कई और निर्णय करेगा, इसलिए उसे सावधान रहना होगा। लेकिन 60 वर्ष की आयु वाला व्यक्ति संभवतः जल्द ही सेवानिवृत्त हो जाएगा, कम निर्णय लेगा, इसलिए वह दूसरे की तुलना में अधिक लापरवाह हो सकता है। लेकिन वास्तव में, दोनों न्यायाधीशों को समान रूप से सावधान या रूढ़िवादी होना चाहिए, चाहे वे कितने भी निर्णय लें। मुझे लगता है कि यह समानता कम से कम वास्तविक समस्याओं के लिए अनुवाद करती है जहां बोन्फेरोनी सुधार लागू किया जाता है, जो मुझे प्रतिस्पद्र्धात्मक लगता है।


8
वास्तव में आपके प्रश्न का उत्तर नहीं है, लेकिन क्या आपने गलत डिस्कवरी दर (FDR) का सामना किया है? Narum द्वारा "बियॉन्ड
बोन्फ्रॉनी

जवाबों:


40

आपने कुछ ऐसा कहा है जो बोन्फेरोनी सुधार के लिए एक क्लासिक काउंटर तर्क है। क्या मुझे अपने हर परीक्षण के आधार पर अपनी अल्फा कसौटी को नहीं अपनाना चाहिए? इस तरह का विज्ञापन बेतुका निहितार्थ है कि क्यों कुछ लोग बोन्फेरोनी शैली सुधार को बिल्कुल नहीं मानते हैं। कभी-कभी जिस तरह का डेटा उनके करियर में होता है वह इस तरह का होता है कि यह कोई मुद्दा नहीं है। न्यायाधीशों के लिए जो सबूत के प्रत्येक नए टुकड़े पर एक या बहुत कम निर्णय लेते हैं, यह एक बहुत ही मान्य तर्क है। लेकिन 20 प्रतिवादियों के साथ न्यायाधीश के बारे में क्या है और जो डेटा के एक बड़े समूह (जैसे युद्ध न्यायाधिकरण) पर अपने फैसले को आधार बना रहे हैं?

आप तर्क के भाग पर किक को अनदेखा कर रहे हैं। आम तौर पर वैज्ञानिक किसी चीज की तलाश में होते हैं - अल्फा की तुलना में एक पी-मूल्य। हर एक को खोजने का प्रयास कैन में एक और किक है। यदि कोई इस पर पर्याप्त शॉट लेता है, तो अंततः उसे एक मिल जाएगा। इसलिए, उन्हें ऐसा करने के लिए दंडित किया जाना चाहिए।

जिस तरह से आप इन दोनों तर्कों का सामंजस्य बिठाते हैं, उन्हें एहसास होता है कि वे दोनों सच हैं। सबसे सरल उपाय यह है कि एकल डेटासेट के अंतर के परीक्षण को एक प्रकार की समस्या के रूप में देखा जा सकता है, लेकिन इससे बाहर सुधार के दायरे का विस्तार करना एक फिसलन ढलान होगा।

यह कई क्षेत्रों में एक वास्तविक रूप से कठिन समस्या है, विशेष रूप से एफएमआरआई जहां हजारों डेटा बिंदुओं की तुलना की जा रही है और कुछ होने की संभावना है। यह देखते हुए कि क्षेत्र ऐतिहासिक रूप से बहुत खोजपूर्ण रहा है, इस तथ्य को ठीक करने के लिए कुछ करना होगा कि मस्तिष्क के सैकड़ों क्षेत्र संयोग से महत्वपूर्ण रूप से शुद्ध दिखेंगे। इसलिए, उस क्षेत्र में कसौटी के समायोजन के कई तरीके विकसित किए गए हैं।

दूसरी ओर, कुछ क्षेत्रों में कोई व्यक्ति सबसे अधिक एक चर के 3 से 5 स्तरों को देख सकता है और हमेशा एक महत्वपूर्ण एनोवा होने पर हर संयोजन का परीक्षण कर सकता है। यह कुछ समस्याओं (टाइप 1 त्रुटियों) के लिए जाना जाता है, लेकिन यह विशेष रूप से भयानक नहीं है।

यह आपकी बातों पर निर्भर करता है। FMRI शोधकर्ता एक मानदंड पारी के लिए एक वास्तविक आवश्यकता को पहचानता है। एक छोटे से एनोवा को देखने वाला व्यक्ति महसूस कर सकता है कि परीक्षण से स्पष्ट रूप से वहाँ कुछ है। कई तुलनाओं पर उचित रूढ़िवादी दृष्टिकोण हमेशा उनके बारे में कुछ करना है, लेकिन केवल एक डेटासेट पर आधारित है। कोई भी नया डेटा कसौटी पर खरा उतरता है ... जब तक कि आप बायेसियन न हों ...


धन्यवाद, यह बहुत मददगार रहा है। जब मेरे पास पर्याप्त प्रतिनिधि होंगे तो मैं इसे वोट करूंगा।
AgCl

FMRI शोधकर्ता शायद झूठी डिस्कवरी दर (FDR) की कसौटी का भी उपयोग करेगा, क्योंकि यह परीक्षणों की लंबी अवधि में अल्फा * 100% गलत सकारात्मकता की गारंटी देता है।
ब्रैंडन

@ जॉन, क्या आप कृपया इस सवाल का जवाब दे सकते हैं आँकड़े ।stackexchange.com /questions/ 431011 / मुझे खुशी होगी, अगर आप कृपया मेरी मदद कर सकते हैं।
सब्बीर अहमद

26

अच्छी तरह से सम्मानित सांख्यिकीविदों ने कई तुलनाओं पर कई तरह के पद लिए हैं। यह एक सूक्ष्म विषय है। अगर किसी को लगता है कि यह सरल है, तो मुझे आश्चर्य होगा कि उन्होंने इसके बारे में कितना सोचा है।

यहाँ एंड्रयू गेलमैन से कई परीक्षण पर एक दिलचस्प बायेसियन परिप्रेक्ष्य है: क्यों हम (आमतौर पर) कई तुलनाओं के बारे में चिंता नहीं करते हैं


2
मुझे इस पेपर के बारे में जो दिलचस्प लगा वह यह है कि परिप्रेक्ष्य बायेसियन है, लेकिन कई तुलनाओं के लिए सुधारों को बदलने के लिए पेश किए गए पदानुक्रमित मॉडलिंग दृष्टिकोण को आपको बायेसियन होने की आवश्यकता नहीं है।
संयुक्ताक्षरी

1
मैं बस उस लेख को देख रहा था; मुझे लगता है कि शायद इसे और अधिक उद्धृत करने की आवश्यकता है। मुझे नाले के नीचे बहने वाले प्रभावों से नफरत है क्योंकि उन्नत कई तुलना तकनीक अच्छी तरह से ज्ञात नहीं हैं या करना आसान है। इसके विपरीत, एक लैमर अप्रोच मृत सरल है। मुझे आश्चर्य है कि क्या इसके साथ गंभीर समस्याएं हैं जिन पर विचार करने की आवश्यकता है।
रुसेलपिएर्स


13

इससे पहले की टिप्पणी से संबंधित, जो fMRI शोधकर्ता को याद रखना चाहिए, वह यह है कि चिकित्सकीय रूप से महत्वपूर्ण परिणाम क्या मायने रखते हैं, मस्तिष्क के fMRI पर एकल पिक्सेल की घनत्व शिफ्ट नहीं। यदि इससे नैदानिक ​​सुधार / अवरोध उत्पन्न नहीं होता है, तो इससे कोई फर्क नहीं पड़ता। यह कई तुलनाओं के बारे में चिंता को कम करने का एक तरीका है।

यह सभी देखें:

  1. बाउर, पी। (1991)। नैदानिक ​​परीक्षणों में कई परीक्षण। स्टेट मेड, 10 (6), 871-89; चर्चा 889-90।
  2. प्रूचन, एमए और वाक्लावी, एमए (2000)। नैदानिक ​​परीक्षणों में गुणन समायोजन के लिए व्यावहारिक दिशानिर्देश। नियंत्रण परीक्षण परीक्षण, 21 (6), 527-39।
  3. रोथमैन, केजे (1990)। कई तुलनाओं के लिए किसी समायोजन की आवश्यकता नहीं होती है। महामारी विज्ञान (कैम्ब्रिज, मास।), 1 (1), 43-6।
  4. पर्नेगर, टीवी (1998)। क्या गलत है bonferroni समायोजन के साथ। बीएमजे (क्लिनिकल रिसर्च एड।), 316 (7139), 1236-8।

यह भी निश्चित रूप से उद्धृत करने योग्य है: prefrontal.org/files/posters/Bennett-Salmon-2009.jpg
nico

मुझे यकीन है कि उन्हें अपनी भावनाओं के बारे में मृत सैल्मन पूछने में बहुत मज़ा आया था !!!
निको

इस पोस्ट में भी आरसीटी से संबंधित उपयोगी संदर्भ होते हैं: j.mp/bAgr1B
chl

10

विचारों को ठीक करने के लिए: जब आप सामने आएंगे तो मैं मामला , स्वतंत्र यादृच्छिक चर ऐसा है कि को से खींचा गया है । मैं मानता हूं कि आप जानना चाहते हैं कि किसका गैर शून्य मतलब है, औपचारिक रूप से आप परीक्षण करना चाहते हैं:n(Xi)i=1,,ni=1,,n XiN(θi,1)

H0i:θi=0 VsH1i:θi0

एक सीमा की परिभाषा: आपके पास बनाने के लिए निर्णय हैं और आपके पास अलग उद्देश्य हो सकते हैं। किसी दिए गए परीक्षण के लिए आप निश्चित रूप से एक सीमा से चयन करने के लिए जा रहे हैं और स्वीकार नहीं करने का फैसला अगर ।niτiH0i|Xi|>τi

विभिन्न विकल्प: आपको थ्रेसहोल्ड और इसके लिए आपके पास दो विकल्प हैं :τi

  1. सभी के लिए एक ही सीमा चुनें

  2. हर किसी के लिए एक अलग दहलीज चुनने के लिए (सबसे अक्सर एक डेटा सीमा, नीचे देखें)।

विभिन्न उद्देश्य: इन विकल्पों को विभिन्न उद्देश्यों के लिए संचालित किया जा सकता है जैसे कि

  • संभावना नियंत्रित गलत तरीके से अस्वीकार करने के लिए एक या एक से अधिक के लिए ।H0ii
  • गलत अलार्म अनुपात (या गलत डिस्कवरी दर) की उम्मीद को नियंत्रित करना

    अंत में आपका उद्देश्य क्या है, डेटावी दहलीज का उपयोग करना एक अच्छा विचार है।

आपके प्रश्न का मेरा उत्तर: आपका अंतर्ज्ञान डेटाविज थ्रेशोल्ड चुनने के लिए मुख्य अनुमान से संबंधित है। यह निम्नलिखित है (होल्म की प्रक्रिया के मूल में जो बोन्फेरोनी से अधिक शक्तिशाली है):

कल्पना कीजिए कि आपने पहले ही निम्नतम के लिए निर्णय ले लिया हैऔर निर्णय उन सभी के लिए को स्वीकार करना है। तब आपको केवल तुलना करनी होगी और आपने गलत तरीके से अस्वीकार करने के लिए कोई जोखिम नहीं उठाया है ! चूंकि आपने अपने बजट का उपयोग नहीं किया है, आप शेष परीक्षण के लिए थोड़ा अधिक जोखिम ले सकते हैं और एक बड़ी सीमा चुन सकते हैं।| X i | H 0 i n - p H 0 ip|Xi|H0inpH0i

आपके न्यायाधीशों के मामले में: मैं मानता हूं (और मुझे लगता है कि आपको भी ऐसा ही करना चाहिए) कि दोनों न्यायाधीशों के जीवन के लिए झूठे आरोपों के बजट समान हैं। 60 साल का जज कम रूढ़िवादी हो सकता है अगर, अतीत में, उसने किसी पर आरोप नहीं लगाया! लेकिन अगर वह पहले से ही बहुत सारे आरोप लगाता है तो वह अधिक रूढ़िवादी होगा और शायद आप के जज से भी ज्यादा।


मुझे लगता है कि आपके पास अपनी परिकल्पना में एक टाइपो है - वे दोनों एक ही प्रतीत होते हैं ...
walkytalky

2

एक निराशाजनक (और मजेदार) लेख; http://www.jsur.org/ar/jsur_ben102010.pdf ) कुछ प्रैक्टिकल स्टडी में मल्टीपल टेस्टिंग करेक्शन की जरूरत के बारे में कई वैरिएबल जैसे fmri को विकसित करना। यह संक्षिप्त उद्धरण अधिकांश संदेश कहता है:

"[...] हमने विषय के रूप में एक पोस्टमार्टम अटलांटिक सैल्मन के साथ एक एफएमआरआई स्कैनिंग सत्र पूरा किया। सामन को उसी सामाजिक परिप्रेक्ष्य वाले कार्य को दिखाया गया जिसे बाद में मानव विषयों के एक समूह को प्रशासित किया गया था।"

मेरे अनुभव में, उपयोगकर्ताओं को कई परीक्षण सुधारों का उपयोग करने के लिए प्रोत्साहित करने के लिए एक भयानक तर्क है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.