बड़ा अच्छा सवाल! आइए पीछे हटते हैं और समझते हैं कि बोन्फेरोनी ने क्या किया था, और एक विकल्प विकसित करने के लिए बेंजामिनी और होचबर्ग के लिए क्यों आवश्यक था।
यह हाल के वर्षों में कई परीक्षण सुधार नामक एक प्रक्रिया करने के लिए आवश्यक और अनिवार्य हो गया है। यह उच्च थ्रूपुट विज्ञान के साथ एक साथ किए जा रहे परीक्षणों की बढ़ती संख्या के कारण है, विशेष रूप से आनुवांशिकी में पूरे जीनोम एसोसिएशन अध्ययन (GWAS) के आगमन के साथ। जेनेटिक्स के लिए मेरे संदर्भ का बहाना करें, क्योंकि यह मेरा कार्य क्षेत्र है। यदि हम पर एक साथ 1,000,000 परीक्षण कर रहे हैं , तो हम 50 , 000 गलत सकारात्मक की उम्मीद करेंगे । यह बहुत बड़ा है, और इस प्रकार हमें उस स्तर को नियंत्रित करना चाहिए जिस पर महत्व का आकलन किया जाता है। बोनफेरोनी सुधार, अर्थात्, स्वतंत्र परीक्षणों की संख्या द्वारा स्वीकृति सीमा (0.05) को विभाजित करना ( 0.05 / एम)पी= 0.0550 , 000 परिवार की त्रुटि दर ( एफ डब्ल्यू ई आर ) के लिए सही है।( 0.05 / एम)एफडब्ल्यूएआर
यह सच है क्योंकि एफडब्ल्यूईआर परीक्षण-वार त्रुटि दर ( ) से संबंधित है समीकरण एफ डब्ल्यू ई आर = 1 - ( 1 - टी डब्ल्यू ई आर ) एम । अर्थात्, 100 प्रतिशत माइनस 1 प्रदर्शन किए गए स्वतंत्र परीक्षणों की संख्या की शक्ति के लिए उठाए गए परीक्षण वार त्रुटि दर को घटाता है। धारणा बनाना कि ( 1 - 0.05 ) 1 / M = 1 - 0.05टीडब्ल्यूएआरएफडब्ल्यूएआर = 1 - ( 1 - टीडब्ल्यूएआर )एम ,TWER≈0.05 देता है( 1 - 0.05 )1 / एम= 1 - 0.05एम , जो एम पूरी तरह से स्वतंत्र परीक्षणों के लिए समायोजित पी मूल्य है।टीडब्ल्यूएआर ≈ 0.05एम
बेन्जामिनी और होचबर्ग के रूप में अब जो समस्या हमारे सामने आती है, वह यह है कि सभी परीक्षण पूरी तरह से स्वतंत्र नहीं हैं। इस प्रकार, बोन्फ्रोनी सुधार, हालांकि मजबूत और लचीला है, एक अतिशयोक्ति है । आनुवंशिकी में मामले पर विचार करें जहां दो जीन एक मामले में जुड़े हुए हैं लिंकेज डिसिपिलिब्रियम; जब एक जीन में एक उत्परिवर्तन होता है, तो दूसरे को व्यक्त किए जाने की अधिक संभावना होती है। ये स्पष्ट रूप से स्वतंत्र परीक्षण नहीं हैं, हालांकि बोनफ्रोनी सुधार में उन्हें माना जाता है । यह वह जगह है जहां हम यह देखना शुरू करते हैं कि एम द्वारा पी मान को विभाजित करना एक ऐसी सीमा बना रहा है जो कि ग्रहण किए गए स्वतंत्र परीक्षणों के कारण कृत्रिम रूप से कम है जो वास्तव में एक-दूसरे को प्रभावित करते हैं, एक एम बनाते हैं जो हमारी वास्तविक स्थिति के लिए बहुत बड़ी है, जहां चीजें पैदा होती हैं 'स्वतंत्र नहीं है।
बेनजामिनी और होचबर्ग द्वारा सुझाई गई प्रक्रिया, और येकुतिली (और कई अन्य) द्वारा संवर्धित बोन्फेरोनी की तुलना में अधिक उदार है, और वास्तव में बोन्फेरोनी सुधार केवल अब तक के सबसे बड़े अध्ययनों में उपयोग किया जाता है। ऐसा इसलिए है, क्योंकि एफडीआर में, हम परीक्षणों के हिस्से पर कुछ अन्योन्याश्रितता का अनुमान लगाते हैं और इस प्रकार एक एम जो बहुत बड़ा और अवास्तविक होता है और उन परिणामों से छुटकारा पा लेता है जिन्हें हम वास्तव में परवाह करते हैं। इसलिए 1000 परीक्षणों के मामले में जो स्वतंत्र नहीं हैं, सच्चा एम 1000 नहीं होगा, लेकिन निर्भरता के कारण कुछ छोटा है। इस प्रकार जब हम ०.०५ को १००० से विभाजित करते हैं, तो थ्रेशोल्ड भी सख्त होता है और कुछ परीक्षणों से बचता है जो ब्याज की हो सकती हैं।
मुझे यकीन नहीं है कि आप निर्भरता के लिए नियंत्रण के पीछे यांत्रिकी के बारे में परवाह करते हैं, हालांकि अगर आप करते हैं तो मैंने आपके संदर्भ के लिए येकुट्टीली पेपर को लिंक किया है। मैं आपकी जानकारी और जिज्ञासा के लिए कुछ अन्य चीजें भी संलग्न करूंगा।
आशा है कि इसने किसी तरह से मदद की है, अगर मैंने कुछ भी गलत तरीके से प्रस्तुत किया है तो कृपया मुझे बताएं।
~ ~ ~
संदर्भ
सकारात्मक निर्भरता पर येकुतेली पेपर - http://www.math.tau.ac.il/~ybenja/MyPapers/benjamini_yekutieli_ANNSTAT2001.pdf
(देखें 1.3 - समस्या।)
बोनफर्रोनी और ब्याज की अन्य चीजों की व्याख्या - प्रकृति आनुवंशिकी समीक्षा। बड़े पैमाने पर आनुवांशिक अध्ययनों में सांख्यिकीय शक्ति और महत्व का परीक्षण - पाक सी शाम और शॉन एम पर्ससेल
(बॉक्स 3 देखें)
http://en.wikipedia.org/wiki/Familywise_error_rate
संपादित करें:
मेरे पिछले उत्तर में मैंने सीधे सकारात्मक निर्भरता को परिभाषित नहीं किया था, जो कि पूछा गया था। येकुतेली पेपर में, अनुभाग 2.2
सकारात्मक निर्भरता का हकदार है, और मैं यह सुझाव देता हूं क्योंकि यह बहुत विस्तृत है। हालाँकि, मेरा मानना है कि हम इसे थोड़ा अधिक सफल बना सकते हैं।
मैं0मैं0
एक्समैं0एक्समैं0एक्समैं0एक्सएक्स
पी
संक्षेप में, सकारात्मक निर्भरता की संपत्ति वास्तव में सच्चे शून्य परीक्षण आँकड़ों के हमारे सेट पर परीक्षण आँकड़ों के हमारे पूरे सेट के सकारात्मक प्रतिगमन निर्भरता की संपत्ति है, और हम 0.05 की FDR के लिए नियंत्रण करते हैं; इस प्रकार पी मान नीचे से ऊपर (कदम प्रक्रिया) पर जाते हैं, वे अशक्त सेट का हिस्सा होने की संभावना में वृद्धि करते हैं।
कॉवियर्स मैट्रिक्स के बारे में टिप्पणियों में मेरा पूर्व उत्तर गलत नहीं था, बस थोड़ा अस्पष्ट था। मुझे उम्मीद है कि यह थोड़ा और अधिक मदद करता है।