एफडीआर नियंत्रण के लिए सामान्य विधि का उपयोग करने के लिए एक शर्त के रूप में "सकारात्मक निर्भरता" का अर्थ है


36

बेनजामिनी और होचबर्ग ने झूठी खोज दर (एफडीआर) को नियंत्रित करने के लिए पहला (और अभी भी सबसे व्यापक रूप से इस्तेमाल किया जाता है, मुझे लगता है) विधि विकसित की है।

मैं पी मानों के एक समूह के साथ शुरू करना चाहता हूं, प्रत्येक एक अलग तुलना के लिए, और तय करें कि कौन से लोग "खोज" कहे जाने के लिए पर्याप्त हैं, एफडीआर को एक निर्दिष्ट मूल्य पर नियंत्रित करते हैं (10% कहते हैं)। सामान्य विधि की एक धारणा यह है कि तुलनाओं का सेट या तो स्वतंत्र है या "सकारात्मक निर्भरता" है, लेकिन मैं यह नहीं समझ सकता कि पी के मूल्यों के सेट का विश्लेषण करने के संदर्भ में उस वाक्यांश का क्या मतलब है।


1
मेरे जवाब के लिए इनाम देने के लिए धन्यवाद, हार्वे! क्या आप कहेंगे कि यह आपके लिए इस मुद्दे को हल करता है, या आप एक अधिक विस्तृत प्रदर्शनी की तलाश कर रहे हैं? मैंने देखा कि आपने अभी तक किसी भी उत्तर को स्वीकार नहीं किया है, इसीलिए मैं स्पष्ट करना चाहूंगा। धन्यवाद। शायद आप अपने क्यू को स्पष्ट करने के लिए टिप्पणी कर सकते हैं या संपादित कर सकते हैं जिसे आप अभी भी स्पष्ट करना चाहेंगे।
अमीबा का कहना है कि मोनिका

2
@amoeba। इनाम के लिए समय सीमा मुझ पर थी, और आपका जवाब अब तक सबसे अच्छा था। सच कहूं, तो यह मेरे लिए कभी नहीं हुआ कि एक जवाब देने वाला भी जवाब स्वीकार नहीं कर रहा था। लेकिन मुझे पता है कि वे अलग हैं (मैं जेट लैग को दोष दूंगा)। लेकिन एक पूर्ण उत्तर में वास्तव में यथार्थवादी उदाहरणों को शामिल करने की आवश्यकता होती है जहां पी मूल्यों का सेट दोनों करते हैं और सकारात्मक निर्भरता नहीं रखते हैं। मैं उम्मीद में एक सप्ताह के लिए एक उत्तर को स्वीकार करना बंद कर दूंगा कि कोई व्यक्ति दोनों प्रकार के उदाहरण दे सकता है, इसलिए अर्थ स्पष्ट है।
हार्वे मोटुलस्की

यह वास्तव में एक संतोषजनक उदाहरण नहीं है, लेकिन सकारात्मक निर्भरता के साथ पी-मूल्यों के साथ आना वास्तव में आसान है अगर हम सहसंबद्ध चर पर एक-पूंछ वाले परीक्षण करने के बारे में सोचते हैं। कल्पना करें कि मैं परीक्षण कर रहा हूं कि क्या ए = 0 और यह भी कि क्या बी = 0 एक-पूंछ वाले विकल्पों के खिलाफ है (ए> 0 और बी> 0)। इसके अलावा कल्पना कीजिए कि बी ए पर निर्भर करता है। उदाहरण के लिए, कल्पना कीजिए कि मैं जानना चाहता हूं कि क्या जनसंख्या में पुरुषों की तुलना में अधिक महिलाएं हैं, और यह भी कि अगर जनसंख्या में वृषण से अधिक अंडाशय हैं। स्पष्ट रूप से पहले प्रश्न के पी-मूल्य को जानने के बाद दूसरे के लिए पी-मान की हमारी उम्मीद बदल जाती है
याकूब सोकोलर

धन्यवाद, हार्वे। मुझे आशा है कि यह स्पष्ट था कि मैं अपना उत्तर स्वीकार करने के लिए आपको धक्का देने की कोशिश नहीं कर रहा था! मैं वास्तव में इस विषय का विशेषज्ञ नहीं हूं, बस इसे समझने की कोशिश कर रहा हूं।
अमीबा का कहना है कि

दोनों पी-वैल्यू एक ही दिशा में बदलते हैं, और यह पीआरडी है। लेकिन अगर मैं इसके बजाय दूसरी परिकल्पना का परीक्षण करता हूं कि जनसंख्या 2 में अंडाशय की तुलना में अधिक वृषण हैं, तो पहले पी-मूल्य में वृद्धि के रूप में दूसरे पी-मूल्य के लिए हमारी उम्मीद कम हो जाती है। यह PRD नहीं है।
जैकब सोकोलर

जवाबों:


20

आपके प्रश्न से और विशेष रूप से आपकी टिप्पणियों से लेकर अन्य उत्तरों तक, यह मुझे लगता है कि आप मुख्य रूप से "बड़ी तस्वीर" के बारे में उलझन में हैं: अर्थात्, "सकारात्मक निर्भरता" का इस संदर्भ में क्या मतलब है - क्या विरोध किया PRDS स्थिति का तकनीकी अर्थ है। तो मैं बड़ी तस्वीर के बारे में बात करूंगा।

बड़ी तस्वीर

कल्पना कीजिए कि आप नल परिकल्पनाओं का परीक्षण कर रहे हैं , और कल्पना करें कि ये सभी सत्य हैं। एन पी में से प्रत्येक एक यादृच्छिक चर है; बार-बार प्रयोग दोहरा लाभ होगा एक differnet पी हर बार -value, इसलिए एक के वितरण के बारे में बात कर सकते हैं पी -values (शून्य से कम)। यह अच्छी तरह से ज्ञात है कि किसी भी परीक्षा के लिए, का वितरण है पी अशक्त तहत -values वर्दी होना चाहिए; इसलिए मल्टीप्लेट टेस्टिंग के मामले में, पी के सभी एन सीमांत वितरण समान होंगे।एनएन पीपीपीपीएनपी

यदि सभी डेटा और सभी परीक्षण एक-दूसरे से स्वतंत्र हैं, तो पी- वैल्यू का संयुक्त एन -डायमेंशनल वितरण भी समान होगा। यह सच होगा जैसे एक क्लासिक "जेली-बीन" स्थिति में जब स्वतंत्र चीजों का एक गुच्छा परीक्षण किया जा रहा है:एनएनपी

हरी जेली बीन्स

हालांकि, ऐसा होना जरूरी नहीं है। वैल्यू की कोई भी जोड़ी सैद्धांतिक रूप से सकारात्मक या नकारात्मक रूप से सहसंबद्ध हो सकती है, या किसी और जटिल तरीके से निर्भर हो सकती है। चार समूहों के बीच के साधनों में सभी जोड़ीदार अंतरों के परीक्षण पर विचार करें; यह वह जगह है एन = 4 3 / 2 = 6 परीक्षण। अकेले छह पी में से प्रत्येक- समान रूप से वितरित किया जाता है। लेकिन वे सभी सकारात्मक रूप से सहसंबद्ध होते हैं: यदि (किसी दिए गए प्रयास पर) समूह ए को विशेष रूप से कम मतलब है, तो ए-बनाम-बी तुलना कम पी -यील्ड प्राप्त कर सकती है (यह एक गलत सकारात्मक होगा)। लेकिन इस स्थिति में यह संभावना है कि ए-बनाम-सी, साथ ही ए-बनाम-डी भी कम पी उपज देगापीएन=43/2=6पीपीपी-values। तो -values स्पष्ट रूप से गैर-स्वतंत्र हैं और इसके अलावा वे सकारात्मक दूसरे के बीच सहसंबंध हैं।पी

यह, अनौपचारिक रूप से, "सकारात्मक निर्भरता" किसको संदर्भित करता है।

ऐसा लगता है कि कई परीक्षण में एक सामान्य स्थिति है। एक और उदाहरण कई चर में अंतर के लिए परीक्षण होगा जो एक दूसरे के बीच सहसंबद्ध हैं। उनमें से एक में एक महत्वपूर्ण अंतर प्राप्त करने से दूसरे में एक महत्वपूर्ण अंतर प्राप्त करने की संभावना बढ़ जाती है।

यह एक प्राकृतिक उदाहरण के साथ आने के लिए मुश्किल है जहां वैल्यू "नकारात्मक रूप से निर्भर" होंगे। @ user43849 ने उपरोक्त टिप्पणियों में टिप्पणी की कि एकतरफा परीक्षणों के लिए यह आसान है:पी

कल्पना कीजिए कि मैं परीक्षण कर रहा हूं कि क्या ए = 0 और यह भी कि क्या बी = 0 एक-पूंछ वाले विकल्पों के खिलाफ है (ए> 0 और बी> 0)। इसके अलावा कल्पना कीजिए कि बी ए पर निर्भर करता है। उदाहरण के लिए, कल्पना कीजिए कि मैं जानना चाहता हूं कि क्या जनसंख्या में पुरुषों की तुलना में अधिक महिलाएं हैं, और यह भी कि जनसंख्या में वृषण से अधिक अंडाशय हैं। पहले प्रश्न के पी-मूल्य को स्पष्ट रूप से जानना दूसरे के लिए पी-मूल्य की हमारी अपेक्षा को बदल देता है। दोनों पी-वैल्यू एक ही दिशा में बदलते हैं, और यह पीआरडी है। लेकिन अगर मैं इसके बजाय दूसरी परिकल्पना का परीक्षण करता हूं कि जनसंख्या 2 में अंडाशय की तुलना में अधिक वृषण हैं, तो पहले पी-मूल्य में वृद्धि के रूप में दूसरे पी-मूल्य के लिए हमारी उम्मीद कम हो जाती है। यह PRD नहीं है।

लेकिन मैं अभी तक बिंदु नल के साथ एक प्राकृतिक उदाहरण के साथ आने में असमर्थ रहा हूं।


अब, "सकारात्मक निर्भरता" का सटीक गणितीय सूत्रीकरण जो बेंजामिनी-होचबर्ग प्रक्रिया की वैधता की गारंटी देता है, बल्कि मुश्किल है। जैसा कि अन्य उत्तरों में उल्लेख किया गया है, मुख्य संदर्भ बेनजामिनी और येकुतेली 2001 है ; वे दिखाते हैं कि पीआरडीएस संपत्ति ("सबसेट से प्रत्येक पर सकारात्मक प्रतिगमन निर्भरता") बेंजामिनी-होम्सबर्ग प्रक्रिया को पूरा करती है। यह पीआरडी ("सकारात्मक प्रतिगमन निर्भरता") संपत्ति का एक सुकून भरा रूप है, जिसका अर्थ है कि पीआरडी पीआरडीएस का अर्थ है और इसलिए बेंजामिनी-होचबर्ग प्रक्रिया को भी पूरा करता है।

PRD / PRDS की परिभाषाओं के लिए @ user43849 का उत्तर (+1) और बेंजामिनी और येकुटिलियल पेपर देखें। परिभाषाएँ बल्कि तकनीकी हैं और मुझे उनकी अच्छी समझ नहीं है। वास्तव में, बी एंड वाई ने कई अन्य संबंधित अवधारणाओं का भी उल्लेख किया है: क्रम दो (एमटीपी 2) और सकारात्मक संघ की कुल सकारात्मकता का बहुविध सकारात्मकता। B & Y के अनुसार, वे निम्नानुसार हैं (चित्र मेरा है):

पीआरडी, पीआरडीएस, एमटीपी 2, और पीए

MTP2 पीआरडी का अर्थ है कि पीआरडीएस का मतलब है जो बीएच प्रक्रिया की शुद्धता की गारंटी देता है। पीआरडी भी पीए का तात्पर्य है, लेकिन पीए PRDS।


नकारात्मक निर्भरता का एक उदाहरण होगा पद हॉक जोड़ो में परीक्षण के बाद, कहते हैं, एक तीन समूहों, की एनोवा oneway जहां , लेकिन ˉ एक्स बी < μ बी , जबकि ˉ एक्स एकμ एक , और ˉ एक्स सीμ सी , इसलिए जब पी  बनाम  बी है कम होने की संभावना को अस्वीकार करने के लिए (क्योंकि तहत एच 0 | ˉ एक्स - ˉμ<μबी<μसीx¯B<μBx¯AμAx¯CμCpA vs. BH0 ), लेकिन निर्भरतापीबी बनाम सी केकारणअस्वीकार करने कीअधिकसंभावना है? |एक्स¯-एक्स¯बी|<|एक्स¯बी-एक्स¯सी|पीबी बनाम सी
एलेक्सिस

1
@ अलेक्सिस मैं खुद इन पंक्तियों के साथ सोच रहा था, लेकिन मुझे नहीं लगता कि यह काम करता है क्योंकि हमें इस बात पर विचार करने की आवश्यकता है कि अशक्त के तहत क्या होता है । इस मामले में, अशक्त है कि , और इसलिए आपका तर्क टूट जाता है। μA=μB=μसी
अमीबा का कहना है कि

इसलिए, यदि नकारात्मक निर्भरता स्थितियों के बारे में सोचना मुश्किल है, तो स्वतंत्र समूहों के बारे में एक सर्वग्राही अशक्त परिकल्पना की अस्वीकृति के बाद बेंजामिन-होचबर्ग प्रक्रिया पोस्ट हॉक जोड़ी के परीक्षणों जैसी स्थितियों के लिए वैध है (जैसे कि मार्ग को अवरुद्ध किया गया है एनोवा, कोचरन की क्यू, क्रुस्क्ल- वालिस, आदि)?
एलेक्सिस

@ ऐलेक्सिस मेरा मानना ​​है कि यह सही है, हाँ। मैं अभी भी नकारात्मक निर्भरता के साथ एक प्राकृतिक उदाहरण के साथ आने की कोशिश कर रहा हूं ...
अमीबा ने कहा कि पुनर्जीवित मोनिका

चट्टान! तुम कर सकती हो! :) ("लड़की" शब्द के लिंग-मुक्त अर्थ के लिए;)।
एलेक्सिस

18

बड़ा अच्छा सवाल! आइए पीछे हटते हैं और समझते हैं कि बोन्फेरोनी ने क्या किया था, और एक विकल्प विकसित करने के लिए बेंजामिनी और होचबर्ग के लिए क्यों आवश्यक था।

यह हाल के वर्षों में कई परीक्षण सुधार नामक एक प्रक्रिया करने के लिए आवश्यक और अनिवार्य हो गया है। यह उच्च थ्रूपुट विज्ञान के साथ एक साथ किए जा रहे परीक्षणों की बढ़ती संख्या के कारण है, विशेष रूप से आनुवांशिकी में पूरे जीनोम एसोसिएशन अध्ययन (GWAS) के आगमन के साथ। जेनेटिक्स के लिए मेरे संदर्भ का बहाना करें, क्योंकि यह मेरा कार्य क्षेत्र है। यदि हम पर एक साथ 1,000,000 परीक्षण कर रहे हैं , तो हम 50 , 000 गलत सकारात्मक की उम्मीद करेंगे । यह बहुत बड़ा है, और इस प्रकार हमें उस स्तर को नियंत्रित करना चाहिए जिस पर महत्व का आकलन किया जाता है। बोनफेरोनी सुधार, अर्थात्, स्वतंत्र परीक्षणों की संख्या द्वारा स्वीकृति सीमा (0.05) को विभाजित करना ( 0.05 / एम)पी=0.0550,000 परिवार की त्रुटि दर ( एफ डब्ल्यू आर ) के लिए सही है।(0.05/एम)एफडब्ल्यूआर

यह सच है क्योंकि एफडब्ल्यूईआर परीक्षण-वार त्रुटि दर ( ) से संबंधित है समीकरण एफ डब्ल्यू आर = 1 - ( 1 - टी डब्ल्यू आर ) एम । अर्थात्, 100 प्रतिशत माइनस 1 प्रदर्शन किए गए स्वतंत्र परीक्षणों की संख्या की शक्ति के लिए उठाए गए परीक्षण वार त्रुटि दर को घटाता है। धारणा बनाना कि ( 1 - 0.05 ) 1 / M = 1 - 0.05टीडब्ल्यूआरएफडब्ल्यूआर=1-(1-टीडब्ल्यूआर)एम ,TWER0.05 देता है(1-0.05)1/एम=1-0.05एम , जो एम पूरी तरह से स्वतंत्र परीक्षणों के लिए समायोजित पी मूल्य है।टीडब्ल्यूआर0.05एम

बेन्जामिनी और होचबर्ग के रूप में अब जो समस्या हमारे सामने आती है, वह यह है कि सभी परीक्षण पूरी तरह से स्वतंत्र नहीं हैं। इस प्रकार, बोन्फ्रोनी सुधार, हालांकि मजबूत और लचीला है, एक अतिशयोक्ति है । आनुवंशिकी में मामले पर विचार करें जहां दो जीन एक मामले में जुड़े हुए हैं लिंकेज डिसिपिलिब्रियम; जब एक जीन में एक उत्परिवर्तन होता है, तो दूसरे को व्यक्त किए जाने की अधिक संभावना होती है। ये स्पष्ट रूप से स्वतंत्र परीक्षण नहीं हैं, हालांकि बोनफ्रोनी सुधार में उन्हें माना जाता है । यह वह जगह है जहां हम यह देखना शुरू करते हैं कि एम द्वारा पी मान को विभाजित करना एक ऐसी सीमा बना रहा है जो कि ग्रहण किए गए स्वतंत्र परीक्षणों के कारण कृत्रिम रूप से कम है जो वास्तव में एक-दूसरे को प्रभावित करते हैं, एक एम बनाते हैं जो हमारी वास्तविक स्थिति के लिए बहुत बड़ी है, जहां चीजें पैदा होती हैं 'स्वतंत्र नहीं है।

बेनजामिनी और होचबर्ग द्वारा सुझाई गई प्रक्रिया, और येकुतिली (और कई अन्य) द्वारा संवर्धित बोन्फेरोनी की तुलना में अधिक उदार है, और वास्तव में बोन्फेरोनी सुधार केवल अब तक के सबसे बड़े अध्ययनों में उपयोग किया जाता है। ऐसा इसलिए है, क्योंकि एफडीआर में, हम परीक्षणों के हिस्से पर कुछ अन्योन्याश्रितता का अनुमान लगाते हैं और इस प्रकार एक एम जो बहुत बड़ा और अवास्तविक होता है और उन परिणामों से छुटकारा पा लेता है जिन्हें हम वास्तव में परवाह करते हैं। इसलिए 1000 परीक्षणों के मामले में जो स्वतंत्र नहीं हैं, सच्चा एम 1000 नहीं होगा, लेकिन निर्भरता के कारण कुछ छोटा है। इस प्रकार जब हम ०.०५ को १००० से विभाजित करते हैं, तो थ्रेशोल्ड भी सख्त होता है और कुछ परीक्षणों से बचता है जो ब्याज की हो सकती हैं।

मुझे यकीन नहीं है कि आप निर्भरता के लिए नियंत्रण के पीछे यांत्रिकी के बारे में परवाह करते हैं, हालांकि अगर आप करते हैं तो मैंने आपके संदर्भ के लिए येकुट्टीली पेपर को लिंक किया है। मैं आपकी जानकारी और जिज्ञासा के लिए कुछ अन्य चीजें भी संलग्न करूंगा।

आशा है कि इसने किसी तरह से मदद की है, अगर मैंने कुछ भी गलत तरीके से प्रस्तुत किया है तो कृपया मुझे बताएं।

~ ~ ~

संदर्भ

सकारात्मक निर्भरता पर येकुतेली पेपर - http://www.math.tau.ac.il/~ybenja/MyPapers/benjamini_yekutieli_ANNSTAT2001.pdf

(देखें 1.3 - समस्या।)

बोनफर्रोनी और ब्याज की अन्य चीजों की व्याख्या - प्रकृति आनुवंशिकी समीक्षा। बड़े पैमाने पर आनुवांशिक अध्ययनों में सांख्यिकीय शक्ति और महत्व का परीक्षण - पाक सी शाम और शॉन एम पर्ससेल

(बॉक्स 3 देखें)

http://en.wikipedia.org/wiki/Familywise_error_rate

संपादित करें:

मेरे पिछले उत्तर में मैंने सीधे सकारात्मक निर्भरता को परिभाषित नहीं किया था, जो कि पूछा गया था। येकुतेली पेपर में, अनुभाग 2.2सकारात्मक निर्भरता का हकदार है, और मैं यह सुझाव देता हूं क्योंकि यह बहुत विस्तृत है। हालाँकि, मेरा मानना ​​है कि हम इसे थोड़ा अधिक सफल बना सकते हैं।

मैं0मैं0

PRDS

एक्समैं0एक्समैं0एक्समैं0एक्सएक्स

पी

संक्षेप में, सकारात्मक निर्भरता की संपत्ति वास्तव में सच्चे शून्य परीक्षण आँकड़ों के हमारे सेट पर परीक्षण आँकड़ों के हमारे पूरे सेट के सकारात्मक प्रतिगमन निर्भरता की संपत्ति है, और हम 0.05 की FDR के लिए नियंत्रण करते हैं; इस प्रकार पी मान नीचे से ऊपर (कदम प्रक्रिया) पर जाते हैं, वे अशक्त सेट का हिस्सा होने की संभावना में वृद्धि करते हैं।

कॉवियर्स मैट्रिक्स के बारे में टिप्पणियों में मेरा पूर्व उत्तर गलत नहीं था, बस थोड़ा अस्पष्ट था। मुझे उम्मीद है कि यह थोड़ा और अधिक मदद करता है।


6
धन्यवाद। आप एफडीआर को नियंत्रित करने वाले बनाम परिवार की त्रुटि दर (बोनफेरोनी आदि) को नियंत्रित करने का एक स्पष्ट अवलोकन प्रदान करते हैं, लेकिन मुझे अभी भी समझ में नहीं आया कि "सकारात्मक निर्भरता" का क्या मतलब है। इस बात पर विचार करें कि मेरे पास 1000 पी मूल्य हैं, 1000 विभिन्न जीनों की अभिव्यक्ति की अभिव्यक्ति और कुछ बीमारी के साथ लोगों की तुलना करना। मैं BH विधि का उपयोग यह तय करने के लिए करता हूं कि इनमें से कौन सी तुलना "खोज" है। इस संदर्भ में "सकारात्मक निर्भरता" का क्या अर्थ है?
हार्वे मोटुलस्की 13

9
एक छोटा लेकिन महत्वपूर्ण नोट: बोन्फेरोनी स्वतंत्रता के संबंध में बिल्कुल कोई धारणा नहीं बनाता है। वास्तव में, यह पारस्परिक रूप से अनन्य मामले में सही ढंग से कवर होगा, जो एक तरह से, स्वतंत्र रूप से दूर है जितना आप प्राप्त कर सकते हैं। वहाँ है एक सुधार प्रक्रिया (सिदक) कि स्वतंत्रता मान करता है और अधिक दृढ़ता से है कि इस धारणा के तहत FWER नियंत्रित करेगा। इस उत्तर के अन्य पहलुओं के साथ ही कुछ हल्के टच-अप का उपयोग किया जा सकता है।
कार्डिनल

2
@ क्रिस मैं अभी भी समझ में नहीं आता। "तत्वों के बीच सहसंयोजक मैट्रिक्स"? मैं P मानों की एक सूची के साथ शुरू करता हूं, और यह तय करना चाहता हूं कि "एफडीआर नियंत्रित (साथ एफडीआर) के साथ" खोजों "के लायक होने के लिए पर्याप्त कम हैं। सहसंयोजक मैट्रिक्स के तत्व क्या हैं? कहें कि प्रत्येक पी मान समूहों के बीच एक विशेष जीन की अभिव्यक्ति की तुलना कर रहा है, और ऐसे कई जीन हैं। प्रत्येक जीन के लिए, परीक्षण में P मान के परिणामस्वरूप समूहों की तुलना की जाती है। इसका क्या अर्थ है, इस स्थिति में, "तत्वों को एक साथ अलग करने के लिए" या "स्वयं के बीच सकारात्मक संबंध" होने के लिए?
हार्वे मोटुलस्की

2
@ChrisC धन्यवाद। यह अधिक स्पष्ट हो गया है, लेकिन मैं अभी भी वास्तव में समझ नहीं पा रहा हूं कि इस धारणा का क्या मतलब है। विधि के पीछे की धारणा के बारे में जानने का पूरा बिंदु यह जानना है कि कब आप इसका उल्लंघन कर रहे हैं। तो यह कुछ परिदृश्यों को सूचीबद्ध करने में मदद करेगा जहां धारणा सच नहीं है। जब एक कम पी मान शून्य परिकल्पना के झूठे होने की उच्च संभावना से जुड़ा नहीं होगा?
हार्वे मोटुलस्की

1
इस सवाल का जवाब नहीं है।
एलेक्सिस

10

मुझे यह प्री-प्रिंट अर्थ समझने में मददगार लगा। यह कहा जाना चाहिए कि मैं इस उत्तर को विषय के विशेषज्ञ के रूप में नहीं, बल्कि समुदाय द्वारा समझने और मान्य करने के प्रयास के रूप में प्रस्तुत करता हूं।

पीआरडी और पीआरडीएस के बीच अंतर के बारे में बहुत उपयोगी टिप्पणियों के लिए अमीबा के लिए धन्यवाद, टिप्पणियां देखें

पीसीपीसी

  1. क्षसी
  2. आरक्षआरक्षआरमैं<क्षमैंमैं
  3. आरसी

सी

पीपी1पीn<बी1बीnपीसीबी1बीn

पीमैंपीमैंपीमैंपी1पीnपी1पीnपीमैं

पी1पीn

पीnपीn<बीबीपीn<बीपीn<बीबी

जोड़ने के लिए संपादित:

यहां एक प्रणाली का एक उदाहरण दिया गया है जो पीआरडीएस (आर कोड नीचे नहीं) है। तर्क यह है कि जब नमूने ए और बी बहुत समान होते हैं, तो यह अधिक संभावना है कि उनका उत्पाद atypical होगा। मुझे संदेह है कि यह प्रभाव (और (a*b), (c*d)तुलना के लिए अशक्त के तहत पी-मूल्यों की गैर-एकरूपता नहीं है) पी-मूल्यों में नकारात्मक सहसंबंध चला रहा है, लेकिन मुझे यकीन नहीं हो रहा है। यदि हम दूसरी तुलना (एक विलकॉक्सन के बजाय) के लिए एक टी-परीक्षण करते हैं, तो भी यही प्रभाव दिखाई देता है, लेकिन पी-वैल्यू का वितरण अभी भी समान नहीं है, संभवतः सामान्यता धारणा के उल्लंघन के कारण।

ab <- rep(NA, 100000)  # We'll repeat the comparison many times to assess the relationships among p-values.
abcd <- rep(NA, 100000)

for(i in 1:100000){
  a <- rnorm(10)    # Draw 4 samples from identical populations.
  b <- rnorm(10)
  c <- rnorm(10)
  d <- rnorm(10)

  ab[i] <- t.test(a,b)$p.value          # We perform 2 comparisons and extract p-values
  abcd[i] <- wilcox.test((a*b),(c*d))$p.value
}

summary(lm(abcd ~ ab))    # The p-values are negatively correlated

ks.test(ab, punif)    # The p-values are uniform for the first test
ks.test(abcd, punif)   # but non-uniform for the second test.
hist(abcd)

मुझे क्षमा करें, लेकिन मैं वास्तव में इसका पालन नहीं करता हूं।
हार्वे मोटुलस्की

क्या नया अंतिम पैराग्राफ इसे स्पष्ट करता है?
जैकब सोकोलर

@ अमीबा, हाँ, मुझे लगता है कि तुम सही हो। पिछले पोस्टरों से जुड़े येकुट्टीली कागजात पीआरडीएस के उपचार हैं। जहां तक ​​मैं बता सकता हूं, पीआरडी एक ही संपत्ति है, लेकिन सभी परीक्षण आँकड़ों (या पी-वैल्यू) के पार, न कि केवल सही उपरांत के अनुरूप।
याकूब सोल्जर

1
हाँ, तुम बिल्कुल सही हो। अब संपादन कर रहे हैं।
जेकब सोकोलर

1
दिलचस्प उदाहरण, लेकिन प्रभाव सुपर-कमजोर है: मुझे लगभग -0.03 के सहसंबंध गुणांक (ab और abcd के बीच) मिलते हैं ... लेकिन मुझे यह नहीं मिलता है: आप ऐसा क्यों कहते हैं कि "जब नमूने a और b बहुत समान होते हैं , यह अधिक संभावना है कि उनका उत्पाद atypical होगा "?
अमीबा का कहना है कि

4

अपने पत्र में , बेंजामिनी और येकुतिली कुछ उदाहरण प्रदान करते हैं कि कैसे सकारात्मक प्रतिगमन निर्भरता (पीआरडी) केवल सकारात्मक रूप से जुड़े होने से अलग है। एफडीआर नियंत्रण प्रक्रिया पीआरडी के एक कमजोर रूप पर निर्भर करती है जिसे वे पीआरडीएस (यानी पीआरडी को प्रत्येक चर के सबसेट से एक) कहते हैं।

सकारात्मक निर्भरता मूल रूप से लेहमैन द्वारा द्विवर्षीय सेटिंग में प्रस्तावित की गई थी , लेकिन इस अवधारणा का बहुभिन्नरूपी संस्करण, जिसे सकारात्मक प्रतिगमन निर्भरता के रूप में जाना जाता है, जो कई परीक्षण के लिए प्रासंगिक है।

यहाँ से कोई प्रासंगिक अंश है pg.6

एक्स(एक्स1,एक्स2)एक्स(एक्स1)एक्स2(एक्स1)

...

2

इस मामले में सकारात्मक निर्भरता का मतलब है कि परीक्षणों का सेट सकारात्मक रूप से सहसंबद्ध है। तब विचार यह है कि यदि आपके पास पी-मान के लिए परीक्षण के सेट में चर सकारात्मक रूप से सहसंबद्ध हैं, तो प्रत्येक चर स्वतंत्र नहीं हैं

यदि आप एक बोनफेरोनी पी-मूल्य सुधार के बारे में सोचते हैं, उदाहरण के लिए, आप गारंटी दे सकते हैं कि टाइप 1 त्रुटि दर 0.1% / 100 = 0.001 तक आपके महत्व की सीमा निर्धारित करके 100 सांख्यिकीय स्वतंत्र परीक्षणों का कहना है। लेकिन, क्या होगा अगर उन 100 परीक्षणों में से प्रत्येक किसी तरह से संबंधित हो? तब आपने वास्तव में 100 अलग-अलग परीक्षण नहीं किए हैं।

एफडीआर में, विचार बोन्फ्रॉनी सुधार की तुलना में थोड़ा अलग है। इस विचार की गारंटी है कि जिन चीजों को आप महत्वपूर्ण घोषित करते हैं, उनमें से केवल एक निश्चित प्रतिशत (10% कहें) को झूठा घोषित किया जाता है। यदि आपने अपने डेटासेट में मार्कर (सकारात्मक निर्भरता) को सहसंबद्ध किया है, तो एफडीआर मूल्य आपके द्वारा किए जाने वाले परीक्षणों की कुल संख्या के आधार पर चुना जाता है (लेकिन सांख्यिकीय स्वतंत्र परीक्षणों की वास्तविक संख्या छोटी होती है)। इस तरह यह निष्कर्ष निकालना अधिक सुरक्षित है कि झूठी खोज दर आपके पी-मूल्यों के सेट में महत्वपूर्ण 10% या उससे कम परीक्षणों की झूठी घोषणा कर रही है।

सकारात्मक निर्भरता की चर्चा के लिए कृपया यह पुस्तक अध्याय देखें ।


2
आप एफडीआर बनाम बोनफेरोनी की व्याख्या करते हैं, लेकिन "सकारात्मक निर्भरता" को परिभाषित नहीं करते हैं, बल्कि इसे केवल "सकारात्मक रूप से सहसंबद्ध" के रूप में परिभाषित करते हैं, लेकिन मुझे समझ में नहीं आता है। इस बात पर विचार करें कि मेरे पास 1000 पी मूल्य हैं, 1000 विभिन्न जीनों की अभिव्यक्ति की अभिव्यक्ति और कुछ बीमारी के साथ लोगों की तुलना करना। मैं BH विधि का उपयोग यह तय करने के लिए करता हूं कि इनमें से कौन सी तुलना "खोज" है। इस संदर्भ में "सकारात्मक निर्भरता" का क्या अर्थ है?
हार्वे मोटुलस्की 13

5
यह उत्तर गलत है। सकारात्मक प्रतिगमन निर्भरता और सकारात्मक रूप से जुड़े होने के कारण एक दूसरे से भिन्न होते हैं। बेन्जामिनी येकुतेली पेपर इसे समझाता है और संदर्भ भी प्रदान करता है। "फिर भी, PRDS और पॉजिटिव एसोसिएशन एक दूसरे को इम्प्रेस नहीं करते हैं, और अंतर कुछ महत्व का होता है। उदाहरण के लिए, एक मल्टीवेरिएट नॉर्मल डिस्ट्रीब्यूशन सकारात्मक रूप से जुड़ा होता है अगर सभी सहसंबंध नॉनगनेटिव होते हैं। PRDS प्रॉपर्टी को होल्ड करने के लिए सभी सहसंबंधों को नॉनगनेटिव की जरूरत नहीं होती है।" धारा 3.1 देखें, नीचे केस 1)। ” पीजी देखें। कागज के 6।
user3303
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.