पी-मूल्यों की एक क्यूक्यू-साजिश की व्याख्या कैसे करें


17

मैं प्लेक ( http://pngu.mgh.harvard.edu/~purcell/plink/download.shtml ) नामक एक सॉफ्टवेयर का उपयोग करके रोगों पर GWAS SNP संघ अध्ययन कर रहा हूं ।

संघ के परिणामों के साथ मुझे उन सभी एसएनपी के लिए पी-मान मिलता है जिनका विश्लेषण किया गया था। अब, मैं यह दिखाने के लिए कि क्या बहुत कम पी-वैल्यू पी-वैल्यू (एक समान वितरण) के वितरण से भिन्न है, उन पी-वैल्यू के क्यूक्यू-प्लॉट का उपयोग करते हैं। यदि एक पी-मूल्य अपेक्षित वितरण से विचलित हो जाता है, तो "पी" मान को सांख्यिकीय महत्वपूर्ण के लिए कहा जा सकता है।

जैसा कि आप QQ- प्लॉट में देख सकते हैं, शीर्ष पूंछ के अंत में, अंतिम 4 बिंदुओं की व्याख्या करना थोड़ा कठिन है। ग्रे में अंतिम बिंदुओं में से दो बताते हैं कि वे पी-वैल्यू पी-वैल्यू के अपेक्षित वितरण में हैं, जबकि अन्य दो नहीं हैं।

अब, इसकी व्याख्या कैसे करें, अंतिम दो बिंदुओं में पी-मान कम हैं लेकिन क्यूक्यू-प्लॉट के अनुसार "महत्वपूर्ण" नहीं हैं, जबकि उच्च पी-मान वाले अन्य दो बिंदु "महत्वपूर्ण" हैं? यह सच कैसे हो सकता है?

यहाँ छवि विवरण दर्ज करें


6
GWAS की व्याख्या करने के लिए QQ भूखंडों का उपयोग करने के साथ एक समस्या यह है कि पी-मान एक दूसरे से स्वतंत्र नहीं हैं, और, वास्तव में, सबसे चरम पी-मान बहुत अधिक सहसंबद्ध हैं। मुझे लगता है कि आपके शीर्ष चार हिट एक ही गुणसूत्र पर होने की संभावना है और एक दूसरे के काफी करीब हैं कि एलडी उनके बीच सहसंबंध पैदा कर रहा है। यदि आप उस परीक्षण को चलाना चाहते थे जिसने एसएनपी पर सबसे कम पी-मूल्य के साथ दूसरा सबसे कम पी-मूल्य सशर्त दिया था, तो मैं अनुमान लगा रहा हूं कि इसका पी-मूल्य अनएक्ससेक्शनल रेंज में गिर जाएगा। संभवतः अन्य स्पष्ट हिट्स के साथ भी ऐसा ही होगा।
सैम डिकसन

3
मैंने पहले से ही ऐसा किया था, मैंने केवल स्वतंत्र एसएनपी प्राप्त करने के लिए एसएनपी डेटा सेट को काट दिया (कटऑफ के रूप में 0.8 के आर-स्क्वायर का उपयोग करके)। यह क्यूक्यू-प्लॉट एलडी <0.8 में स्वतंत्र एसएनपी, या एसएनपी के परिणाम दिखाता है।
eXpander

1
सबसे कम एसएनपी गुणसूत्र 6, गुणसूत्र 2 से दूसरे, गुणसूत्र 5 से तीसरे, गुणसूत्र 9 से चौथे के अनुरूप है, इसलिए मुझे यकीन नहीं है कि एलडी एक समस्या है।
eXpander

1
क्या मैं आपसे पूछ सकता हूं कि आपने वह साजिश कैसे की? मुझे कुछ ऐसा ही मिल सकता है, लेकिन ची-स्क्वायर मान के साथ या पी-वैल्यू के साथ लेकिन ग्रे छाया के बिना और मुझे पी-वैल्यू और ग्रे छाया के साथ एक की आवश्यकता है। यदि आप कोड का उपयोग कर सकते हैं तो आप महान होंगे। धन्यवाद।
एलिक्स अर्नु

यहाँ लोक। In.io.no/tores/Publications_files/… इस समस्या पर एक क्लैसिक पेपर है।
kjetil b halvorsen 13

जवाबों:


5

पी-मूल्य भूखंडों के विश्लेषण पर एक अच्छा संदर्भ है [1]।

आप जो परिणाम देख रहे हैं वह इस तथ्य से प्रेरित हो सकता है कि परीक्षण के कुछ सबसेट पर संकेत / प्रभाव मौजूद हैं। ये स्वीकृति बैंड के ऊपर संचालित होते हैं। बैंड के बाहर केवल पी-मूल्य को अस्वीकार करना वास्तव में उचित हो सकता है, लेकिन शायद अधिक महत्वपूर्ण बात, आपको यह तय करना चाहिए कि आपकी चयन प्रक्रिया (एफडब्ल्यूईआर, एफडीआर) का चयन करते समय आप क्या त्रुटि मानदंड को नियंत्रित करना चाहते हैं। आप उस पसंद के लिए [2] से परामर्श कर सकते हैं, और उपयुक्त कई परीक्षण प्रक्रिया को चुनने के लिए संदर्भ दे सकते हैं।

[१] श्वेडर, टी।, और ई। स्पजोटवोल। "प्लॉट्स ऑफ पी-वैल्यूज़ टू एवेल्यूअल्स इन द टेस्ट टेस्ट।" बायोमेट्रिक 69, नं। 3 (दिसंबर 1982): 493502 डोई: 10.2307 / 2,335,984।

[२] रोसेनब्लट, जोनाथन। "प्रैक्टिशनर गाइड टू मल्टीपल टेस्टिंग एरर रेट्स।" अरएक्सिव ई-प्रिंट। तेल अवीव विश्वविद्यालय, 17 अप्रैल, 2013। http://arxiv.org/abs/1304.4920


1

यह एक पुराना सवाल है, लेकिन पहली बार QQPlots की व्याख्या करने की कोशिश करते समय मुझे यह मददगार लगा। मुझे लगा कि भविष्य में इस मामले में और लोगों के ठोकर खाने के बाद मैं इन उत्तरों को जोड़ूंगा।

मुझे यह समझने में थोड़ी मुश्किल हुई कि वे कौन से बिंदु हैं? मैंने पाया कि कोड में जाने से यह पता लगाना आसान हो गया।

यहाँ कुछ R कोड है जो मैंने GWASTools::qqPlotउस 3 पंक्तियों में एक QQPlot से लागू किए हैं:

simpleQQPlot = function (observedPValues) {
  plot(-log10(1:length(observedPValues)/length(observedPValues)), 
       -log10(sort(observedPValues)))
  abline(0, 1, col = "red")
}

यहाँ एक उदाहरण है। आपके पास 5 पी-मान हैं। simpleQQPlot 0 और 1. के बीच एक समान वितरण से 5 संगत पैवेल्यू उत्पन्न करेगा। ये होंगे: .2 .4 .6 .6 .8। और 1. तो simpleQQPlot को उम्मीद है कि आपका सबसे कम पी-वैल्यू लगभग .2 होगा, और आपका उच्चतम आसपास होगा। 1. simpleQQPlot आपके pvalues ​​को सॉर्ट करेगा और प्रत्येक को संबंधित जनरेट वैल्यू में जोड़ेगा। तो .2 को आपके सबसे कम अंतराल के साथ जोड़ा जाएगा, 1 आपके उच्चतम के साथ, और इसी तरह। फिर, इन युग्मित मानों को प्लॉट किया जाता है (ऋणात्मक लॉग लेने के बाद), एक्स के साथ उत्पन्न उत्पन्न होता है, और वाई को युग्मित मनाया गया मूल्य माना जाता है। यदि आपके देखे गए मान भी सामान्य वितरण से खींचे गए हैं, तो बिंदुओं को सीधी रेखा पर झूठ बोलना चाहिए। छँटाई के कारण, अंक हमेशा एकरस रूप से बढ़ेंगे। तो प्रत्येक बाद के बिंदु में एक बड़ा एक्स होगा, और एक से अधिक या बराबर वाई।

इसलिए ऊपर के मूल उदाहरण में, 9,997 वां छांटा गया पी-वैल्यू लगभग 5.2 था, लेकिन सामान्य वितरण के बाद 4.1 के आसपास रहने की उम्मीद थी। (नोट: मुझे वास्तव में यकीन नहीं है कि कितने पी-मान ऊपर प्लॉट किए गए थे - मैंने सिर्फ 10k अनुमान लगाया था)।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.