जीनोम-वाइड एसोसिएशन अध्ययनों में, प्रमुख घटक क्या हैं?


20

में जीनोम चौड़ा संघ के अध्ययन (GWAS):

  1. प्रमुख घटक क्या हैं?
  2. उनका उपयोग क्यों किया जाता है?
  3. उनकी गणना कैसे की जाती है?
  4. क्या पीसीए का उपयोग किए बिना जीनोम-वाइड एसोसिएशन अध्ययन किया जा सकता है?

1
इन सवालों को पूछने से पहले, क्या आपने "पीसीए" के लिए इस साइट को खोजा या "पीसीए" टैग का पता लगाया? आपके अधिकांश प्रश्नों का उत्तर पहले ही दिया जा चुका है।
whuber

1
@ जब भी मुझे लगता है कि ओपी पीसीए के उपयोग की तलाश कर रहा है, एक दिए गए परिणाम (निरंतर फेनोटाइप या केस / नियंत्रण अध्ययन) और डीएनए मार्कर (एसएनपी) को मॉडलिंग करते समय जनसंख्या स्तरीकरण के लिए खाता और समायोजित करने का एक तरीका है। मैंने यहां एक संदर्भ दिया: आंकड़े ।stackexchange.com / questions / 1708 / variation-in-pca-weights/…
chl

1
GWAS निश्चित रूप से प्रमुख घटकों के बिना किया जा सकता है। जनसंख्या स्तरीकरण के अभाव में, आप सभी को हजारों टीस्ट या हजारों ची-स्क्वेर्ड परीक्षण की आवश्यकता होती है। टी
OneStop

@onestop (+1) मैं आपको 2 प्रश्न का उत्तर देने पर विचार करूंगा, कि मैंने अपनी प्रतिक्रिया में भी विचार नहीं किया।
CHL

@onestop, क्या होगा यदि केवल लिंग / जाति द्वारा स्तरीकरण किया जाए? क्या आप कृपया अपने उत्तर के बारे में विस्तार से बता सकते हैं?
suprvisr

जवाबों:


27

इस विशेष संदर्भ में, पीसीए का उपयोग मुख्य रूप से एसएनपी (या अन्य डीएनए मार्करों) पर एलील वितरण में जनसंख्या-विशिष्ट भिन्नताओं को ध्यान में रखते हुए किया जाता है, हालांकि मैं जांच के तहत केवल एसएनपी मामले से परिचित हूं)। इस तरह की "जनसंख्या सबस्ट्रक्चर" मुख्य रूप से आनुवंशिक रूप से दूर वंश (जैसे जापानी और काले-अफ्रीकी या यूरोपीय-अमेरिकी) में मामूली एलील की अलग-अलग आवृत्तियों के परिणामस्वरूप उत्पन्न होती है। पैटरसन एट अल द्वारा सामान्य विचार को जनसंख्या संरचना और ईजेननलिसिस में अच्छी तरह से समझाया गया है । ( PLoS जेनेटिक्स 2006, 2 (12)), या लैंसेट के विशेष आनुवंशिक महामारी विज्ञान पर इस मुद्दे (2005, 366, सबसे लेख वेब पर पाया जा सकता है, Cordell और क्लेटन, के साथ शुरू जेनेटिक एसोसिएशन अध्ययन )।

प्रिंसिपल कुल्हाड़ियों का निर्माण पीसीए के लिए शास्त्रीय दृष्टिकोण से होता है, जो मनाया जीनोटाइप्स (एए, एबी, बीबी) के स्केल मैट्रिक्स (एसएनपी द्वारा व्यक्तियों) पर लागू होता है; बी कहते हैं कि सभी मामलों में मामूली एलील है), इसके अपवाद के लिए; आबादी के बहाव के लिए एक अतिरिक्त सामान्यीकरण लागू किया जा सकता है। यह सभी मानता है कि नाबालिग एलील की आवृत्ति ({0,1,2} में मान लेना) को संख्यात्मक माना जा सकता है, यही है कि हम एक additive मॉडल (जिसे एलिकल डोज़ भी कहा जाता है) या किसी भी समकक्ष के तहत काम करते हैं जो समझ में आता है । जैसा कि क्रमिक ऑर्थोगोनल पीसी अधिकतम विचरण के लिए जिम्मेदार होगा, यह मामूली एलील आवृत्ति के स्तर पर अलग-अलग व्यक्तियों के समूहों को उजागर करने का एक तरीका प्रदान करता है। इसके लिए इस्तेमाल किए जाने वाले सॉफ्टवेयर को Eigenstrat के नाम से जाना जाता है । इसमें भी उपलब्ध हैegscore()GenABEL R पैकेज से कार्य करें ( GenABEL.org भी देखें )। यह ध्यान देने योग्य है कि जनसंख्या उप-संरचना का पता लगाने के अन्य तरीके प्रस्तावित थे, विशेष रूप से मॉडल-आधारित क्लस्टर पुनर्निर्माण (अंत में संदर्भ देखें)। अधिक जानकारी ब्राउज़ कर पाया जा सकता है Hapmap परियोजना, और उपलब्ध ट्यूटोरियल से आ रही BioConductor परियोजना। (Google पर विंस जे केरी या डेविड क्लेटन के अच्छे ट्यूटोरियल खोजें)।

क्लस्टरिंग उप-योगों के अलावा, इस दृष्टिकोण का उपयोग आउटलेर्स का पता लगाने के लिए भी किया जा सकता है जो दो मामलों (AFAIK) में उत्पन्न हो सकते हैं: (ए) जीनोटाइपिंग त्रुटियां, और (बी) जब एक सजातीय आबादी के साथ काम करना (या ऐसा माना जाता है, तो स्व-रिपोर्ट की गई जातीयता ), अप्रत्याशित जीनोटाइप का प्रदर्शन करने वाले व्यक्ति। आमतौर पर इस मामले में क्या किया जाता है पीसीए को एक पुनरावृत्त तरीके से लागू किया जाता है, और उन व्यक्तियों को हटा दिया जाता है जिनके स्कोर नीचे हैं एसडी पहले 20 प्रमुख अक्षों में से कम से कम एक पर; यह कुछ अर्थों में नमूने को "सफेद" करने के लिए है। ध्यान दें कि जीनोटाइप दूरी (पीसीए के स्थान पर बहुआयामी स्केलिंग का उपयोग करते हुए भी ऐसा कोई भी माप) रिश्तेदारों या भाई-बहनों को हाजिर करने की अनुमति देगा। Plink सॉफ्टवेयर अतिरिक्त तरीकों प्रदान करता है, पर अनुभाग देखें जनसंख्या स्तरीकरण±6 ऑन लाइन मदद में।

यह ध्यान में रखते हुए कि ईजनानालिसिस व्यक्तियों के स्तर पर कुछ संरचना को उजागर करने की अनुमति देता है, हम इस जानकारी का उपयोग तब कर सकते हैं जब किसी दिए गए फेनोटाइप (या किसी भी वितरण जो बाइनरी मानदंड, जैसे रोग या केस-नियंत्रण के अनुसार परिभाषित किया जा सकता है) में मनाया बदलाव की व्याख्या करने की कोशिश कर रहा है। परिस्थिति)। विशेष रूप से, हम अपने विश्लेषण को उन पीसी (यानी, व्यक्तियों का कारक स्कोर) के साथ समायोजित कर सकते हैं, जैसा कि प्रिंसिपल घटकों के विश्लेषण में स्पष्ट किया गया है कि मूल्य एट अल द्वारा जीनोम-वाइड एसोसिएशन अध्ययन में स्तरीकरण के लिए सही है । ( नेचर जेनेटिक्स 2006, 38 (8)), और बाद में काम ( यूरोप के भीतर जीन मिरर भूगोल में यूरोप में आनुवंशिक भिन्नता की कुल्हाड़ियों को दिखाते हुए एक अच्छी तस्वीर थी ; प्रकृति 2008; अंजीर 1 ए नीचे पुन: प्रस्तुत)। यह भी ध्यान दें कि एक अन्य समाधान एक स्तरीकृत विश्लेषण (एक जीएलएम में जातीयता को शामिल करके) को बाहर ले जाने के लिए है - यह उदाहरण के लिए स्नैमेट्रिक्स पैकेज में आसानी से उपलब्ध है ।

यूरोप में जीन मिरर भूगोल

संदर्भ

  1. डैनियल फल्श, मैथ्यू स्टीफंस, और जोनाथन के प्रिटचर्ड (2003)। मल्टीकोकस जीनोटाइप डेटा का उपयोग करके जनसंख्या संरचना का आविष्कार: जुड़ा हुआ लोकी और सहसंबद्ध एलील आवृत्तियोंजेनेटिक्स , 164 (4): 1567-1587।
  2. बी डेविन और के रोएडर (1999)। एसोसिएशन अध्ययन के लिए जीनोमिक नियंत्रणबॉयोमीट्रिक्स , 55 (4): 997–1004।
  3. जेके प्रिचर्ड, एम स्टीफंस और पी डोनली (2000)। मल्टीकोकस जीनोटाइप डेटा का उपयोग करके जनसंख्या संरचना का आविष्कारआनुवंशिकी , 155 (2): 945-959।
  4. गैंग झेंग, बोरिस फ्रीडलिन, झाओहाई ली और जोसेफ एल गैस्टविर्थ (2005)। विभिन्न आनुवंशिक मॉडल के तहत एसोसिएशन अध्ययन के लिए जीनोमिक नियंत्रणबायोमेट्रिक्स , 61 (1): 186-92।
  5. चाओ तियान, पीटर के। ग्रेगसेन, और माइकल एफ। सेलेदिन 1 (2008)। वंश के लिए लेखांकन: जनसंख्या उप-संरचना और जीनोम-वाइड एसोसिएशन अध्ययनमानव आणविक आनुवंशिकी , 17 (R2): R143-R150।
  6. काई यू, जीनोम-वाइड एसोसिएशन स्टडीज में जनसंख्या का निर्माण और नियंत्रण चयन
  7. एलक्स एल। मूल्य, नूह ए। ज़िटलेन, डेविड रीच और निक पैटरसन (2010)। जीनोम-वाइड एसोसिएशन अध्ययन में जनसंख्या स्तरीकरण के लिए नए दृष्टिकोण , प्रकृति समीक्षा आनुवंशिकी
  8. चाओ तियान, एट अल। (2009)। यूरोपीय जनसंख्या आनुवंशिक संरचना: विविध यूरोपीय जातीय समूहों , आणविक चिकित्सा, 15 (11-12): 371-383 के बीच भेद के लिए पूर्वजों की जानकारीपूर्ण मार्करों की आगे की परिभाषा

आपका बहुत बहुत धन्यवाद। स्वाभाविक रूप से अधिक प्रश्न इस प्रकार हैं: 1) अगर मैं पीसीए को अनदेखा करता हूं और केवल GENDER / RACE / AGE द्वारा अपने GWAS नमूने को स्तरीकृत करता हूं और PCA को अनदेखा करता हूं। यह मेरे संघ विश्लेषण और उसके परिणाम को कैसे प्रदर्शित करेगा? 2) अगर मैं वास्तव में पीसीए का उपयोग करना चाहता हूं तो कितने एसएनपीएस के पास कम से कम सच्चा पीसीए होने के लिए जीनोटाइप किया जाना चाहिए? 200 पर्याप्त है? क्या उन्हें सभी गुणसूत्रों पर समान रूप से फैलाया जाना है? 3) पीसीए में कौन से एसएनपी का उपयोग किया जाता है? क्या यह पूर्वनिर्धारित सेट या कोई है?
सुप्रीविसर

@suprvisr मैं वहीं जवाब दे सकता हूं या अपनी प्रतिक्रिया अपडेट कर सकता हूं, लेकिन मुझे लगता है कि एक नया प्रश्न पूछना बेहतर है ("पीसीए बनाम स्तरीकरण के साथ समायोजित करने के पेशेवरों और विपक्षों" के विचार के साथ) और इस एक से लिंक करें - ताकि लोग आवश्यक कनेक्शन स्पष्ट रूप से कर सकते हैं।
chl

@AndyFrost ने सुझाव दिया कि निम्नलिखित संदर्भित आंकड़े हो सकते हैं: goo.gl/jNXx0x और आपके द्वारा संदर्भित चित्र goo.gl/TcK3g8 में हो सकता है ।
गंग - मोनिका

@chl क्या आप इसका मतलब समझा सकते हैं: "आमतौर पर इस मामले में क्या किया जाता है पीसीए को पुनरावृत्त तरीके से लागू करना है, और ऐसे व्यक्तियों को हटाना है जिनका स्कोर ± 6 SD 6 से कम है SD पहले 20 प्रिंसिपल में से कम से कम एक पर कुल्हाड़ियों "। मैं अपनी पोस्ट का जवाब यहां ढूंढ
MAPK
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.