में जीनोम चौड़ा संघ के अध्ययन (GWAS):
- प्रमुख घटक क्या हैं?
- उनका उपयोग क्यों किया जाता है?
- उनकी गणना कैसे की जाती है?
- क्या पीसीए का उपयोग किए बिना जीनोम-वाइड एसोसिएशन अध्ययन किया जा सकता है?
में जीनोम चौड़ा संघ के अध्ययन (GWAS):
जवाबों:
इस विशेष संदर्भ में, पीसीए का उपयोग मुख्य रूप से एसएनपी (या अन्य डीएनए मार्करों) पर एलील वितरण में जनसंख्या-विशिष्ट भिन्नताओं को ध्यान में रखते हुए किया जाता है, हालांकि मैं जांच के तहत केवल एसएनपी मामले से परिचित हूं)। इस तरह की "जनसंख्या सबस्ट्रक्चर" मुख्य रूप से आनुवंशिक रूप से दूर वंश (जैसे जापानी और काले-अफ्रीकी या यूरोपीय-अमेरिकी) में मामूली एलील की अलग-अलग आवृत्तियों के परिणामस्वरूप उत्पन्न होती है। पैटरसन एट अल द्वारा सामान्य विचार को जनसंख्या संरचना और ईजेननलिसिस में अच्छी तरह से समझाया गया है । ( PLoS जेनेटिक्स 2006, 2 (12)), या लैंसेट के विशेष आनुवंशिक महामारी विज्ञान पर इस मुद्दे (2005, 366, सबसे लेख वेब पर पाया जा सकता है, Cordell और क्लेटन, के साथ शुरू जेनेटिक एसोसिएशन अध्ययन )।
प्रिंसिपल कुल्हाड़ियों का निर्माण पीसीए के लिए शास्त्रीय दृष्टिकोण से होता है, जो मनाया जीनोटाइप्स (एए, एबी, बीबी) के स्केल मैट्रिक्स (एसएनपी द्वारा व्यक्तियों) पर लागू होता है; बी कहते हैं कि सभी मामलों में मामूली एलील है), इसके अपवाद के लिए; आबादी के बहाव के लिए एक अतिरिक्त सामान्यीकरण लागू किया जा सकता है। यह सभी मानता है कि नाबालिग एलील की आवृत्ति ({0,1,2} में मान लेना) को संख्यात्मक माना जा सकता है, यही है कि हम एक additive मॉडल (जिसे एलिकल डोज़ भी कहा जाता है) या किसी भी समकक्ष के तहत काम करते हैं जो समझ में आता है । जैसा कि क्रमिक ऑर्थोगोनल पीसी अधिकतम विचरण के लिए जिम्मेदार होगा, यह मामूली एलील आवृत्ति के स्तर पर अलग-अलग व्यक्तियों के समूहों को उजागर करने का एक तरीका प्रदान करता है। इसके लिए इस्तेमाल किए जाने वाले सॉफ्टवेयर को Eigenstrat के नाम से जाना जाता है । इसमें भी उपलब्ध हैegscore()
GenABEL R पैकेज से कार्य करें ( GenABEL.org भी देखें )। यह ध्यान देने योग्य है कि जनसंख्या उप-संरचना का पता लगाने के अन्य तरीके प्रस्तावित थे, विशेष रूप से मॉडल-आधारित क्लस्टर पुनर्निर्माण (अंत में संदर्भ देखें)। अधिक जानकारी ब्राउज़ कर पाया जा सकता है Hapmap परियोजना, और उपलब्ध ट्यूटोरियल से आ रही BioConductor परियोजना। (Google पर विंस जे केरी या डेविड क्लेटन के अच्छे ट्यूटोरियल खोजें)।
क्लस्टरिंग उप-योगों के अलावा, इस दृष्टिकोण का उपयोग आउटलेर्स का पता लगाने के लिए भी किया जा सकता है जो दो मामलों (AFAIK) में उत्पन्न हो सकते हैं: (ए) जीनोटाइपिंग त्रुटियां, और (बी) जब एक सजातीय आबादी के साथ काम करना (या ऐसा माना जाता है, तो स्व-रिपोर्ट की गई जातीयता ), अप्रत्याशित जीनोटाइप का प्रदर्शन करने वाले व्यक्ति। आमतौर पर इस मामले में क्या किया जाता है पीसीए को एक पुनरावृत्त तरीके से लागू किया जाता है, और उन व्यक्तियों को हटा दिया जाता है जिनके स्कोर नीचे हैं एसडी पहले 20 प्रमुख अक्षों में से कम से कम एक पर; यह कुछ अर्थों में नमूने को "सफेद" करने के लिए है। ध्यान दें कि जीनोटाइप दूरी (पीसीए के स्थान पर बहुआयामी स्केलिंग का उपयोग करते हुए भी ऐसा कोई भी माप) रिश्तेदारों या भाई-बहनों को हाजिर करने की अनुमति देगा। Plink सॉफ्टवेयर अतिरिक्त तरीकों प्रदान करता है, पर अनुभाग देखें जनसंख्या स्तरीकरण ऑन लाइन मदद में।
यह ध्यान में रखते हुए कि ईजनानालिसिस व्यक्तियों के स्तर पर कुछ संरचना को उजागर करने की अनुमति देता है, हम इस जानकारी का उपयोग तब कर सकते हैं जब किसी दिए गए फेनोटाइप (या किसी भी वितरण जो बाइनरी मानदंड, जैसे रोग या केस-नियंत्रण के अनुसार परिभाषित किया जा सकता है) में मनाया बदलाव की व्याख्या करने की कोशिश कर रहा है। परिस्थिति)। विशेष रूप से, हम अपने विश्लेषण को उन पीसी (यानी, व्यक्तियों का कारक स्कोर) के साथ समायोजित कर सकते हैं, जैसा कि प्रिंसिपल घटकों के विश्लेषण में स्पष्ट किया गया है कि मूल्य एट अल द्वारा जीनोम-वाइड एसोसिएशन अध्ययन में स्तरीकरण के लिए सही है । ( नेचर जेनेटिक्स 2006, 38 (8)), और बाद में काम ( यूरोप के भीतर जीन मिरर भूगोल में यूरोप में आनुवंशिक भिन्नता की कुल्हाड़ियों को दिखाते हुए एक अच्छी तस्वीर थी ; प्रकृति 2008; अंजीर 1 ए नीचे पुन: प्रस्तुत)। यह भी ध्यान दें कि एक अन्य समाधान एक स्तरीकृत विश्लेषण (एक जीएलएम में जातीयता को शामिल करके) को बाहर ले जाने के लिए है - यह उदाहरण के लिए स्नैमेट्रिक्स पैकेज में आसानी से उपलब्ध है ।
संदर्भ