प्रोटिओमिक्स में पावर?


9

अनुदानों को अक्सर प्रस्तावित नमूना आकार का समर्थन करने के लिए शक्ति विश्लेषण की आवश्यकता होती है। प्रोटिओमिक्स (और अधिकांश-कॉमिक्स) में, 10 के नमूनों में से 100 से 1000 के फीचर्स / वैरिएबल हैं (शायद 100 के, लेकिन संभावना नहीं)। इसके अलावा, यह ज्ञात है कि इनमें से कुछ माप इकाइयां (उदाहरण के लिए, प्रोटीन की वर्णक्रमीय गणना) सामान्य रूप से वितरित नहीं की जाती हैं और इसलिए हम विश्लेषण के लिए गैर-पैरामीट्रिक परीक्षण का उपयोग करेंगे। मैंने एक माप का आकार और टी-टेस्ट मानकर निर्धारित एक नमूना आकार की शक्ति देखी है, लेकिन मुझे नहीं लगता कि यह पूरी तरह से सही है। वर्णक्रमीय गणना के साथ एक और समस्या विशेष रूप से यह है कि 100 में से प्रत्येक विशेषता बहुत अलग-अलग पैमानों पर होती है जिसमें बहुत अधिक त्रुटियां होती हैं (बड़े मानों में त्रुटि कम होती है)। [यह समस्या सीमा परिवर्तन मॉडल, मच एट अल।, 2002 में स्पष्ट रूप से वर्णित है ]

एफडीआर की कुछ मान्यताओं और एक स्वीकार्य तह-परिवर्तन को देखते हुए एक प्रस्तावित नमूना आकार की शक्ति को निर्धारित करने का उपयुक्त तरीका क्या होगा? यहाँ टूल का उपयोग करके मैं निम्नलिखित को निर्धारित करने में सक्षम था:

  • 300 जीन
  • 3 झूठी सकारात्मक बातें
  • 1.4 गुना-अंतर
  • 0.8 वांछित शक्ति
  • 0.7 stdev

49 के समूह के प्रति एक नमूना आकार की आवश्यकता है।

यह तब से आसान था जब मैं एक 50v50 डिजाइन का प्रस्ताव दे रहा हूं, यह जानिए कि 1.4 गुना-परिवर्तन बहुत स्वीकार्य है, 1% एफडीआर ठीक है, और मैं शायद इस प्रयोग में 300 प्रोटीन मापूंगा। पावर या सैंपल साइज़ कैलकुलेशन की यह समस्या बनी रहेगी, इसलिए अच्छा होगा कि जगह पर रेफरेंस का तरीका हो।

संपादित करें: मैंने पढ़ा है कि एक सहयोगी ने वाल्ड टेस्ट के बाद संभावित फ़ंक्शन का उपयोग करते हुए नकारात्मक द्विपद वितरण से वर्णक्रमीय गणना करने का प्रस्ताव दिया है। मूल रूप से प्रोटीन विचरण अनुमान प्राप्त करने के लिए प्रारंभिक डेटा का उपयोग करता है और फिर प्रत्येक मात्रात्मक के लिए समूहों के बीच पता लगाने योग्य गुना परिवर्तनों की गणना करता है। एक एफडीआर (अल्फा) इनपुट भी है। इसलिए, 80% शक्ति और सेट नमूना आकार को देखते हुए, वे 25% सबसे कम विचरण, 50% छोटे विचरण और 25% उच्चतम विचरण के लिए पता लगाने योग्य गुना-परिवर्तन निर्धारित कर सकते हैं। समस्या यह है कि मुझे नहीं पता कि उन्होंने यह कैसे किया। निश्चित नहीं है कि इस दृष्टिकोण को साझा करने से किसी को भी संभावित उत्तर मिलेगा।


कुछ अन्य संसाधन जो मैंने इस विषय पर पाए हैं: लेविन 2011 डिकर एट अल।, 2010
बेन

1
कि एमडी एंडरसन कैलकुलेटर मुझे बहुत आशावादी लगता है। कितनी तुलना की जाती है? (मैं माइक्रोएरे पर बहुत ही कठोर हूं: 50v50 डिजाइन में 300 जीन का मतलब है कि आप कितनी तुलना करते हैं?) जब आप एफडीआर कैलकुलेटर को 3 झूठी सकारात्मक सेट करते हैं, तो क्या आप कह रहे हैं कि आप एक झूठी सकारात्मक त्रुटि सेट कर रहे हैं ताकि केवल 3 शून्य के तहत झूठी सकारात्मक होने की उम्मीद है? यह 60 से अधिक तुलनाओं के लिए बहुत सख्त है।
एडम 22

1
मैं आपको दिखा सकता हूं कि यह कैसे आर में किया जाएगा लेकिन मुझे जीव विज्ञान पर कुछ पृष्ठभूमि की आवश्यकता है।
एडमों

जवाबों:


1

अनुप्रयोगों में (विशेष रूप से नैतिक अनुप्रयोगों में, जहां आपको एक शक्ति अध्ययन करना है) मुझे इस संदर्भ का उपयोग करना पसंद है [वांग और चेन 2004], क्योंकि यह उच्च-थ्रूपुट डेटा के लिए एक शक्ति गणना के पीछे की अवधारणा को स्पष्ट करता है (जो भी डेटा वास्तव में है) ।

संक्षेप में, सामान्य मापदंडों (α, N, N, प्रभाव आकार) के अलावा आप दो अतिरिक्त मापदंडों का उपयोग करते हैं, λ और to। उत्तरार्द्ध, η, वास्तव में परिवर्तित जीनों की अनुमानित संख्या है, और λ वास्तव में परिवर्तित जीन का अंश है जिसे आप पता लगाने में सक्षम होना चाहते हैं। इस दृष्टिकोण का उपयोग करके किसी भी उच्च-थ्रूपुट डेटा के लिए किसी भी ज्ञात विद्युत गणना का विस्तार करना काफी सरल है।

वांग, सू-जेन और जेम्स जे। चेन "माइक्रोएरे प्रयोगों में अंतर व्यक्त जीन की पहचान के लिए नमूना आकार।" कम्प्यूटेशनल जीवविज्ञान के जर्नल 11.4 (2004): 714-726।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.