Tukey Median Polish, एल्गोरिथम का उपयोग माइक्रोएरे के RMA सामान्यीकरण में किया जाता है । जैसा कि आप जानते हैं, माइक्रोएरे डेटा काफी शोर है, इसलिए उन्हें जांच की तीव्रता का अनुमान लगाने के लिए और अधिक मजबूत तरीके की आवश्यकता है, जो सभी जांच और माइक्रोएरे के लिए टिप्पणियों का ध्यान रखते हैं। यह एक विशिष्ट मॉडल है जिसका उपयोग सरणियों में जांच की तीव्रता को सामान्य करने के लिए किया जाता है।
Yमैं जे=μमैं+αजे+εमैं जे
i = 1 , … , मैंj = 1 , … , J
कहाँ पे Yमैं जे है एल ओ जी के लिए परिवर्तित पीएम तीव्रता मैंटी एचपर जांच जेटी एच सरणी। εमैं जेपृष्ठभूमि शोर हैं और उन्हें सामान्य रैखिक प्रतिगमन में शोर के अनुरूप माना जा सकता है। हालांकि, एक वितरण धारणा परε प्रतिबंधात्मक हो सकता है, इसलिए हम अनुमान लगाने के लिए टकी मेडियन पोलिश का उपयोग करते हैं μमैं^ तथा αजे^। यह सरणियों के पार सामान्य बनाने का एक मजबूत तरीका है, क्योंकि हम सरणी प्रभाव से अलग सिग्नल, जांच के कारण तीव्रता को अलग करना चाहते हैं।α। हम सरणी प्रभाव के लिए सामान्य करके संकेत प्राप्त कर सकते हैंαजे^सभी सरणियों के लिए। इस प्रकार, हम केवल जांच प्रभाव और कुछ यादृच्छिक शोर के साथ बचे हैं।
जांच प्रभाव से रैंकिंग द्वारा अंतर व्यक्त जीन या "दिलचस्प" जीन का अनुमान लगाने के लिए मैंने जो लिंक टकी मेडियन पॉलिश का उपयोग किया है उससे पहले लिंक। हालांकि, कागज बहुत पुराना है, और शायद उस समय लोग अभी भी यह पता लगाने की कोशिश कर रहे थे कि माइक्रोएरे डेटा का विश्लेषण कैसे किया जाए। एफ्रॉन के गैर-पैरामीट्रिक अनुभवजन्य बायेसियन तरीकों का पेपर 2001 में आया था, लेकिन संभवतः व्यापक रूप से उपयोग नहीं किया गया होगा।
हालांकि, अब हम माइक्रोएरे (सांख्यिकीय) के बारे में बहुत कुछ समझते हैं और उनके सांख्यिकीय विश्लेषण के बारे में निश्चित हैं।
माइक्रोएरे डेटा बहुत शोर है और आरएमए (जो मेडियन पोलिश का उपयोग करता है) सबसे लोकप्रिय सामान्यीकरण विधियों में से एक है, इसकी सादगी के कारण हो सकता है। अन्य लोकप्रिय और परिष्कृत विधियाँ हैं: GCRMA, VSN। यह सामान्य है क्योंकि ब्याज जांच प्रभाव है और सरणी प्रभाव नहीं है।
जैसा कि आप उम्मीद करते हैं, विश्लेषण कुछ तरीकों से लाभान्वित हो सकता है जो जीन भर में जानकारी उधार का लाभ उठाते हैं। इनमें बायेसियन या अनुभवजन्य बायेसियन विधियां शामिल हो सकती हैं। हो सकता है कि जो पेपर आप पढ़ रहे हैं वह पुराना हो और ये तकनीकें तब तक बाहर न हों।
आपके दूसरे बिंदु के बारे में, हाँ वे संभवतः प्रयोगात्मक डेटा को संशोधित कर रहे हैं। लेकिन, मुझे लगता है, यह संशोधन एक बेहतर कारण के लिए है, इसलिए उचित है। कारण रहा है
क) माइक्रोएरे डेटा बहुत शोर कर रहे हैं। जब ब्याज जांच प्रभाव होता है, तो आरएमए, जीसीआरएमए, वीएसएन, आदि द्वारा डेटा को सामान्य करना आवश्यक होता है और हो सकता है कि डेटा में किसी विशेष संरचना का लाभ उठाया जाए। लेकिन मैं दूसरा भाग करने से बचता। यह मुख्य रूप से है क्योंकि अगर हम पहले से संरचना को नहीं जानते हैं, तो बेहतर है कि बहुत सारी धारणाएं न लादें।
b) अधिकांश माइक्रोएरे प्रयोग उनके स्वभाव में खोजपूर्ण हैं, अर्थात्, शोधकर्ता आगे के विश्लेषण या प्रयोगों के लिए "दिलचस्प" जीन के कुछ सेट को संकीर्ण करने की कोशिश कर रहे हैं। यदि इन जीनों में एक मजबूत संकेत है, तो सामान्यीकरण जैसे संशोधनों को अंतिम परिणामों को प्रभावित नहीं करना चाहिए।
इसलिए, संशोधनों को उचित ठहराया जा सकता है। लेकिन मुझे टिप्पणी करनी चाहिए, सामान्यीकरण की अधिकता से गलत परिणाम हो सकते हैं।