शून्य-फुलाए गए गामा मॉडल का उचित उपयोग और व्याख्या


11

पृष्ठभूमि: मैं एक बायोस्टैटिस्टियन हूं जो वर्तमान में सेलुलर अभिव्यक्ति दरों के डेटासेट के साथ कुश्ती कर रहा हूं। अध्ययन ने विभिन्न दाताओं से कुछ पेप्टाइड्स में समूहों में एकत्रित कोशिकाओं के एक मेजबान को उजागर किया । सेल या तो प्रतिक्रिया में कुछ बायोमार्कर व्यक्त करते हैं, या वे नहीं करते हैं। प्रतिक्रिया दर तब प्रत्येक दाता-समूह के लिए दर्ज की जाती हैं। प्रतिक्रिया दर (प्रतिशत के रूप में व्यक्त) ब्याज का परिणाम है, और पेप्टाइड जोखिम भविष्यवक्ता है।

ध्यान दें कि टिप्पणियों को दाताओं के भीतर क्लस्टर किया जाता है।

चूंकि मेरे पास केवल सारांश डेटा है, इसलिए मैं दाता-वार प्रतिक्रिया दरों को निरंतर डेटा (अब कम से कम) के रूप में मान रहा हूं।

जटिलता इस तथ्य से उत्पन्न होती है कि मेरे डेटा में कई शून्य हैं। अभी तक बहुतों को नजरअंदाज किया जाना चाहिए। मैं इस तथ्य से निपटने के लिए एक शून्य-फुलाया गामा मॉडल पर विचार कर रहा हूं कि मैंने निरंतर डेटा को शून्य के अतिरेक के साथ युग्मित तिरछा किया है। मैंने टोबिट मॉडल पर भी विचार किया है, लेकिन यह हीन लगता है क्योंकि यह निचले स्तर पर सेंसरिंग को मानता है, जैसा कि वास्तविक जीरो के विपरीत है (अर्थशास्त्री यह कह सकते हैं कि भेद मूक है)।

प्रश्न: सामान्यतया, शून्य-फुलाए गए गामा मॉडल का उपयोग करना कब उचित है? यही है, क्या धारणाएं हैं? और कोई इसके संदर्भों की व्याख्या कैसे करता है? यदि आपके पास कोई है, तो मैं इस पर चर्चा करने वाले पत्रों के लिंक के लिए आभारी रहूंगा।

मुझे एसएएस-एल पर एक लिंक मिला है जिसमें डेल मैक्लेरन शून्य-फुलाया गामा मॉडल के लिए एनएलएमआईएक्सईडी कोड प्रदान करता है, इसलिए यह संभव प्रतीत होता है। बहरहाल, मैं आँख बंद करके आगे बढ़ने से नफरत करना चाहूंगा।

जवाबों:


5

सबसे पहले, आप अभिव्यक्ति डेटा में वास्तविक शून्य नहीं देख रहे हैं। आपका जीवविज्ञानी कह रहा है, जैसे कि सभी जीवविज्ञानी करते हैं, लेकिन जब एक जीवविज्ञानी कहते हैं "यह शून्य है" तो इसका वास्तव में मतलब है "यह मेरी पहचान सीमा से नीचे है, इसलिए यह मौजूद नहीं है।" यह क्षेत्र में गणितीय परिष्कार की कमी के कारण एक भाषा का मुद्दा है। मैं यहां निजी अनुभव से बात करता हूं।

आपके द्वारा दिए गए लिंक में शून्य फुलाए गए गामा की व्याख्या उत्कृष्ट है। आपके डेटा के लिए अग्रणी शारीरिक प्रक्रिया है, अगर मैं इसे समझता हूं, तो एक दाता का चयन किया जाता है, फिर एक निश्चित पेप्टाइड के साथ इलाज किया जाता है, और प्रतिक्रिया उस दाता की कोशिकाओं से मापा जाता है। यहाँ कुछ परतें हैं। एक दाता की प्रतिक्रिया की समग्र शक्ति है, जिसे प्रत्येक विशेष कोशिका के अभिव्यक्ति स्तर में मापा जाता है। यदि आप शून्य में अपने बर्नौली चर की व्याख्या गामा में करते हैं, तो "दाता की प्रतिक्रिया मापने के लिए पर्याप्त मजबूत है", तो यह ठीक हो सकता है। बस ध्यान दें कि उस स्थिति में आप व्यक्तिगत सेल की अभिव्यक्ति के शोर को जोरदार प्रतिक्रिया देने वाले दाताओं के बीच भिन्नता के साथ उछाल रहे हैं। चूंकि एकल कोशिका में अभिव्यक्ति में शोर लगभग गामा वितरित किया जाता है,

यदि दाताओं बनाम कोशिकाओं से अतिरिक्त भिन्नता आपके गामा फिट को खराब नहीं करती है, और आप बस अभिव्यक्ति बनाम लागू पेप्टाइड प्राप्त करने की कोशिश कर रहे हैं, तो कोई कारण नहीं है कि यह ठीक नहीं होना चाहिए।

यदि अधिक विस्तृत विश्लेषण क्रम में है, तो मैं आपके माप के लिए अग्रणी प्रक्रिया से मेल खाने के लिए एक कस्टम श्रेणीबद्ध मॉडल के निर्माण की सिफारिश करूंगा।


3

मैंने एक ऐसा समाधान ढूंढ लिया है जो मुझे सुंदर लगता है। साहित्य में एक उत्कृष्ट लेख है जिसका शीर्षक है "शून्य पर clumping के साथ दोहराया उपायों के डेटा का विश्लेषण" जो सहसंबद्ध डेटा के लिए एक शून्य-फुलाया lognormal मॉडल प्रदर्शित करता है। लेखक एसएएस मैक्रो प्रदान करते हैं जो PROC NLMIXED पर आधारित है और इसे लागू करना काफी आसान है। अच्छी खबर यह है कि यह repeatedमैक्रो में बयान के चूक से बिना देखे टिप्पणियों के मामलों को सरल बना सकता है । बुरी खबर यह है कि NLMIXED में अभी तक कई सहसंबंध संरचनाएं नहीं हैं जिनकी हमें अक्सर आवश्यकता होती है, जैसे कि ऑटोर्रिजिव।

मैक्रो का नाम MIXCORR है, और एक बहुत ही उपयोगी विकी पृष्ठ है जिसे आप यहां पा सकते हैं । मैक्रो को यहाँ डाउनलोड किया जा सकता है

मैं इन सभी लिंक की अत्यधिक अनुशंसा करता हूं। आशा है कि आप उन्हें उपयोगी पाएंगे।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.