आर में बिटारेग फ़ंक्शन का उपयोग करके एक मिश्रित मॉडल कैसे लागू किया जाए?


12

मेरे पास एक डेटासेट है, जिसमें अलग-अलग टैडपोल के "गतिविधि स्तर" को मापा जाता है, इसलिए मानों को 0 और 1 के बीच बांधा जाता है। यह डेटा एक निश्चित समय अंतराल के भीतर स्थानांतरित किए गए समय की संख्या की गणना करके एकत्र किया गया था (1 आंदोलन के लिए,) कोई आंदोलन के लिए 0), और फिर प्रति व्यक्ति एक मूल्य बनाने के लिए औसत। मेरा मुख्य निश्चित प्रभाव "घनत्व स्तर" होगा।

मैं जिस मुद्दे का सामना कर रहा हूं वह यह है कि मेरे पास एक कारक चर है, "तालाब" जिसे मैं एक यादृच्छिक प्रभाव के रूप में शामिल करना चाहता हूं - मुझे तालाबों के बीच मतभेदों की परवाह नहीं है, लेकिन सांख्यिकीय रूप से उनके लिए जिम्मेदार होगा। तालाबों के बारे में एक महत्वपूर्ण बात यह है कि मेरे पास उनमें से केवल 3 हैं, और मैं समझता हूं कि यादृच्छिक प्रभाव से निपटने के लिए अधिक कारक स्तर (5+) होना आदर्श है।

यदि ऐसा करना संभव है, तो मैं एक मिश्रित मॉडल का उपयोग करके betareg()या betamix()आर में कैसे लागू करना है, इस बारे में कुछ सलाह चाहूंगा । मैंने आर मदद फ़ाइलों को पढ़ा है, लेकिन मुझे आमतौर पर समझने में मुश्किल होती है (संदर्भ में प्रत्येक तर्क पैरामीटर का वास्तव में क्या मतलब है) मेरे अपने डेटा और पारिस्थितिक शब्दों में आउटपुट मान का क्या अर्थ है) और इसलिए मैं उदाहरणों के माध्यम से बेहतर काम करता हूं।

संबंधित नोट पर, मैं सोच रहा था कि क्या मैं glm()इस तरह के डेटा के साथ यादृच्छिक प्रभावों के लिए लेखांकन को पूरा करने के लिए एक द्विपद परिवार के तहत, और लॉगिट लिंक का उपयोग कर सकता हूं ।


नहीं, आप glm () में त्रुटि शब्द नहीं लगा सकते। लॉगइन के बारे में आपकी प्रतिक्रिया को बदलने और रैखिक मिश्रित मॉडल पर विचार करने के बारे में क्या?
19

@utobi धन्यवाद, मैं यह कोशिश करूँगा। तो, आपको केवल 3 स्तरों के साथ एक यादृच्छिक प्रभाव होने की चिंता नहीं है?
कैट वाई

मैं आपके चर "तालाब" का अर्थ नहीं जानता, लेकिन यदि आपके पास बार-बार उपाय हैं, तो यादृच्छिक प्रभाव लगभग होना चाहिए। यदि आपके पास दोहराए गए उपाय नहीं हैं, तो यहां यादृच्छिक बनाम तय एक खुली बहस है। यादृच्छिक प्रभावों के तीन स्तर ठीक हो सकते हैं, सिद्धांत रूप में उनका विचरण अनुमान योग्य है। मेरा सुझाव है कि आप अपने क्षेत्र में साहित्य की जाँच करें। एक अच्छी पुस्तक जो यादृच्छिक बनाम निश्चित प्रभावों के बारे में चर्चा करती है, वह है id.columbia.edu/~gelman/arm
utobi

1
@utobi आपकी सलाह के लिए धन्यवाद। यह मददगार था। मैं उस किताब को देखूंगा! मैंने लॉजिट ट्रांसफॉर्मेशन करना शुरू किया और लैमर () का इस्तेमाल किया।
कैट वाई

इस उत्तर की जाँच करें आँकड़े ।stackexchange.com
167340/…

जवाबों:


11

वर्तमान की क्षमताओं betaregमें यादृच्छिक / मिश्रित प्रभाव शामिल नहीं हैं। में betareg()आप केवल तय प्रभाव, जैसे, अपने तीन स्तरीय तालाब चर के लिए शामिल कर सकते हैं। betamix()समारोह लागू करता एक परिमित मिश्रण बीटा प्रतिगमन, नहीं एक मिश्रित प्रभाव बीटा प्रतिगमन।

आपके मामले में, मैं पहले यह देखने की कोशिश करूंगा कि एक निश्चित तालाब कारक प्रभाव क्या है। यह "लागत" आपको स्वतंत्रता की दो डिग्री देता है जबकि एक यादृच्छिक प्रभाव स्वतंत्रता के केवल एक अतिरिक्त डिग्री के साथ थोड़ा सस्ता होगा। लेकिन मुझे आश्चर्य होगा कि अगर दोनों दृष्टिकोण बहुत भिन्न गुणात्मक अंतर्दृष्टि की ओर ले जाते हैं।

अंत में, जबकि glm()बीटा प्रतिगमन का समर्थन नहीं करता है, लेकिन mgcvपैकेज में betar()परिवार है जिसे gam()फ़ंक्शन के साथ उपयोग किया जा सकता है ।


आपके इनपुट के लिए धन्यवाद। आपने betareg फ़ंक्शन के कुछ पहलुओं को स्पष्ट किया है। इस बिंदु पर मैंने @utobi की सलाह ली है और लॉगिट रूपांतरण किया है ताकि मैं lmer () का उपयोग कर सकूं। मैं गम () में देखूंगा क्योंकि मेरा अगला डेटासेट 0 और 1 के बीच भी है, और मैं परिवर्तनों के माध्यम से वितरण को सामान्य नहीं कर सकता हूं :)
कैट वाई

1
मैं उम्मीद करूंगा कि दृष्टिकोण समान परिणाम लौटाएंगे लेकिन कुछ अंतर भी होंगे जिनसे आप कुछ सीख सकते हैं। इसलिए मैं तीनों को यानी betaregनिश्चित प्रभावों के साथ, लॉजिट-ट्रांसफ़ॉर्मेड lmerरैंडम इफ़ेक्ट्स के gamसाथ और साथ आज़माने की सलाह दूंगा betar। (और यह भी: यदि उत्तर उपयोगी था, तो उत्थान या इसे स्वीकार करने पर विचार करें।)
अचिमे ज़लीलिस

15

पैकेज glmmTMB समान प्रश्न वाले किसी के लिए भी मददगार हो सकता है। उदाहरण के लिए, यदि आप एक यादृच्छिक प्रभाव के रूप में उपरोक्त प्रश्न से तालाब को शामिल करना चाहते हैं, तो निम्नलिखित कोड चाल करेगा:

glmmTMB(y ~ 1 + (1|pond), df, family=list(family="beta",link="logit"))

सीवी में आपका स्वागत है। आपके सहयोग के लिए धन्यवाद। यह एक जवाब के बजाय एक टिप्पणी है। क्या आप अपना जवाब बढ़ा सकते हैं?
Ferdi

देरी के लिए क्षमा करें, मैंने तुरंत टिप्पणी नहीं देखी। उम्मीद है की वो मदद करदे।
कोरी के

3

यह एक टिप्पणी के रूप में शुरू हुआ, लेकिन लंबा चला। मुझे नहीं लगता कि एक यादृच्छिक प्रभाव मॉडल यहां उपयुक्त है। केवल 3 तालाब हैं - क्या आप 3 संख्याओं से भिन्नता का अनुमान लगाना चाहते हैं? यह थोड़े है कि एक यादृच्छिक प्रभाव मॉडल के साथ क्या हो रहा है। मुझे लगता है कि तालाबों को शोधकर्ता को उनकी सुविधा के कारण चुना गया था, न कि "पॉन्ड्स ऑफ द अमेरिकन्स" के यादृच्छिक नमूने के रूप में।

एक यादृच्छिक प्रभाव मॉडल का लाभ यह है कि यह आपको प्रतिक्रिया (गतिविधि स्तर) पर एक आत्मविश्वास अंतराल का निर्माण करने की अनुमति देता है जो तालाब के तालाब की विविधता को ध्यान में रखता है। एक निश्चित प्रभाव मॉडल - दूसरे शब्दों में, तालाब को एक ब्लॉक की तरह व्यवहार करना - तालाब के प्रभाव के लिए प्रतिक्रिया को समायोजित करता है। यदि कुछ जोड़-तोड़ उपचार प्रभाव थे - प्रत्येक तालाब में मेंढक की दो प्रजातियां कहें - अवरुद्ध मतलब वर्ग त्रुटि को कम करता है (एफ परीक्षण के भाजक) और उपचार के प्रभाव को आगे चमकने की अनुमति देता है।

इस उदाहरण में, कोई उपचार प्रभाव नहीं है और यादृच्छिक प्रभाव मॉडल (और शायद "गैर-यादृच्छिक") के लिए तालाबों की संख्या बहुत कम है, इसलिए मुझे यकीन नहीं है कि इस अध्ययन से क्या निष्कर्ष निकाला जा सकता है। तालाबों के बीच अंतर का एक अच्छा अनुमान मिल सकता है, लेकिन इसके बारे में है। मुझे लगता है कि अन्य तालाब सेटिंग्स में मेंढकों की व्यापक आबादी के लिए तैयार किए जा रहे inferences नहीं दिखते। एक पायलट अध्ययन के रूप में, मैं यह मान सकता हूं।

ध्यान रखें कि यहां यादृच्छिक प्रभाव मॉडल का कोई भी उपयोग तालाब के विचरण के लिए बहुत ही अविश्वसनीय अनुमान देने वाला है और इसका उपयोग सावधानी के साथ किया जाना चाहिए।

लेकिन आपके मूल प्रश्न के अनुसार - क्या यह दर की समस्या नहीं है? घटनाओं-प्रति-यूनिट-समय के लिए जाने का वितरण पॉसों है। तो आप एक ऑफसेट के रूप में समय अंतराल के साथ गणना का उपयोग करके पॉइसन प्रतिगमन कर सकते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.