एक द्विपदीय GLMM (ग्लैमर) को एक अनुक्रिया चर के लिए फिट करना जो एक अनुपात या अंश है


11

मैं उम्मीद कर रहा हूं कि कोई ऐसा व्यक्ति हो सकता है जो मुझे लगता है कि यह एक अपेक्षाकृत सरल प्रश्न है, और मुझे लगता है कि मुझे उत्तर पता है, लेकिन पुष्टि के बिना यह कुछ ऐसा हो गया है, जिसके बारे में मैं निश्चित नहीं हो सकता।

मेरे पास प्रतिक्रिया चर के रूप में कुछ गणना डेटा हैं और मैं यह मापना चाहता हूं कि किसी चीज की आनुपातिक उपस्थिति के साथ वह चर कैसे बदलता है।

अधिक विस्तार से, प्रतिक्रिया चर कई साइटों में एक कीट प्रजातियों की उपस्थिति की गिनती है, इसलिए उदाहरण के लिए एक साइट का 10 बार नमूना लिया जाता है और यह प्रजाति 4 बार हो सकती है।

मैं यह देखना चाहता हूं कि क्या यह इन स्थलों पर पौधों की समग्र संप्रदाय में पौधों की प्रजातियों के समूह की आनुपातिक उपस्थिति से संबंधित है।

इसका मतलब है कि मेरा डेटा इस प्रकार है (यह सिर्फ एक उदाहरण है)

Site, insectCount, NumberOfInsectSamples, ProportionalPlantGroupPresence
1, 5, 10, 0.5
2, 3, 10, 0.3
3, 7, 9, 0.6
4, 0, 9, 0.1

डेटा में स्थान के लिए एक यादृच्छिक प्रभाव भी शामिल है।

मैंने दो तरीकों के बारे में सोचा था, एक एक रेखीय मॉडल ( lmer) होगा, जैसे कि एक अनुपात जैसे कीड़े

 lmer.model<-lmer(insectCount/NumberOfInsectSamples~
 ProportionalPlantGroupPresence+(1|Location),data=Data)

दूसरा एक द्विपद GLMM ( glmer) होगा

glmer.model <- glmer(cbind(insectCount,NumberOfInsectSamples-insectCount)~
 ProportionalPlantGroupPresence+(1|Location),
 data=Data,family="binomial")

मेरा मानना ​​है कि द्विपदीय चमक सही विधि है, हालांकि वे काफी अलग परिणाम देते हैं। मैं अब भी थोड़ा अनिश्चित महसूस किए बिना नेट पर एक निश्चित उत्तर खोजने के लिए नहीं कर सकता हूं, और यह सुनिश्चित करना चाहता हूं कि मैं गलती नहीं कर रहा हूं।

इस पर वैकल्पिक तरीकों में कोई मदद या अंतर्दृष्टि बहुत सराहना की जाएगी।


जवाबों:


19

द्विपद GLMM शायद सही उत्तर है।

  • विशेष रूप से नमूनों की एक छोटी से मध्यम संख्या (आपके उदाहरण में 9 और 10) के साथ, प्रतिक्रिया चर का वितरण संभवतया विषमलैंगिक होगा (विचरण स्थिर नहीं होगा, और विशेष रूप से व्यवस्थित तरीकों से मतलब पर निर्भर करेगा) और दूर सामान्यता से, एक तरह से जिसे बदलना मुश्किल होगा - विशेषकर यदि भविष्यवक्ता चर के कुछ मूल्यों के लिए अनुपात 0 या 1 के करीब हो। यह GLMM को एक अच्छा विचार बनाता है।
  • आपको अतिविशिष्टता के लिए जांच / खाते के लिए सावधान रहना चाहिए। यदि आपके पास प्रति स्थान एक एकल अवलोकन (यानी आपके डेटा फ्रेम में एक एकल द्विपद नमूना / पंक्ति) है तो आपका (1|Site)यादृच्छिक प्रभाव स्वचालित रूप से इसे संभाल लेगा (हालांकि सावधानीपूर्वक नोट के लिए हैरिसन 2015 देखें)
  • यदि पिछली धारणा सही है (आपके पास प्रति स्थान केवल एक ही द्विपद नमूना है), तो आप इसे एक नियमित द्विपद मॉडल के रूप में भी फिट कर सकते हैं glm(...,family=binomial)- ( उस स्थिति में आप family=quasibinomialएक सरल, वैकल्पिक तरीके के रूप में एक कासिबिनोमियल मॉडल ( ) का उपयोग कर सकते हैं ) अतिउत्पादन के लिए खाते में
  • यदि आप चाहें, तो आप प्रतिक्रिया के रूप में अनुपात के साथ अपने GLMM को भी फिट कर सकते हैं, यदि आप weightsनमूनों की संख्या के बराबर तर्क सेट करते हैं:

     glmer(insectCount/NumberOfInsectSamples~ProportionalPlantGroupPresence+
           (1|Location),
           weights=NumberofInsectSamples,
           data=Data,family="binomial")

    (यह glmer()आपके प्रश्न में आपके पास फिट होने के लिए समान परिणाम देना चाहिए )।

हैरिसन, जेवियर ए। " पारिस्थितिकी और विकास में द्विपद डेटा में मॉडलिंग अतिविकास के लिए अवलोकन-स्तरीय यादृच्छिक प्रभाव और बीटा-बिनोमियल मॉडल की तुलना ।" पीरज 3 (जुलाई 21, 2015): e1114। डोई: 10.7717 / peerj.1114।


हाय बेन, आपके स्पष्ट और व्यापक उत्तर के लिए बहुत धन्यवाद!
एल्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.