कुछ गणनाओं के लिए ऑफ़सेट वेरिएंट जहां ऑफ़सेट वैरिएबल 0 है


9

मैं एक सहयोगी के छात्र की मदद करने की कोशिश कर रहा हूं। छात्र ने प्रायोगिक सेटअप में पक्षी व्यवहार (कॉल की संख्या) को देखा और गिना। प्रत्येक प्रयोग के दौरान एक विशिष्ट देखे गए पक्षी के कारण कॉल की संख्या निर्धारित नहीं की जा सकती है, लेकिन रिकॉर्ड किए गए कॉल की संख्या में योगदान देने वाले पक्षियों की संख्या की गिनती संभव है। इसलिए मेरा प्रारंभिक सुझाव एक पॉइसन GLM मॉडल में ऑफसेट शब्द के रूप में पक्षियों की संख्या को शामिल करना था, इसलिए हम प्रति पक्षी कॉल की अपेक्षित संख्या को फिट कर रहे थे ।

इसके साथ समस्या यह है कि कई अवलोकन अवसरों के दौरान कोई पक्षी (और इसलिए कोई कॉल नहीं) देखा गया। सॉफ्टवेयर (इस मामले में आर) शिकायत करता है क्योंकि (आर डेटा युक्त के बारे में शिकायत करता है लेकिन यह विशुद्ध रूप से होने का परिणाम है )।log(0)=infy-Infoffset(log(nbirds))-Inf

मुझे वास्तव में संदेह है कि हमें एक बाधा मॉडल (या समान) की आवश्यकता है जहां हमारे पास "कॉल मनाया गया" के लिए एक अलग द्विपद मॉडल है? (या नहीं) और उन स्थितियों में कॉल (प्रति पक्षी) की संख्या के लिए एक छोटा गणना मॉडल जहां कॉल थे, जहां हम केवल मॉडल के गिनती भाग में ऑफसेट शब्द शामिल करते हैं।

आर में pscl पैकेज का उपयोग करके यह कोशिश कर रहा है, लेकिन मुझे अभी भी वही त्रुटि मिल रही है:

mod1 <- hurdle(NumberCallsCOPO ~ Condition * MoonVis +
               offset(log(NumberCOPO)) | 1, data = Data,
               dist = "poisson")

क्योंकि एक ही आर कोड ( glm.fitआंतरिक रूप से hurdle()काउंट मॉडल भाग फिट करने के लिए उपयोग किया जाता है ) -Infभले ही मुझे नहीं लगता कि यह उन टिप्पणियों के लिए मॉडल फिट को प्रभावित करेगा। (क्या यह एक सही धारणा है?)

मैं एक छोटी संख्या को जोड़कर फिट होने के लिए मॉडल प्राप्त कर सकता हूं NumberCOPO(कहते हैं 0.0001) लेकिन यह सबसे अच्छा है।

क्या इस छोटे निरंतरता सुधार को व्यवहार में ठीक माना जाएगा? यदि नहीं, तो डेटा को संभालते समय हमें किन अन्य दृष्टिकोणों पर विचार करना चाहिए जहां हम एक पॉइसन मॉडल में ऑफसेट का उपयोग करना चाह सकते हैं जहां ऑफ़सेट वेरिएबल 0 मान ले सकता है? मेरे द्वारा दिए गए सभी उदाहरण उन स्थितियों के लिए हैं जहां ऑफसेट चर के लिए एक 0 संभव नहीं होगा।


2
इस मामले में, ऐसा लगता है कि आपका मॉडल एक तनातनी को फिट करने की कोशिश कर रहा है: अगर वहाँ 0 पक्षी देखे जाते हैं तो आपको 0 पक्षी भी सुनाई देंगे। मुझे यकीन नहीं है कि ऑफसेट 0 के साथ पंक्तियों के लिए एक मॉडल फिटिंग इस मामले में उपयुक्त है।
साइकोरैक्स का कहना है कि मोनिका

धन्यवाद, जैसा कि मैंने नीचे उल्लेख किया है, कि मेरी आंत प्रतिक्रिया भी है। मैंने बैरी (स्पेज़मैन) के उत्तर के नीचे अपने उत्तर में थोड़ा विस्तार किया है।
गाविन सिम्पसन 20

2
मैं उन टिप्पणियों से सहमत होता हूं जो पोइसन दर मॉडल (जो कि ऑफसेट अवधि के साथ है) उन मामलों के लिए अनुचित है (और आप सही कह रहे हैं कि शायद उन मामलों को शामिल करने के लिए एक अलग, जैसे द्विपद, मॉडल लागू किया जाना चाहिए) । दर शून्य भाजक पर आधारित नहीं हो सकती।
21

जवाबों:


5

तो आप जो मॉडल बनाना चाहते हैं, वह प्रतिक्रिया है "प्रति पक्षी कॉल की संख्या" और परेशानी वाली रेखाएं हैं जहां आपने किसी पक्षी का निरीक्षण नहीं किया है? बस उन पंक्तियों को छोड़ दो। वे उस चीज के लिए कोई जानकारी नहीं जोड़ते हैं जिसे आप मॉडल करने की कोशिश कर रहे हैं।


यही मेरी आंत की प्रतिक्रिया भी है; शायद इसे उखाड़ फेंके, लेकिन मैं ऐसी स्थिति की परिकल्पना कर सकता हूँ जहाँ पक्षी देखे गए लेकिन कोई कॉल नहीं की गई। इसलिए बाधा मॉडल, लेकिन आंतरिक रूप से यह अभी भी उपयोग कर रहा है, glm.fitजो उन मूल्यों को भी फेंक देता है, भले ही उन मूल्यों को मॉडल के गिनती भाग में नहीं गिना जाता है। मुझे लगता है कि मैं बाधा मॉडल को हाथ से कर सकता था लेकिन मैं ऐसा नहीं करना चाहता, बस छात्र को सलाह दूं।
गेविन सिम्पसन 20

3
यदि आपके पास गैर-शून्य अवलोकन वाले पक्षियों से बहुत सारे शून्य कॉल हैं, तो आप शून्य-फुलाया हुआ पॉइज़न मॉडल (या इसी तरह) करना चाहते हैं, लेकिन जब आप प्रति पक्षी कॉल की संख्या में रुचि रखते हैं, तो यह शून्य से देखे गए पक्षियों से बहुत अलग है ।
21

इस मामले में मुझे नहीं लगता कि हमारे पास उनमें से कई हैं; 0-देखे गए पक्षियों के डेटा को फेंकना और एक नकारात्मक द्विपद के साथ फिटिंग करना एक उचित पहला कदम लगता है।
गैविन सिम्पसन

2

एक पॉइज़न GLM में, ऑफ़सेट पॉसिऑन दर को मॉडल किए जाने के लिए एक ऑफसेट स्केलिंग है - और शून्य की दर के साथ एक पॉइज़न सहायक या सार्थक नहीं है ...

इसलिए Spacedman सही है!


0

बस इसे (हर्डल) "हाथ से करने की कोशिश करें (" डिडक्टिक / जिम्नास्टिक "पर्सपॉर्स के लिए): द्विपदीय भाग और क्यूट भाग और अजॉय फिटिंग लॉगिट और कॉट रिग्रेशन को अलग-अलग विभाजित करें! या फ्रेड हर्डल मॉडल (+ वुंग परीक्षण) का उपयोग करें पॉइसन / नेगबिन! / गामा ..., गाम। आपको यहां "ऑफसेट" संस्करण की आवश्यकता नहीं है, मुझे लगता है।; ;-)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.