मैं यह जांचना चाहूंगा कि क्या प्रतिगमन मेरे डेटा को सबसे अच्छी तरह से फिट बैठता है। मेरा आश्रित चर एक गिनती है, और इसमें बहुत सारे शून्य हैं।
और मुझे यह निर्धारित करने के लिए कुछ मदद की आवश्यकता होगी कि मॉडल और परिवार का उपयोग करने के लिए (पॉइसन या क्सीपॉइसन, या शून्य-फुलाया हुआ पॉइसन रिग्रेशन), और मान्यताओं का परीक्षण कैसे करें।
- पॉइसन रिग्रेशन: जहां तक मैं समझता हूं, मजबूत धारणा यह है कि आश्रित चर का अर्थ = विचरण है। आप इसे कैसे परखेंगे? वे एक साथ कितने करीब हैं? क्या इसके लिए बिना शर्त या सशर्त माध्य और भिन्नता का उपयोग किया जाता है? यदि यह धारणा पकड़ में नहीं आती है तो मैं क्या करूं?
- मैंने पढ़ा है कि यदि विचरण का मतलब है कि हमारे पास अतिविशिष्टता है, और इससे निपटने का एक संभावित तरीका अधिक स्वतंत्र चर, या परिवार = क्वासिपोइसन शामिल है। क्या इस वितरण की कोई अन्य आवश्यकताएं या धारणाएं हैं? मैं यह देखने के लिए क्या परीक्षण का उपयोग करता हूं कि (1) या (2) बेहतर है
anova(m1,m2)
? - मैं यह भी पढ़ता हूं कि जब अतिविशिष्टता दिखाई देती है तो नकारात्मक-द्विपद वितरण का उपयोग किया जा सकता है। मैं आर में यह कैसे करूं? क्वासिपोइसन में क्या अंतर है?
शून्य-फुलाया हुआ पॉइसन रिग्रेशन: मैंने पढ़ा कि वीयूंग परीक्षण का उपयोग करके यह जांचा जाता है कि कौन से मॉडल बेहतर हैं।
> vuong (model.poisson, model.zero.poisson)
क्या वो सही है? शून्य-प्रवर्धित प्रतिगमन की क्या मान्यताएँ हैं?
यूसीएलए की अकादमिक प्रौद्योगिकी सेवाओं, सांख्यिकीय परामर्श समूह में शून्य-फुलाया हुआ पॉइज़न रिग्रेसन के बारे में एक खंड है , और मानक पॉइज़न मॉडल (बी) के खिलाफ ज़िरोफ्लिनेटेड मॉडल (ए) का परीक्षण करें:
> m.a <- zeroinfl(count ~ child + camper | persons, data = zinb)
> m.b <- glm(count ~ child + camper, family = poisson, data = zinb)
> vuong(m.a, m.b)
मुझे समझ में नहीं आता है कि | persons
पहले मॉडल का हिस्सा क्या करता है, और आप इन मॉडलों की तुलना क्यों कर सकते हैं। मैंने उम्मीद की थी कि प्रतिगमन समान हो और बस एक अलग परिवार का उपयोग करें।