पॉसन प्रतिगमन धारणाएं और उन्हें आर में कैसे परीक्षण करें


11

मैं यह जांचना चाहूंगा कि क्या प्रतिगमन मेरे डेटा को सबसे अच्छी तरह से फिट बैठता है। मेरा आश्रित चर एक गिनती है, और इसमें बहुत सारे शून्य हैं।

और मुझे यह निर्धारित करने के लिए कुछ मदद की आवश्यकता होगी कि मॉडल और परिवार का उपयोग करने के लिए (पॉइसन या क्सीपॉइसन, या शून्य-फुलाया हुआ पॉइसन रिग्रेशन), और मान्यताओं का परीक्षण कैसे करें।

  1. पॉइसन रिग्रेशन: जहां तक ​​मैं समझता हूं, मजबूत धारणा यह है कि आश्रित चर का अर्थ = विचरण है। आप इसे कैसे परखेंगे? वे एक साथ कितने करीब हैं? क्या इसके लिए बिना शर्त या सशर्त माध्य और भिन्नता का उपयोग किया जाता है? यदि यह धारणा पकड़ में नहीं आती है तो मैं क्या करूं?
  2. मैंने पढ़ा है कि यदि विचरण का मतलब है कि हमारे पास अतिविशिष्टता है, और इससे निपटने का एक संभावित तरीका अधिक स्वतंत्र चर, या परिवार = क्वासिपोइसन शामिल है। क्या इस वितरण की कोई अन्य आवश्यकताएं या धारणाएं हैं? मैं यह देखने के लिए क्या परीक्षण का उपयोग करता हूं कि (1) या (2) बेहतर है anova(m1,m2)?
  3. मैं यह भी पढ़ता हूं कि जब अतिविशिष्टता दिखाई देती है तो नकारात्मक-द्विपद वितरण का उपयोग किया जा सकता है। मैं आर में यह कैसे करूं? क्वासिपोइसन में क्या अंतर है?
  4. शून्य-फुलाया हुआ पॉइसन रिग्रेशन: मैंने पढ़ा कि वीयूंग परीक्षण का उपयोग करके यह जांचा जाता है कि कौन से मॉडल बेहतर हैं।

    > vuong (model.poisson, model.zero.poisson)

    क्या वो सही है? शून्य-प्रवर्धित प्रतिगमन की क्या मान्यताएँ हैं?

  5. यूसीएलए की अकादमिक प्रौद्योगिकी सेवाओं, सांख्यिकीय परामर्श समूह में शून्य-फुलाया हुआ पॉइज़न रिग्रेसन के बारे में एक खंड है , और मानक पॉइज़न मॉडल (बी) के खिलाफ ज़िरोफ्लिनेटेड मॉडल (ए) का परीक्षण करें:

    > m.a <- zeroinfl(count ~ child + camper | persons, data = zinb)
    > m.b <- glm(count ~ child + camper, family = poisson, data = zinb)
    > vuong(m.a, m.b)

मुझे समझ में नहीं आता है कि | personsपहले मॉडल का हिस्सा क्या करता है, और आप इन मॉडलों की तुलना क्यों कर सकते हैं। मैंने उम्मीद की थी कि प्रतिगमन समान हो और बस एक अलग परिवार का उपयोग करें।

जवाबों:


8

X¯S2F(1,n1)n

ध्यान दें कि यह परीक्षण कोवरिएट को अनदेखा करता है - इसलिए शायद उस स्थिति में अति-फैलाव की जांच करने का सबसे अच्छा तरीका नहीं है।

यह भी ध्यान दें कि यह परीक्षण शून्य-प्रवर्धित परिकल्पना के खिलाफ संभवतः कमजोर है।

3) आर में नकारात्मक द्विपद: पैकेज glm.nbसे उपयोग करें MASS, या नकारात्मक द्विपद लिंक का उपयोग करके पैकेज zeroinflसे फ़ंक्शन psclका उपयोग करें।

4) ज़िप (शून्य-फुलाया हुआ पॉइसन) एक मिश्रण मॉडल है। आपके पास एक द्विआधारी परिणाम है, जिसके अनुसार एक विषय समूह ए (जहां एक 0 निश्चित है) या समूह बी (जहां मायने पॉसन या नकारात्मक द्विपद वितरित हैं) के अंतर्गत आता है। एक मनाया गया समूह ए के विषयों से समूह बी के विषयों के कारण है जो अभी भाग्यशाली हुआ है। मॉडल के दोनों पहलू कोवरिएट्स पर निर्भर कर सकते हैं: समूह सदस्यता को लॉजिस्टिक की तरह बनाया गया है (लॉग ऑड कोवेरियेट्स में रैखिक है) और पॉइसन भाग को सामान्य तरीके से तैयार किया जाता है: लॉग का मतलब कोवरिएट में रैखिक होता है। तो आपको एक लॉजिस्टिक (निश्चित 0 भाग के लिए) और एक पॉइज़न के लिए सामान्य मान्यताओं के लिए सामान्य मान्यताओं की आवश्यकता है। दूसरे शब्दों में, एक जिप मॉडल आपकी ओवरडिपर्ट्स समस्याओं को ठीक नहीं करेगा - यह केवल जीरो का एक बड़ा धूमपान करता है।

5) निश्चित नहीं है कि डेटा सेट क्या है और संदर्भ नहीं मिल सकता है। zeroinfl को पॉइसन भाग और बाइनरी (निश्चित 0 या नहीं) भाग दोनों के लिए एक मॉडल की आवश्यकता होती है। निश्चित 0 भाग दूसरे स्थान पर जाता है। तो मा कह रहा है कि व्यक्ति एक निश्चित 0 है या नहीं "व्यक्तियों" पर निर्भर करता है - और विषय को एक निश्चित 0 नहीं है, गिनती टूरिस्ट और बच्चे का एक कार्य है। दूसरे शब्दों में, लॉग (माध्य) उन विषयों के लिए टूरिस्ट और बच्चे का एक रैखिक कार्य है, जिन्हें 0 गिनती की आवश्यकता नहीं है।

mb टूरिस्ट और बच्चे के संदर्भ में गिनती का एक सामान्य रैखिक मॉडल है - दोनों को निश्चित प्रभाव माना जाता है। लिंक फ़ंक्शन पॉसों है।


धन्यवाद! एक त्वरित प्रश्न: क्या आर = 2 या छद्म-आर ^ 2 का उत्पादन करने का एक तरीका है, जैसे कि आर में परिवार = कविता का उपयोग करते हुए नागलकेकर? धन्यवाद!
टॉरवॉन

0
  1. पुस्तकालय (pastecs)

stat.desc (dep_var) - और फिर एक नज़र डालें यदि माध्य और विचरण बराबर हैं। यहां से आप अपने वेक्टर में शून्य के% की गणना भी कर सकते हैं।


3
साइट पर आपका स्वागत है। यह एक उत्तर की तुलना में टिप्पणी की तरह अधिक है; इसके अलावा, उचित वर्तनी और इतने पर उपयोग करना बेहतर है - यह टेक्स्टिंग नहीं है और इस साइट को पढ़ने वाले बहुत से लोग 2 या 3 या .... भाषा के रूप में अंग्रेजी में हैं।
पीटर Flom

3
कृपया, इस त्वरित उत्तर को सुधारने पर काम करें।
chl
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.