नकारात्मक द्विपद / पॉसन प्रतिगमन में अतिवृद्धि और अंतर्विरोध


11

मैं एसएएस में एक पोइसन रिग्रेशन का प्रदर्शन कर रहा था और पाया कि पियर्सन ची-स्क्वेरड मूल्य को स्वतंत्रता की डिग्री से विभाजित किया गया था, यह 5 के आसपास था, जो महत्वपूर्ण ओवरडिप्रेशन को दर्शाता है। इसलिए, मैं खरीद जीनोम के साथ एक नकारात्मक द्विपद मॉडल फिट करता हूं और पाया गया कि पियर्सन ची-स्क्वेर्ड मूल्य स्वतंत्रता की डिग्री से विभाजित है 0.80। क्या अब इसे कमतर आंका जाता है? यदि हां, तो कोई इसे कैसे संभाल सकता है? मैंने अतिविशिष्टता के बारे में बहुत कुछ पढ़ा है और मुझे विश्वास है कि मुझे पता है कि इसे कैसे संभालना है लेकिन अंडरडाइस्पोर्टेशन क्या है, इसे कैसे हैंडल या निर्धारित किया जाए, इसकी जानकारी है। क्या कोई सहायता कर सकता है?

धन्यवाद।


जवाबों:


17

माध्य के साथ एक Poisson वितरण के लिए विचरण भी । मॉडल रैखिक सामान्यीकृत के ढांचे के भीतर यह संकेत मिलता है कि विचरण समारोह है प्वासों मॉडल के लिए। यह मॉडल धारणा कई अलग-अलग कारणों से गलत हो सकती है। उदाहरण के लिए, ओवरसिप्रॉन्डेड काउंट डेटा को एक विचरण के साथ बड़ा किया जाता है, जो कि पॉसन डिस्ट्रीब्यूशन डिक्टेट है, उदाहरण के लिए, अक्सर सामना किया गया। μ V ( μ ) = μμμ

V(μ)=μ

प्रतिगमन संदर्भ में विचलन धारणा से विचलन कई रूप ले सकता है। सबसे सरल यह है कि विचरण समारोह साथ एक फैलाव पैरामीटर के बराबर होता है । यह क्वासी-पॉइसन मॉडल है। यह वही फिट प्रतिगमन मॉडल दे देंगे, लेकिन सांख्यिकीय निष्कर्ष ( -values और विश्वास के अंतराल) खत्म या underdispersion एक अनुमान के अनुसार फैलाव पैरामीटर का उपयोग करने के लिए निकाला जाता है।ψ > 0 पी

V(μ)=ψμ
ψ>0p

विचरण समारोह का कार्यात्मक रूप भी गलत हो सकता है। यह दूसरी डिग्री का बहुपद सकता है। उदाहरणों में द्विपद, नकारात्मक द्विपद और गामा मॉडल शामिल हैं। पोइसन मॉडल के विकल्प के रूप में इनमें से किसी भी मॉडल को चुनना फिट किए गए प्रतिगमन मॉडल के साथ-साथ बाद के सांख्यिकीय निष्कर्ष को प्रभावित करेगा। आकृति पैरामीटर के साथ नकारात्मक द्विपद वितरण के लिए विचरण समारोह हम यह देख सकते हैं कि अगर हमें Poisson वितरण के लिए विचरण समारोह मिलता है।λ > 0 V ( μ ) = μ ( 1 + μ)

V(μ)=aμ2+bμ+c,
λ>0λ
V(μ)=μ(1+μλ).
λ

यह निर्धारित करने के लिए कि पॉइसन मॉडल के लिए विचरण समारोह डेटा के लिए उपयुक्त है, हम फैलाव पैरामीटर का अनुमान लगा सकते हैं क्योंकि ओपी सुझाव देता है और जांचें कि क्या यह लगभग 1 है (शायद एक औपचारिक परीक्षण का उपयोग करके)। ऐसा परीक्षण एक विशिष्ट विकल्प का सुझाव नहीं देता है, लेकिन यह सबसे स्पष्ट रूप से अर्ध-पॉइसन मॉडल के भीतर समझा जाता है। परीक्षण करने के लिए यदि विचरण समारोह का कार्यात्मक रूप उपयुक्त है, तो हम नकारात्मक द्विपद मॉडल ( ) के खिलाफ मॉडल ( ) की संभावना अनुपात परीक्षण का निर्माण कर सकते हैं । ध्यान दें कि यह अशक्त परिकल्पना के तहत एक गैरमानक वितरण है। या हम गैर-नेस्टेड मॉडल की तुलना के लिए सामान्य रूप से एआईसी-आधारित विधियों का उपयोग कर सकते हैं। पोइसन मॉडल में अतिविशिष्टता के लिए प्रतिगमन-आधारित परीक्षणλ < λ=λ< सामान्य विचरण कार्यों के लिए परीक्षणों की एक कक्षा की पड़ताल।

हालांकि, मैं सभी अध्ययन अवशिष्ट भूखंडों में से एक की सिफारिश करूंगा, जैसे कि फिट किए गए मूल्यों के खिलाफ पियर्सन या अवशिष्ट अवशिष्ट (या उनके चुकता मूल्य) का एक भूखंड। यदि विचरण का कार्यात्मक रूप गलत है, तो आप इसे अवशिष्ट भूखंड में फ़नल आकार (या वर्ग के अवशेषों के लिए एक प्रवृत्ति) के रूप में देखेंगे। यदि क्रियात्मक रूप सही है, यानी कोई फ़नल या ट्रेंड नहीं है, तब भी अधिक-या कमतर अंतर हो सकता है, लेकिन इसका फैलाव पैरामीटर का आकलन करके किया जा सकता है। अवशिष्ट भूखंड का लाभ यह है कि यह परीक्षण से अधिक स्पष्ट रूप से सुझाव देता है कि यदि कुछ भी हो तो विचरण समारोह में क्या गलत है।

ओपी के ठोस मामले में यह कहना संभव नहीं है कि क्या दी गई जानकारी में से 0.8 अंडरडाइपर को इंगित करता है। 5 और 0.8 अनुमानों पर ध्यान केंद्रित करने के बजाय, मैं सबसे पहले पॉइज़न मॉडल और नकारात्मक द्विपद मॉडल के विचरण कार्यों के फिट की जांच करने का सुझाव देता हूं। एक बार जब विचरण समारोह का सबसे उपयुक्त कार्यात्मक रूप निर्धारित किया जाता है, तो एक फैलाव पैरामीटर को शामिल किया जा सकता है, यदि आवश्यक हो, तो किसी भी अतिरिक्त ओवरडिप्रेशन के लिए सांख्यिकीय निष्कर्ष को समायोजित करने के लिए या तो मॉडल में। एसएएस में आसानी से कैसे करें, कहते हैं, दुर्भाग्य से कुछ ऐसा नहीं है जिसकी मैं मदद कर सकता हूं।


2
+1, यह अच्छी सामान्य जानकारी है। यदि आप विशेष रूप से ओपी के स्पष्ट प्रश्नों को संबोधित करते हैं, तो यह ओपी के लिए अधिक उपयोगी हो सकता है: (1) .8 अविकसित है; और (2) यदि हां, तो w / से कैसे निपटें।
गंग -

@ गुंग, मैंने अधिक विशिष्ट सलाह देने के लिए उत्तर संपादित किया है। आप यह निर्धारित नहीं कर सकते कि 0.8 उपलब्ध जानकारी से 1 से काफी छोटा है, और आईएमएचओ इस बात पर ध्यान केंद्रित कर रहा है कि फैलाव पैरामीटर 1 है या नहीं। मेरा संपादन बताता है कि मुझे क्या लगता है कि ओपी को इसके बजाय ध्यान केंद्रित करना चाहिए।
NRH
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.