गणना डेटा पर प्रतिगमन मॉडल की तुलना करना


11

मैं हाल ही में एक ही भविष्यवक्ता / प्रतिक्रिया डेटा के लिए 4 कई प्रतिगमन मॉडल फिट करता हूं। दो मॉडल मैं पॉइसन प्रतिगमन के साथ फिट हूं।

model.pois <- glm(Response ~ P1 + P2 +...+ P5, family=poisson(), ...)
model.pois.inter <- glm(Response ~ (P1 + P2 +...+ P5)^2, family=poisson(), ...)

दो मॉडल मैं नकारात्मक द्विपद प्रतिगमन के साथ फिट हूं।

library(MASS)
model.nb <- glm.nb(Response ~ P1 + P2 +...+ P5, ...)
model.nb.inter <- glm.nb(Response ~ (P1 + P2 +...+ P5)^2, ...)

क्या इन मॉडलों की तुलना करने के लिए एक सांख्यिकीय परीक्षण का उपयोग किया जा सकता है? मैं फिट के माप के रूप में एआईसी का उपयोग कर रहा हूं, लेकिन एएफएआईके यह एक वास्तविक परीक्षण का प्रतिनिधित्व नहीं करता है।


आप एक सांख्यिकीय परीक्षण का उपयोग करके मॉडल के फिट की तुलना करना चाहते हैं , है ना? आप किस तरह की परिकल्पना को परखना चाहेंगे?
फायरफेयर

@Firefeather उदाहरण के लिए, मैं परीक्षण करना चाहते हैं के फिट model.nb.interहै काफी की तुलना में बेहतर model.pois.inter। हां, AIC कम है, लेकिन कितना कम का गठन काफी बेहतर है ?
डेनियल स्टैंडेज

नोट: इस प्रश्न के उत्तर में वास्तव में एआईसी शामिल नहीं है।
डैनियल स्टैंडेज

मैं इस सवाल का जवाब नहीं जानता, लेकिन मैं एक शुरुआत दे सकता हूं। मैं आपको एक का उपयोग कर सकते पता है तुलना करने के लिए परीक्षण के खिलाफ (और इसी तरह की तुलना के खिलाफ ), लेकिन मैं एक प्वासों मॉडल और एक नकारात्मक द्विपद मॉडल काम करेगा के बीच कि तुलना गारंटी नहीं दे सकते। मुझे आश्चर्य है कि अगर प्रत्येक जोड़ी के संस्करण की तुलना करने के लिए एक परीक्षण विश्वसनीय होगा। Fmodel.poismodel.pois.intermodel.nbmodel.nb.interF
फायरफेयर

1
@ फ़ाइफ़र, हाँ मैं परिवार के विश्वास स्तर को नियंत्रित करने की आवश्यकता से अवगत हूं। बोन्फ्रोन की तुलना में क्या शेफ़ी यहां अधिक उपयुक्त होंगे?
डेनियल स्टैंडेज

जवाबों:


14

आप नकारात्मक द्विपद मॉडल की तुलना इसी पोइसन मॉडल से तुलना अनुपात अनुपात परीक्षण के साथ कर सकते हैं। एक पॉइसन मॉडल शून्य के एक अतिविशिष्ट पैरामीटर के साथ एक नकारात्मक द्विपद मॉडल के बराबर है। इसलिए वे नेस्टेड मॉडल हैं और संभावना अनुपात मान्य हैं। जटिलता यह है कि अतिप्रवाह पैरामीटर गैर-नकारात्मक होने के लिए प्रतिबंधित है, अर्थात यह तार्किक रूप से शून्य से कम नहीं हो सकता है, इसलिए अशक्त परिकल्पना पैरामीटर स्थान की सीमा पर है। इसका मतलब यह है कि स्वतंत्रता की एक डिग्री के साथ ची-वर्गीय वितरण के लिए लॉग-संभावना की तुलना में दो बार तुलना करने के बजाय, आपको इसकी तुलना 1 df के साथ ची-वर्ग के बराबर भागों और शून्य पर एक बिंदु द्रव्यमान वाले मिश्रण वितरण से करने की आवश्यकता है। (शून्य डिग्री स्वतंत्रता के साथ एक ची-चुकता वितरण)। व्यवहार में इसका मतलब यह है कि आप 1 df के साथ chi-squared का उपयोग करके p- मान की गणना कर सकते हैं और फिर इसे आधा कर सकते हैं। अधिक जानकारी और पृष्ठभूमि के लिए, केस 5 देखेंस्व & लिआंग जेएएसए 1987; 82 : 605-610।

ध्यान दें कि कुछ सांख्यिकीय सॉफ़्टवेयर पैकेज, जैसे कि स्टैटा, यह सब आपके लिए स्वचालित रूप से करेगा जब आप एक नकारात्मक द्विपद मॉडल फिट करते हैं। वास्तव में मैं बेशर्मी से स्टाटा हेल्प सिस्टम से बहुत ऊपर से अपंग हो गया हूं - अगर आपको स्टैटा दिखे help j_chibar


5

मेरा मानना anova()है कि आर का उपयोग इसके लिए किया जा सकता है। अपने नाम के बावजूद, यह एक संभावना अनुपात परीक्षण है। उनकी द आर बुक में क्रॉली के उपयोग के कुछ उदाहरण हैं।


1

Onestop नोट्स के रूप में, क्योंकि मॉडल नेस्टेड हैं आप संभावना अनुपात परीक्षण कर सकते हैं।

सामान्य तौर पर, हालांकि यह सच नहीं है, इसलिए यदि आप गैर-नेस्टेड मॉडल की तुलना करना चाहते हैं तो आप वुंग के परीक्षण का उपयोग कर सकते हैं ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.