रैखिक प्रतिगमन आपके परिणाम के लिए सही विकल्प नहीं है, दिए गए:
- परिणाम चर सामान्य रूप से वितरित नहीं किया जाता है
- परिणाम चर को उन मानों में सीमित किया जा सकता है, जो (गणना डेटा का अर्थ है कि अनुमानित मान ऋणात्मक नहीं हो सकते हैं)
- 0 विज़िट के साथ मामलों की उच्च आवृत्ति प्रतीत होती है
गिनती डेटा के लिए सीमित आश्रित मॉडल
आपके द्वारा चुनी जा सकने वाली अनुमान रणनीति आपके परिणाम चर की "संरचना" द्वारा निर्धारित होती है। यही है, यदि आपका परिणाम चर उन मूल्यों में सीमित है जो वह ले सकता है (यानी यदि यह सीमित निर्भर चर है ), तो आपको एक मॉडल चुनने की आवश्यकता है जहां अनुमानित मान आपके परिणाम के लिए संभव सीमा के भीतर गिर जाएंगे। जबकि कभी-कभी रैखिक प्रतिगमन सीमित निर्भर चर (उदाहरण के लिए, बाइनरी लॉगिट / प्रोबिट के मामले में) के लिए एक अच्छा सन्निकटन है, अक्सर यह नहीं होता है। सामान्यीकृत रैखिक मॉडल दर्ज करें । आपके मामले में, क्योंकि परिणाम चर गणना डेटा है, आपके पास कई विकल्प हैं:
- पोइसन मॉडल
- नकारात्मक द्विपद मॉडल
- जीरो इन्फ्लेशन पोइजन (जिप) मॉडल
- ज़ीरो इन्फ्लेटेड निगेटिव बिनोमियल (ZINB) मॉडल
पसंद आमतौर पर अनुभवजन्य रूप से निर्धारित की जाती है। मैं नीचे इन विकल्पों के बीच चयन करने के बारे में संक्षेप में चर्चा करूंगा।
पॉसन बनाम नकारात्मक द्विपद
θएच0: Θ = 0एच1: Θ ≠ 0θ
ज़िप बनाम ZINB
एक संभावित जटिलता शून्य मुद्रास्फीति है, जो यहां एक मुद्दा हो सकता है। यह वह जगह है जहां शून्य-फुलाया मॉडल ज़िप और ZINB आते हैं। इन मॉडलों का उपयोग करते हुए, आप मानते हैं कि शून्य मान उत्पन्न करने वाली प्रक्रिया अन्य, गैर-शून्य मानों को उत्पन्न करने वाली प्रक्रिया से अलग है। पहले की तरह, ZINB उचित है जब परिणाम में अत्यधिक शून्य होता है और ओवरस्पीड होता है, जबकि ज़िप उपयुक्त होता है जब परिणाम में अत्यधिक शून्य होता है लेकिन सशर्त का मतलब = सशर्त विचरण होता है। शून्य-फुलाए गए मॉडल के लिए, आपके द्वारा ऊपर सूचीबद्ध मॉडल कोवरिएट्स के अलावा, आपको उन चरों के बारे में सोचना होगा, जिनके परिणाम में आपके द्वारा देखे गए अतिरिक्त शून्य उत्पन्न हुए होंगे। फिर, ऐसे सांख्यिकीय परीक्षण होते हैं जो इन मॉडलों के आउटपुट के साथ आते हैं (कभी-कभी जब आप एक कमांड निष्पादित करते हैं तो आपको उन्हें निर्दिष्ट करना पड़ सकता है)θ
θएच0: Θ = 0एच1: Θ ≠ 0एच0: ईx c e s s zई आर ओ ई एस एस मैं एस एन ओ टी ए o f a s e p a r a t e pr e s u l t ओ च ए s e p a r a t e p r o c e s s sएच1: ईx c e s s zई आर ओ ई एस एस मैं एस ए r e s u l t ओ च ए s e p a r a t e p r o c e s s s
θθ
अंत में, मैं R का उपयोग नहीं करता हूं, लेकिन UCLA डेटा विश्लेषण उदाहरणों में IDRE इन मॉडलों को फिट करने में आपका मार्गदर्शन कर सकता है।
[टिप्पणी के लिए पर्याप्त प्रतिष्ठा के बिना किसी अन्य उपयोगकर्ता द्वारा संपादित करें: यह पत्र बताता है कि शून्य-मुद्रास्फीति मॉडल की तुलना करने और विकल्प प्रदान करने के लिए आपको वुंग परीक्षण का उपयोग क्यों नहीं करना चाहिए।
पी। विल्सन, "द मिस्यूज ऑफ़ द वुंग टेस्ट फॉर नॉन-नेस्टेड मॉडल्स टू टेस्ट टू जीरो-इनफ्लेशन।" अर्थशास्त्र पत्र, 2015, खंड। 127, अंक C, 51-53 ]