गणना डेटा के विचरण का पैरामीट्रिक मॉडलिंग


12

मैं कुछ डेटा मॉडल करना चाह रहा हूं, लेकिन मुझे यकीन नहीं है कि मैं किस प्रकार के मॉडल का उपयोग कर सकता हूं। मेरे पास गणना डेटा है, और मुझे एक मॉडल चाहिए जो डेटा के माध्य और विचरण दोनों का पैरामीट्रिक अनुमान लगाएगा। यही है, मेरे पास विभिन्न पूर्वानुमान कारक हैं और मैं यह निर्धारित करना चाहता हूं कि उनमें से कोई भी विचरण को प्रभावित करता है (न कि केवल समूह का मतलब है)।

मुझे पता है कि पोइसन प्रतिगमन काम नहीं करेगा क्योंकि विचरण मतलब के बराबर है; यह धारणा मेरे मामले में मान्य नहीं है, इसलिए मुझे पता है कि अतिवृद्धि है। हालांकि, एक नकारात्मक द्विपद मॉडल केवल एक ही अतिव्यापी पैरामीटर उत्पन्न करता है, न कि वह जो मॉडल में भविष्यवक्ताओं का एक कार्य है। कौन सा मॉडल ऐसा कर सकता है?

इसके अतिरिक्त, एक पुस्तक या पेपर का संदर्भ जो मॉडल और / या एक आर पैकेज की चर्चा करता है जो मॉडल को कार्यान्वित करता है।


1
आपको कैसे पता चलेगा कि पहले पॉइसन रिग्रेशन किए बिना ओवरस्पीडरेशन है? आखिरकार, कच्चे (प्रतिक्रिया) मूल्यों के विचरण की तुलना उनके माध्य के लिए प्रासंगिक नहीं है: पॉसन मॉडल के फिट होने के क्या मायने हैं (यह मूल्यांकन करने की तुलना में रैखिक मॉडल में अवशिष्ट के वितरण का मूल्यांकन करने का एनालॉग है प्रतिक्रिया चर का वितरण)। इसे लगाने का एक और तरीका यह है कि स्वतंत्र चर और प्रतिक्रिया के बीच की कड़ी एक सुंदर सटीक पॉइसन मॉडल में भी अतिविशिष्टता की उपस्थिति पैदा कर सकती है।
व्हिबर

2
@ जब वह एक उचित बिंदु है। एक एकल श्रेणीबद्ध भविष्यवक्ता के लिए, उप-समूहों को देखने और उनका मतलब निकालने के लिए पर्याप्त होगा, लेकिन यह अतिविशिष्टता का पता लगाने के लिए पर्याप्त होगा, लेकिन बहुभिन्नरूपी पॉइसन प्रतिगमन के लिए, यह नहीं है। तर्क के लिए, मान लें कि एक पॉइसन और नकारात्मक दोनों द्विपद प्रतिगमन किया गया है और नकारात्मक द्विपद, एनोवा मॉडल तुलना के माध्यम से बेहतर फिट दिखाता है। यह अतिविशिष्टता का संकेत देना चाहिए। यह देखते हुए, कि विचरण / अतिविषयकता स्थिरांक के बजाय पैरामीट्रिक रूप से कैसे तैयार की जा सकती है?
ब्रायन डिग्स

1
मुझे लगता है कि मैककूल और नेल्डर में एक अध्याय है , सामान्यीकृत रैखिक मॉडल, दूसरा संस्करण , जो इसे कवर करता है (लेकिन मेरी कॉपी काम पर है) ... एक वास्तविक संभावना नहीं होगी, लेकिन आप अर्ध-संभावना का उपयोग कर सकते हैं, और इसलिए अध्याय का शीर्षक हो सकता है। आप पुनरावृत्त कम से कम वर्गों को लागू करते हैं, भले ही कोई संभावना मॉडल नहीं है जो मेल खाती है।
कार्ल

मैककुलग और नेल्डर के अध्याय 10 में माध्य और फैलाव के संयुक्त मॉडलिंग पर चर्चा की गई है, जिसका मतलब है कि दोनों माध्य और विचरण को मापते हैं। विस्तारित अर्ध-संभावना एक मुख्य उपकरण है, लेकिन कुछ स्थितियों में उस पद्धति के बारे में चिंताएं
हैं

जवाबों:


9

आप आर में गेमल्स पैकेज का उपयोग करके नकारात्मक द्विआधारी फैलाव पैरामीटर को स्वयं चर और मापदंडों के एक फ़ंक्शन के रूप में मॉडल कर सकते हैं। मैं इसे एक परिचय से एक अंश प्रदान करता हूं:

मुझे GAMLSS का उपयोग क्यों करना चाहिए

यदि आपकी प्रतिक्रिया चर गणना (असतत) डेटा है तो यह बहुत संभावना है कि पॉइसन वितरण अच्छी तरह से फिट नहीं होगा। GAMLSS विभिन्न प्रकार के असतत वितरण (नकारात्मक द्विपद सहित) प्रदान करता है जिसे आप आज़मा सकते हैं। फैलाव पैरामीटर को व्याख्यात्मक चर के एक समारोह के रूप में भी तैयार किया जा सकता है।

Www.gamlss.org वेबसाइट में पैकेज में उपयोग किए गए दृष्टिकोणों पर कई कागजात के दस्तावेज और लिंक हैं।


दोनों उत्तर सहायक हैं और अच्छे संदर्भ प्रदान करते हैं। मैं इस पर इनाम इसलिए दे रहा हूं क्योंकि (ए) इसने चार मिनट पहले दूसरे को दिया और (बी) गेमल्स का समाधान मेरे लिए नया है (मैं nbreg से परिचित हूं)। लेकिन अच्छा जवाब देने के लिए @timbp से नफरत करता है; मुझे आशा है कि आप हमारी साइट पर अपना योगदान जारी रखेंगे।
whuber

2
@ शुभंकर, मैं भी फटा हुआ था, जिसे "" उत्तर के रूप में स्वीकार करना था क्योंकि दोनों बहुत मददगार थे। मैं इस एक के साथ गया था क्योंकि इसमें एक आर पैकेज संदर्भ शामिल था जिसे मैं उपयोग कर सकता हूं; अन्य उत्तर में पुस्तक संदर्भ अच्छा पढ़ने के लिए दिया गया है और इसे छूट नहीं दी जानी चाहिए। इनाम देने के लिए धन्यवाद जिसने इन दो अच्छे उत्तरों को प्रेरित किया।
ब्रायन डिग्स

9

Stata -gnbreg- कमांड प्रदान करता है, जो आपको फैलाव पैरामीटर को मॉडल करने की अनुमति देता है। आप http://www.stata.com/help.cgi?nbreg पर कमांड के लिए स्टैटा मदद देख सकते हैं

स्टैटा इसे सामान्यीकृत नकारात्मक द्विपद मॉडल कहते हैं। जोसेफ हिल्ब ने अपनी पुस्तक "नेगेटिव बिनोमियल रिग्रेशन", धारा 10.4 में "एनबी-एच: विषम नकारात्मक द्विपद रिग्रेशन" के रूप में इसकी चर्चा की है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.