गणना डेटा के लिए पॉइज़न बनाम ज्यामितीय बनाम नकारात्मक द्विपद जीएलएम का उपयोग कब करें?


21

मैं अपने लिए लेआउट की कोशिश कर रहा हूं, जब यह उचित हो कि कौन सा प्रतिगमन प्रकार (ज्यामितीय, पोइसोन, ऋणात्मक द्विपद) गिनें डेटा के साथ, GLM ढांचे के भीतर (8 GLM वितरणों में से केवल 3 का उपयोग गणना डेटा के लिए किया जाता है, हालांकि अधिकांश क्या मैंने नकारात्मक द्विपद और पॉइसन वितरण के आसपास केंद्रों को पढ़ा है)।

गणना डेटा के लिए पॉइज़न बनाम ज्यामितीय बनाम नकारात्मक द्विपद जीएलएम का उपयोग कब करें?


अब तक मेरे पास निम्नलिखित तर्क हैं: क्या यह डेटा की गणना है? यदि हाँ, क्या माध्य और विचरण असमान हैं? यदि हाँ, नकारात्मक द्विपद प्रतिगमन। यदि नहीं, तो पॉइसन प्रतिगमन। क्या शून्य मुद्रास्फीति है? यदि हाँ, शून्य फुलाया Poisson या शून्य फुलाया नकारात्मक द्विपद।

प्रश्न 1 यह स्पष्ट संकेत नहीं है कि कब, किसका उपयोग करना है। क्या उस निर्णय को सूचित करने के लिए कुछ है? जैसा कि मैं समझता हूं, एक बार जब आप ज़िप पर स्विच करते हैं, तो मतलब विचरण बराबर माना जाता है, इसलिए यह फिर से एनबी के समान है।

प्रश्न 2 ज्योमेट्रिक परिवार इस में कहाँ फिट बैठता है या मुझे अपने रिग्रेशन में जियोमेट्रिक फ़ैमिली का उपयोग करने का निर्णय लेते समय किस तरह के प्रश्न करने चाहिए?

प्रश्न 3 मैं देख रहा हूँ कि लोग नकारात्मक द्विपद और पॉइसन को हर समय वितरित करते हैं लेकिन ज्यामितीय नहीं, इसलिए मैं अनुमान लगा रहा हूं कि इसका उपयोग करने के बारे में कुछ अलग है। यदि ऐसा है, तो ये क्या है?

पुनश्च मैं (टिप्पणी से शायद oversimplified,) आरेख (एक कर दिया है संपादन योग्य अगर लोग / टिप्पणी करना चाहता था चर्चा के लिए यह tweak मेरे वर्तमान समझ के)। गणना डेटा: जीएलएम निर्णय पेड़


मैं केवल R प्रोग्रामिंग से परिचित हूं, लेकिन आशा है कि यह मदद ... आंकड़े
RYO ENG Lian Hu

@RYOENG, मैंने देखा कि और मैंने अपने प्रश्न में वर्णित अंतर को लॉजिक ट्री के साथ रखा है। मैं विशेष रूप से कम चर्चा वाले जिले में रुचि रखता हूं
टिमोथी.लेऊ

(UPDATE) @ निक कॉक्स का जवाब यहां है: आंकड़े . stackexchange.com/questions/67547/when-to-use-gamma-glms मुझे लगता है कि इस प्रकार अब तक की खोज को देख पाना मुश्किल हो गया है। जब भी यह सबसे अच्छा काम करता है एक खाली उत्तर से परे इसका उपयोग करने के लिए "
टिमोथी। लाऊ

@Glen_b अच्छी पकड़, मैंने तर्क को अपडेट किया।
टिमोथी। लाला

आप शायद मॉड्स द्वारा डिंग किए जाने के बारे में पैराग्राफ को हटाने के लिए सुरक्षित हैं।
Glen_b -Reinstate मोनिका

जवाबों:


12

μ+1/θμ2θ अल्फा = 1 / θ θ = θ = 1μθα=1/θθ=θ=1

इसलिए इन तीन मॉडलों के बीच संदेह के मामले में, मैं एनबी का अनुमान लगाने की सिफारिश करूंगा: सबसे खराब स्थिति यह है कि आप एक पैरामीटर का बहुत अधिक आकलन करके थोड़ी दक्षता खो देते हैं। लेकिन, निश्चित रूप से, यह आकलन करने के लिए औपचारिक परीक्षण भी हैं कि क्या एक निश्चित मान के लिए (जैसे, 1 या ) पर्याप्त है। या आप सूचना मानदंड आदि का उपयोग कर सकते हैं।θ

बेशक, अन्य एकल या बहु-पैरामीटर गणना डेटा वितरण (आपके द्वारा उल्लेख किए गए यौगिक पॉइसन सहित) के भार भी हैं, जो कभी-कभी बेहतर फिट हो सकते हैं या नहीं भी हो सकते हैं।

अतिरिक्त शून्य के लिए के रूप में: दो मानक रणनीतियों या तो एक शून्य फुलाया हुआ गिनती डेटा वितरण का उपयोग करने के लिए या एक बाधा मॉडल है जिसमें शून्य या उससे अधिक के लिए एक बाइनरी मॉडल शामिल है और एक शून्य-त्रिशंकु गणना डेटा मॉडल है। जैसा कि आप अतिरिक्त शून्य का उल्लेख करते हैं और अतिसूक्ष्मता को भ्रमित किया जा सकता है, लेकिन अक्सर अतिरिक्त शून्य के लिए मॉडल को समायोजित करने के बाद भी काफी हद तक अतिसूक्ष्मता बनी रहती है। फिर से, संदेह की स्थिति में, मैं उपरोक्त तर्क द्वारा NB- आधारित शून्य मुद्रास्फीति या बाधा मॉडल का उपयोग करने की सलाह दूंगा।

अस्वीकरण: यह एक बहुत ही संक्षिप्त और सरल अवलोकन है। व्यवहार में मॉडल लागू करते समय, मैं इस विषय पर एक पाठ्यपुस्तक से परामर्श करने की सलाह दूंगा। निजी तौर पर, मुझे विंकलमैन द्वारा और कैमरन और त्रिवेदी द्वारा डेटा पुस्तकों की गिनती पसंद है। लेकिन अन्य अच्छे भी हैं। R- आधारित चर्चा के लिए आप JSS ( http://www.jstatsoft.org/v27/i08/ ) में हमारे पेपर को पसंद कर सकते हैं ।


4
μ+μ2>μ

3
μ

3
जैसा कि आप मेरी पिछली टिप्पणियों से बताने में सक्षम हो सकते हैं: मैं इस तरह के ओवरसाइप्लाइजिंग फ्लोचार्ट का प्रशंसक नहीं हूं। एक अच्छे मॉडल का चयन करने के लिए मॉडल और व्यावहारिक अनुप्रयोग के बीच के संबंध को समझना आवश्यक है। चाहे आप ज्यामितीय में रुचि रखते हों या नहीं, आपके पास मौजूद एप्लिकेशन केस पर निर्भर करता है। इसी तरह, शून्य-मुद्रास्फीति बनाम बाधा के लिए (जिसे आपने अपने चार्ट से छोड़ दिया है)। अंत में, प्रश्नों का क्रम सभी अनुप्रयोगों आदि के लिए समान रूप से आवश्यक नहीं है
अचिम जाइलिस

2
मुझे लगता है कि मेरा स्केच थोड़ा ओवरसिम्प्लाइज़्ड लगता है। लेकिन विज्ञान के छात्रों के लिए यह सरल नहीं है कि वे सरलतापूर्ण स्कीमा के साथ शुरू करें, यदि आपने भौतिक विज्ञान की कक्षाएं ली हैं, तो आप इससे परिचित हैं कि वे कितनी बार "नियम" बदल चुके हैं और पहले से सीखे हुए हैं, जो कि बाद में और अधिक सीखते हैं। विशेषज्ञ और बारीक समझ। इसलिए, सीखने के लिए, मैं एक स्नातक छात्र हूं, मैं मूल रूप से उन बुनियादी बातों की अधिक "सही" समझ प्राप्त करने की कोशिश कर रहा था, जिन्हें मैं बाद में बना सकता हूं जैसे बाधाएं आदि। संदर्भ के लिए धन्यवाद BTW, मैं पाठ्यपुस्तकों की जांच करूंगा आपने अपने पेपर का भी उल्लेख किया है।
टिमोथी। लाला

1
लॉग(μमैं)=एक्समैंβ
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.