मैं आर में डेटा गणना करने की कोशिश कर रहा हूं जो कि स्पष्ट रूप से अंडरड्रेसड (फैलाव पैरामीटर ~ .40) है। यह संभवत: इसीलिए या इसके glm
साथ family = poisson
एक नकारात्मक द्विपद ( glm.nb
) मॉडल महत्वपूर्ण नहीं है। जब मैं अपने डेटा के विवरणों को देखता हूं, तो मेरे पास गणना डेटा का विशिष्ट तिरछा नहीं होता है और मेरी दो प्रायोगिक स्थितियों में अवशिष्ट भी सजातीय हैं।
तो मेरे सवाल हैं:
क्या मुझे भी अपने गणना डेटा के लिए विशेष प्रतिगमन विश्लेषण का उपयोग करना होगा, यदि मेरा गणना डेटा वास्तव में गणना डेटा की तरह व्यवहार नहीं करता है? मैं कभी-कभी गैर-सामान्यता का सामना करता हूं (आमतौर पर कुर्तोसिस के कारण), लेकिन मैंने गैर-सामान्यता के लिए खाते में ट्रिम किए गए साधनों (विलकॉक्स, 2012) की तुलना करने के लिए प्रतिशतक बूटस्ट्रैप विधि का उपयोग किया। क्या विल्क्स द्वारा सुझाए गए किसी भी मजबूत तरीके और डब्ल्यूआरएस पैकेज में महसूस किए गए आंकड़ों की गणना की जा सकती है?
यदि मुझे गणना डेटा के लिए प्रतिगमन विश्लेषण का उपयोग करना है, तो मैं कैसे फैलाव के लिए खाता हूं? पॉसन और नकारात्मक द्विपद वितरण एक उच्च फैलाव मानते हैं, इसलिए यह उचित नहीं होना चाहिए? मैं अर्ध-पॉइसन वितरण को लागू करने के बारे में सोच रहा था , लेकिन आमतौर पर अधिक फैलाव के लिए सिफारिश की जाती है। मैं बीटा-द्विपद मॉडल के बारे में पढ़ता हूं जो कि खाते में सक्षम होने के साथ-साथ अंडरडिस्पोर्टेशन
VGAM
आर के पैकेज में उपलब्ध हैं। लेखक हालांकि एक टिल्ड पॉइसन वितरण की सिफारिश करते हैं , लेकिन मैं इसे पैकेज में नहीं पा सकता हूं ।
क्या कोई अंडरड्रेसड डेटा के लिए एक प्रक्रिया की सिफारिश कर सकता है और शायद इसके लिए कुछ उदाहरण आर कोड प्रदान करता है?