मैं आर में डेटा गणना करने की कोशिश कर रहा हूं जो कि स्पष्ट रूप से अंडरड्रेसड (फैलाव पैरामीटर ~ .40) है। यह संभवत: इसीलिए या इसके glmसाथ family = poissonएक नकारात्मक द्विपद ( glm.nb) मॉडल महत्वपूर्ण नहीं है। जब मैं अपने डेटा के विवरणों को देखता हूं, तो मेरे पास गणना डेटा का विशिष्ट तिरछा नहीं होता है और मेरी दो प्रायोगिक स्थितियों में अवशिष्ट भी सजातीय हैं।
तो मेरे सवाल हैं:
क्या मुझे भी अपने गणना डेटा के लिए विशेष प्रतिगमन विश्लेषण का उपयोग करना होगा, यदि मेरा गणना डेटा वास्तव में गणना डेटा की तरह व्यवहार नहीं करता है? मैं कभी-कभी गैर-सामान्यता का सामना करता हूं (आमतौर पर कुर्तोसिस के कारण), लेकिन मैंने गैर-सामान्यता के लिए खाते में ट्रिम किए गए साधनों (विलकॉक्स, 2012) की तुलना करने के लिए प्रतिशतक बूटस्ट्रैप विधि का उपयोग किया। क्या विल्क्स द्वारा सुझाए गए किसी भी मजबूत तरीके और डब्ल्यूआरएस पैकेज में महसूस किए गए आंकड़ों की गणना की जा सकती है?
यदि मुझे गणना डेटा के लिए प्रतिगमन विश्लेषण का उपयोग करना है, तो मैं कैसे फैलाव के लिए खाता हूं? पॉसन और नकारात्मक द्विपद वितरण एक उच्च फैलाव मानते हैं, इसलिए यह उचित नहीं होना चाहिए? मैं अर्ध-पॉइसन वितरण को लागू करने के बारे में सोच रहा था , लेकिन आमतौर पर अधिक फैलाव के लिए सिफारिश की जाती है। मैं बीटा-द्विपद मॉडल के बारे में पढ़ता हूं जो कि खाते में सक्षम होने के साथ-साथ अंडरडिस्पोर्टेशन
VGAMआर के पैकेज में उपलब्ध हैं। लेखक हालांकि एक टिल्ड पॉइसन वितरण की सिफारिश करते हैं , लेकिन मैं इसे पैकेज में नहीं पा सकता हूं ।
क्या कोई अंडरड्रेसड डेटा के लिए एक प्रक्रिया की सिफारिश कर सकता है और शायद इसके लिए कुछ उदाहरण आर कोड प्रदान करता है?