गणना डेटा के साथ किस मॉडल का उपयोग करना है, यह तय करने के लिए उपयुक्त रणनीति क्या है? मेरे पास गणना डेटा है कि मुझे एक बहुस्तरीय मॉडल के रूप में मॉडल करने की आवश्यकता है और यह मेरे लिए (इस साइट पर) सिफारिश की गई थी कि ऐसा करने का सबसे अच्छा तरीका बग या एमसीएमसीजीएमएम है। हालाँकि मैं अभी भी बायेसियन आँकड़ों के बारे में जानने की कोशिश कर रहा हूँ, और मुझे लगा कि मुझे पहले अपने डेटा को सामान्यीकृत रैखिक मॉडल के रूप में फिट करने की कोशिश करनी चाहिए और डेटा की नेस्टेड संरचना को नज़रअंदाज़ करना चाहिए (बस इसलिए मुझे उम्मीद है कि एक अस्पष्ट विचार मिल सकता है)।
लगभग 70% डेटा 0 हैं और माध्य के लिए विचरण का अनुपात 33 है। इसलिए डेटा काफी अधिक फैला हुआ है।
कई अलग-अलग विकल्पों (पॉइसन, नकारात्मक द्विपद, अर्ध और शून्य फुलाया हुआ मॉडल सहित) की कोशिश करने के बाद, मुझे परिणामों में बहुत कम स्थिरता दिखाई देती है (सब कुछ अलग-अलग होना महत्वपूर्ण है)।
मैं किस प्रकार के मॉडल के बारे में एक सूचित निर्णय लेने के बारे में जा सकता हूं कि 0 मुद्रास्फीति और अधिक फैलाव के आधार पर किस प्रकार का मॉडल चुनना है? उदाहरण के लिए, मैं यह कैसे पता लगा सकता हूं कि अर्ध-शिरासन नकारात्मक द्विपद (या विसे वर्सा) की तुलना में अधिक उपयुक्त है और मुझे कैसे पता चलेगा कि अतिरिक्त शून्य के साथ या तो पर्याप्त रूप से (या नहीं) का उपयोग किया है? इसी तरह, मैं कैसे मूल्यांकन करता हूं कि यदि शून्य-फुलाया गया मॉडल का उपयोग किया जाता है तो अधिक फैलाव नहीं होता है? या मुझे एक शून्य फुलाए हुए पॉइसन और एक शून्य फुलाए हुए नकारात्मक द्विपद के बीच कैसे तय करना चाहिए?