मैं वर्तमान में व्यवहार प्रयोगों की एक श्रृंखला से डेटा का विश्लेषण कर रहा हूं जो सभी निम्नलिखित उपाय का उपयोग करते हैं। इस प्रयोग में भाग लेने वालों से ऐसे सुराग चुनने के लिए कहा जाता है जो (काल्पनिक) अन्य लोग 10 किलोग्राम की श्रृंखला को हल करने में मदद करने के लिए उपयोग कर सकते हैं। प्रतिभागियों को यह विश्वास दिलाने के लिए नेतृत्व किया जाता है कि ये अन्य लोग या तो पैसा हासिल करेंगे या खो देंगे, यह एंग्राम को सुलझाने में उनके प्रदर्शन पर निर्भर करता है। सुराग इस बात में भिन्न होते हैं कि वे कितने उपयोगी हैं। उदाहरण के लिए, एनएएनजीआर एनआईएनआरआरआईएन के लिए, रनिंग के एनाग्राम, तीन सुराग हो सकते हैं:
- तेज़ी से आगे बढ़ना
- मैराथन दौड़ में आप क्या करते हैं (सहायक)
- हमेशा एक स्वस्थ शौक (बेकार नहीं)
उपाय बनाने के लिए, मैं समय की संख्या (10 में से) की गणना करता हूं, एक प्रतिभागी दूसरे व्यक्ति के लिए एक अनपेक्षित सुराग चुनता है। प्रयोगों में, मैं उन विभिन्न सुरागों का उपयोग कर रहा हूं जो लोगों द्वारा चुने गए सुरागों की मदद को प्रभावित करते हैं।
चूँकि सहायक / अनहेल्दी माप काफी दृढ़ता से सकारात्मक रूप से तिरछा होता है (लोगों का एक बड़ा हिस्सा हमेशा 10 सबसे उपयोगी सुरागों का चयन करता है), और क्योंकि माप एक गिनती चर है, इसलिए मैं इन आंकड़ों का विश्लेषण करने के लिए एक पॉइसन सामान्यीकृत रैखिक मॉडल का उपयोग कर रहा हूं। हालाँकि, जब मैंने पोइसन रिग्रेशन पर कुछ और पठन किया, तो मुझे पता चला कि क्योंकि पॉइसन रिग्रेशन स्वतंत्र रूप से किसी वितरण के माध्य और विचरण का अनुमान नहीं लगाता है, यह अक्सर डेटा के एक सेट में विचरण को कम करके आंका जाता है। मैंने पॉइसन रिग्रेशन के विकल्पों की जांच शुरू कर दी, जैसे कि कैसिपोइसन रिग्रेशन या नकारात्मक द्विपद रिग्रेशन। हालांकि, मैं मानता हूं कि मैं इस प्रकार के मॉडल के लिए नया हूं, इसलिए मैं यहां सलाह के लिए आ रहा हूं।
क्या किसी के पास इस तरह के डेटा के लिए किस मॉडल का उपयोग करने की कोई सिफारिश है? क्या कोई अन्य विचार है कि मुझे इसके बारे में पता होना चाहिए (उदाहरण के लिए, क्या एक विशेष मॉडल दूसरे की तुलना में अधिक शक्तिशाली है?)। यदि मैं जिस मॉडल का चयन करता हूं, उसे यह निर्धारित करने के लिए कि मुझे अपने डेटा को उचित तरीके से संभालना है, तो मुझे किस प्रकार के निदान को देखना चाहिए?