मैंने कई व्यावहारिक प्रश्नों में भाग लिया है जब मॉडलिंग प्रायोगिक अनुसंधान के डेटा को एक विषय-विषय के प्रयोग से गिनता है। मैं संक्षेप में प्रयोग, डेटा, और मैंने अब तक क्या किया है, मेरे सवालों का वर्णन करता हूं।
चार अलग-अलग फिल्मों को अनुक्रम में उत्तरदाताओं का एक नमूना दिखाया गया था। प्रत्येक फिल्म के बाद एक साक्षात्कार आयोजित किया गया था, जिसमें हमने कुछ बयानों की घटनाओं की संख्या को गिना था जो आरक्यू (अनुमानित गणना चर) के लिए रुचि रखते थे। हमने संभावित घटनाओं (कोडिंग इकाइयों; ऑफसेट चर) की अधिकतम संख्या भी दर्ज की। इसके अलावा, फिल्मों की कई विशेषताओं को एक निरंतर पैमाने पर मापा गया था, जिनमें से एक के लिए हमारे पास बयानों की गिनती पर फिल्म सुविधा के प्रभाव का एक कारण परिकल्पना है जबकि अन्य नियंत्रण (भविष्यवक्ता) हैं।
अब तक अपनाई गई मॉडलिंग रणनीति इस प्रकार है:
एक यादृच्छिक प्रभाव Poisson मॉडल का अनुमान लगाएं, जहां कारण चर का उपयोग कोवरिएट के रूप में किया जाता है और अन्य चर को नियंत्रण के रूप में उपयोग किया जाता है। इस मॉडल में 'लॉग (इकाइयों)' (कोडिंग इकाइयों) के बराबर एक ऑफसेट है। यादृच्छिक प्रभावों को विषयों में लिया जाता है (फिल्म-विशिष्ट गणना विषयों में निहित हैं)। हम कारण की परिकल्पना की पुष्टि करते हैं (जैसे कारण चर का गुणांक)। आकलन में हमने आर में lme4 पैकेज का उपयोग किया, विशेष रूप से फ़ंक्शन ग्लैमर में।
अब मेरे पास निम्नलिखित प्रश्न हैं। पॉइसन रिग्रेशन में एक आम समस्या ओवरडाइप्रोसेशन है। मुझे पता है कि यह एक नकारात्मक द्विपद प्रतिगमन का उपयोग करके परीक्षण किया जा सकता है और मूल्यांकन कर सकता है कि क्या इसका फैलाव पैरामीटर एक साधारण पॉइसन मॉडल के मॉडल फिट में सुधार करता है। हालांकि, मुझे नहीं पता कि यादृच्छिक प्रभाव के संदर्भ में ऐसा कैसे किया जाए।
- मुझे अपनी स्थिति में अतिविशिष्टता के लिए कैसे परीक्षण करना चाहिए? मैंने एक साधारण पॉइसन / निगेटिव बायोमियल रिग्रेशन (बिना रैंडम इफ़ेक्ट के) में ओवरडिप्रेशन का परीक्षण किया कि मुझे पता है कि मुझे कैसे फिट होना है। परीक्षण में अतिविशिष्टता की उपस्थिति का सुझाव दिया गया है। हालाँकि जब से ये मॉडल इस बात पर ध्यान नहीं देते हैं कि मुझे लगता है कि यह परीक्षा गलत है। इसके अलावा, मैं अतिप्रवाह के परीक्षणों के लिए ऑफसेट की भूमिका के बारे में निश्चित नहीं हूं।
- क्या एक नकारात्मक द्विपद यादृच्छिक प्रभाव प्रतिगमन मॉडल जैसा कुछ है और मुझे इसे आर में कैसे फिट करना चाहिए?
- क्या आपके पास वैकल्पिक मॉडल के लिए सुझाव हैं जो मुझे डेटा पर प्रयास करने चाहिए, अर्थात दोहराए गए माप संरचना, गिनती चर और जोखिम (कोडिंग इकाइयों) को ध्यान में रखना चाहिए?