ओवरसिपोर्टेशन और ऑफ़सेट के साथ पॉसन यादृच्छिक प्रभाव वाले मॉडल में मॉडलिंग विकल्प


12

मैंने कई व्यावहारिक प्रश्नों में भाग लिया है जब मॉडलिंग प्रायोगिक अनुसंधान के डेटा को एक विषय-विषय के प्रयोग से गिनता है। मैं संक्षेप में प्रयोग, डेटा, और मैंने अब तक क्या किया है, मेरे सवालों का वर्णन करता हूं।

चार अलग-अलग फिल्मों को अनुक्रम में उत्तरदाताओं का एक नमूना दिखाया गया था। प्रत्येक फिल्म के बाद एक साक्षात्कार आयोजित किया गया था, जिसमें हमने कुछ बयानों की घटनाओं की संख्या को गिना था जो आरक्यू (अनुमानित गणना चर) के लिए रुचि रखते थे। हमने संभावित घटनाओं (कोडिंग इकाइयों; ऑफसेट चर) की अधिकतम संख्या भी दर्ज की। इसके अलावा, फिल्मों की कई विशेषताओं को एक निरंतर पैमाने पर मापा गया था, जिनमें से एक के लिए हमारे पास बयानों की गिनती पर फिल्म सुविधा के प्रभाव का एक कारण परिकल्पना है जबकि अन्य नियंत्रण (भविष्यवक्ता) हैं।

अब तक अपनाई गई मॉडलिंग रणनीति इस प्रकार है:

एक यादृच्छिक प्रभाव Poisson मॉडल का अनुमान लगाएं, जहां कारण चर का उपयोग कोवरिएट के रूप में किया जाता है और अन्य चर को नियंत्रण के रूप में उपयोग किया जाता है। इस मॉडल में 'लॉग (इकाइयों)' (कोडिंग इकाइयों) के बराबर एक ऑफसेट है। यादृच्छिक प्रभावों को विषयों में लिया जाता है (फिल्म-विशिष्ट गणना विषयों में निहित हैं)। हम कारण की परिकल्पना की पुष्टि करते हैं (जैसे कारण चर का गुणांक)। आकलन में हमने आर में lme4 पैकेज का उपयोग किया, विशेष रूप से फ़ंक्शन ग्लैमर में।

अब मेरे पास निम्नलिखित प्रश्न हैं। पॉइसन रिग्रेशन में एक आम समस्या ओवरडाइप्रोसेशन है। मुझे पता है कि यह एक नकारात्मक द्विपद प्रतिगमन का उपयोग करके परीक्षण किया जा सकता है और मूल्यांकन कर सकता है कि क्या इसका फैलाव पैरामीटर एक साधारण पॉइसन मॉडल के मॉडल फिट में सुधार करता है। हालांकि, मुझे नहीं पता कि यादृच्छिक प्रभाव के संदर्भ में ऐसा कैसे किया जाए।

  • मुझे अपनी स्थिति में अतिविशिष्टता के लिए कैसे परीक्षण करना चाहिए? मैंने एक साधारण पॉइसन / निगेटिव बायोमियल रिग्रेशन (बिना रैंडम इफ़ेक्ट के) में ओवरडिप्रेशन का परीक्षण किया कि मुझे पता है कि मुझे कैसे फिट होना है। परीक्षण में अतिविशिष्टता की उपस्थिति का सुझाव दिया गया है। हालाँकि जब से ये मॉडल इस बात पर ध्यान नहीं देते हैं कि मुझे लगता है कि यह परीक्षा गलत है। इसके अलावा, मैं अतिप्रवाह के परीक्षणों के लिए ऑफसेट की भूमिका के बारे में निश्चित नहीं हूं।
  • क्या एक नकारात्मक द्विपद यादृच्छिक प्रभाव प्रतिगमन मॉडल जैसा कुछ है और मुझे इसे आर में कैसे फिट करना चाहिए?
  • क्या आपके पास वैकल्पिक मॉडल के लिए सुझाव हैं जो मुझे डेटा पर प्रयास करने चाहिए, अर्थात दोहराए गए माप संरचना, गिनती चर और जोखिम (कोडिंग इकाइयों) को ध्यान में रखना चाहिए?

1
शुरुआत के लिए, glmm.wikidot.com/faq में "अतिविशिष्टता" अनुभाग देखें
बेन बोल्कर

1
धन्यवाद, बहुत मददगार! हो सकता है कि कोई व्यक्ति इसका उत्तर और अन्य जानकारी संकलित करना चाहता हो।
टॉमका

जवाबों:


1

[0,)

अतिविशिष्टता की जांच करने के बजाय , जिसके पास उपयोगी उत्तर की गारंटी देने की कोई गारंटी नहीं है, और, हालांकि एक फैलाव की मात्रा को जांचने के लिए जांच कर सकता है , मैं एक उपयोगी गुणवत्ता खोज के असतत वितरण विकल्प का उपयोग करके सबसे अच्छा वितरण की खोज करने का सुझाव दूंगा। कार्यक्रम, उदाहरण के लिए, गणितज्ञ का FindDistribution दिनचर्या। उस प्रकार की खोज यह अनुमान लगाने में काफी हद तक आसान काम करती है कि ज्ञात वितरण (ओं) का क्या काम है (एस) न केवल ओवरडिप्रेशन को कम करने के लिए, बल्कि अन्य उपयोगी डेटा विशेषताओं के कई और अधिक उपयोगी मॉडल के लिए, उदाहरण के लिए, एक दर्जन के रूप में फिट होने की अच्छाई। विभिन्न तरीके।

आगे मेरी उम्मीदवार वितरण की जांच करने के लिए, मैं होता पोस्ट अस्थायी जांच बच homoscedasticity के लिए जाँच करने के लिए, और / या वितरण प्रकार, और भी विचार करें कि क्या उम्मीदवार वितरण डेटा की एक भौतिक व्याख्या करने के लिए इसी के रूप में रेखांकित किया जा सकता है। इस प्रक्रिया का खतरा एक वितरण की पहचान करना है जो एक विस्तारित डेटा सेट के सर्वश्रेष्ठ मॉडलिंग के साथ असंगत है। पोस्ट हॉक प्रक्रिया नहीं करने का खतरा एक प्राथमिकताओं को है जो उचित परीक्षण (कचरा-इन-कचरा बाहर) के बिना मनमाने ढंग से चुने गए वितरण को असाइन करना है। पद की श्रेष्ठतादृष्टिकोण यह है कि यह फिटिंग की त्रुटियों को सीमित करता है, और यही इसकी कमजोरी भी है, अर्थात, यह शुद्ध त्रुटियों के माध्यम से मॉडलिंग त्रुटियों को समझ सकता है क्योंकि कई वितरण फिट किए गए हैं। उसके बाद, अवशिष्टों की जांच करने और भौतिकता पर विचार करने का कारण है। शीर्ष नीचे या एक प्रायोरी दृष्टिकोण प्रदान करता है ऐसी कोई पद अस्थायी औचित्य पर जांच। यही है, विभिन्न वितरणों के साथ मॉडलिंग की भौतिकता की तुलना करने का एकमात्र तरीका है, उनकी तुलना पोस्ट करना। इस प्रकार, भौतिक सिद्धांत की प्रकृति उत्पन्न होती है, हम वैकल्पिक स्पष्टीकरण के रूप में उन्हें स्वीकार करने से पहले कई प्रयोगों के साथ डेटा की एक काल्पनिक व्याख्या का परीक्षण करते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.