अतिरिक्त नेस्टिंग संरचना के साथ डेटा को दोहराया उपायों के लिए आर में रैखिक मिश्रित मॉडल निर्दिष्ट करने के बारे में प्रश्न


10

डेटा संरचना

> str(data)
 'data.frame':   6138 obs. of  10 variables:
 $ RT     : int  484 391 422 516 563 531 406 500 516 578 ...
 $ ASCORE : num  5.1 4 3.8 2.6 2.7 6.5 4.9 2.9 2.6 7.2 ...
 $ HSCORE : num  6 2.1 7.9 1 6.9 8.9 8.2 3.6 1.7 8.6 ...
 $ MVMNT  : Factor w/ 2 levels "_Withd","Appr": 2 2 1 1 2 1 2 1 1 2 ...
 $ STIM   : Factor w/ 123 levels " arti"," cele",..: 16 23 82 42 105 4 93 9 34 25 ...
 $ DRUG   : Factor w/ 2 levels "Inactive","Pharm": 1 1 1 1 1 1 1 1 1 1 ...
 $ FULLNSS: Factor w/ 2 levels "Fasted","Fed": 2 2 2 2 2 2 2 2 2 2 ...
 $ PATIENT: Factor w/ 25 levels "Subj01","Subj02",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ SESSION: Factor w/ 4 levels "Sess1","Sess2",..: 1 1 1 1 1 1 1 1 1 1 ...
 $ TRIAL  : Factor w/ 6138 levels "T0001","T0002",..: 1 2 3 4 5 6 7 8 9 10 ...

पूर्ण मॉडल उम्मीदवार

model.loaded.fit <- lmer(RT ~ ASCORE*HSCORE*MVMNT*DRUG*FULLNSS
                              + (1|PATIENT) + (1|SESSION), data, REML = TRUE)
  • परीक्षणों से प्रतिक्रिया के समय को सत्रों के भीतर क्लस्टर किया जाता है, जो बदले में रोगियों के भीतर क्लस्टर किया जाता है
  • प्रत्येक परीक्षण को ASCORE और HSCORE (1-9 के बीच) के दो निरंतर कोवरिएट्स और एक आंदोलन प्रतिक्रिया (वापसी या दृष्टिकोण) द्वारा विशेषता हो सकती है।
  • सत्र की विशेषता ड्रग सेवन (प्लेसबो या सक्रिय फार्माकोन) और पूर्णता (उपवास या पूर्व-भोजन) से होती है।

मॉडलिंग और आर सिंटैक्स?

मैं एक लोड माध्य संरचना के साथ एक उपयुक्त पूर्ण मॉडल को निर्दिष्ट करने की कोशिश कर रहा हूं जिसका उपयोग टॉप-डाउन मॉडल चयन रणनीति में शुरुआती बिंदु के रूप में किया जा सकता है।

विशिष्ट मुद्दे:

  • वाक्यविन्यास सही ढंग से क्लस्टरिंग और यादृच्छिक प्रभावों को निर्दिष्ट कर रहा है?
  • वाक्य रचना से परे, क्या यह मॉडल उपर्युक्त विषय डिजाइन के लिए उपयुक्त है?
  • क्या पूरे मॉडल में निश्चित प्रभावों के सभी इंटरैक्शन या केवल उन लोगों को निर्दिष्ट करना चाहिए जिनकी मैं वास्तव में रुचि रखता हूं?
  • मैंने मॉडल में एसटीआईएम कारक को शामिल नहीं किया है, जो एक परीक्षण में उपयोग किए जाने वाले विशिष्ट उत्तेजना प्रकार की विशेषता है, लेकिन जिसे मैं किसी भी तरह से अनुमान लगाने के लिए इच्छुक नहीं हूं - क्या मुझे यह निर्दिष्ट करना चाहिए कि दिए गए यादृच्छिक कारक के रूप में इसका 123 स्तर है और बहुत कम प्रति प्रोत्साहन प्रकार के डेटा बिंदु?

अगर मैं यहाँ सलाह नहीं पा रहा हूँ तो मुझे नहीं पता कि मैं किससे पूछ सकता हूँ? शायद आप किसी भी समर्पित मिश्रित मॉडल मंचों या यहां तक ​​कि थोड़े से पैसे के लिए परामर्श करने के लिए तैयार विशेषज्ञ के बारे में जानते हों?
Cel

3
हाय @Cel, ऐसा लगता है कि आपको 5-वे, 4-वे और 3-वे इंटरैक्शन सहित मॉडल में सभी इंटरैक्शन मिले हैं । मुझे इस मामले पर यकीन नहीं है, लेकिन यह आम तौर पर डेटा को बेतहाशा खत्म कर देगा, जिससे आपके परिणाम कम सामान्य हो जाएंगे। पिछड़े चयन (यदि आपको इसका उपयोग करना चाहिए) को पूरी तरह से संतृप्त मॉडल के साथ शुरू करने की आवश्यकता नहीं है - यह आपको सबसे बड़े मॉडल के साथ शुरू करना चाहिए जो आपको प्रशंसनीय लगता है। क्या आप इसे कम कर सकते हैं?
मैक्रो

@ मैक्रो को यह जानकर बहुत अच्छा लगा, मैं इसमें केवल उन इंटरैक्शन को शामिल करूंगा जो तब प्रशंसनीय लगते हैं। क्या आपके पास अन्य मुद्दों के बारे में सुझाव हैं? यदि आप करते हैं, तो शायद इसे एक उत्तर के रूप में डाल दें ताकि मैं इसे स्वीकार कर सकूं।
Cel

जवाबों:


16

मैं आपके प्रत्येक प्रश्न का उत्तर दूंगा।

वाक्यविन्यास सही ढंग से क्लस्टरिंग और यादृच्छिक प्रभावों को निर्दिष्ट कर रहा है?

आपके द्वारा यहां फिट किया गया मॉडल गणितीय शब्दों में, मॉडल है

Yijk=Xijkβ+ηi+θij+εijk

कहाँ पे

  • Yijk व्यक्ति पर सत्र दौरान अवलोकन लिए प्रतिक्रिया समय है ।kji

  • Xijk व्यक्तिगत पर सत्र दौरान अवलोकन लिए भविष्यवक्ता वेक्टर है (आपके द्वारा लिखे गए मॉडल में, यह सभी मुख्य प्रभावों और सभी इंटरैक्शन से मिलकर बना है)।kji

  • ηi व्यक्ति यादृच्छिक प्रभाव है जो एक ही व्यक्ति पर किए गए टिप्पणियों के बीच संबंध को प्रेरित करता है। व्यक्ति के लिए यादृच्छिक प्रभाव है के सत्र और बचे हुए त्रुटि शब्द है।iθijijεijk

  • β प्रतिगमन गुणांक वेक्टर है।

जैसा कि पृष्ठ 14-15 में उल्लेख किया गया है कि यह मॉडल यह निर्दिष्ट करने के लिए सही है कि सत्र व्यक्तियों के भीतर निहित हैं, जो आपके विवरण से होता है।

वाक्य रचना से परे, क्या यह मॉडल उपर्युक्त विषय डिजाइन के लिए उपयुक्त है?

मुझे लगता है कि यह मॉडल उचित है, क्योंकि यह डेटा में नेस्टिंग संरचना का सम्मान करता है और मुझे लगता है कि व्यक्तिगत और सत्र को यथोचित रूप से यादृच्छिक प्रभाव के रूप में माना जाता है, जैसा कि यह मॉडल दावा करता है। आपको यह सुनिश्चित करने के लिए कि भविष्यवाणियों और बिखराव के साथ प्रतिक्रिया के बीच संबंधों को देखना चाहिए, आदि ताकि यह सुनिश्चित हो सके कि रैखिक भविष्यवक्ता ( ) सही ढंग से निर्दिष्ट है। अन्य मानक प्रतिगमन डायग्नोस्टिक्स की जांच संभवतः की जानी चाहिए।Xijkβ

क्या पूरे मॉडल में निश्चित प्रभावों के सभी इंटरैक्शन या केवल उन लोगों को निर्दिष्ट करना चाहिए जिनकी मैं वास्तव में रुचि रखता हूं?

मुझे लगता है कि इस तरह के भारी संतृप्त मॉडल के साथ शुरू करना एक महान विचार नहीं हो सकता है, जब तक कि यह समझ में नहीं आता है। जैसा कि मैंने एक टिप्पणी में कहा है, यह आपके विशेष डेटा सेट को ओवरफिट करेगा और आपके परिणामों को कम सामान्य बना सकता है। मॉडल के चयन के बारे में, यदि आप पूरी तरह से संतृप्त मॉडल से शुरुआत करते हैं और बैकवर्ड चयन करते हैं ( जो इस साइट पर कुछ लोग, अच्छे कारण, आपत्ति के साथ ) तो आपको मॉडल में पदानुक्रम का सम्मान करना सुनिश्चित करना होगा । यही है, यदि आप मॉडल से निचले स्तर की बातचीत को समाप्त करते हैं, तो आपको उस चर को शामिल करने वाले सभी उच्च स्तरीय इंटरैक्शन को भी हटा देना चाहिए। उस पर अधिक चर्चा के लिए, जुड़ा हुआ धागा देखें।

मैंने मॉडल में एसटीआईएम कारक को शामिल नहीं किया है, जो एक परीक्षण में उपयोग किए जाने वाले विशिष्ट उत्तेजना प्रकार की विशेषता है, लेकिन जिसे मैं किसी भी तरह से अनुमान लगाने के लिए इच्छुक नहीं हूं - क्या मुझे यह निर्दिष्ट करना चाहिए कि दिए गए यादृच्छिक कारक के रूप में इसका 123 स्तर है और बहुत कम प्रति प्रोत्साहन प्रकार के डेटा बिंदु?

निश्चित रूप से आवेदन के बारे में कुछ भी नहीं पता है (इसलिए इसे नमक के एक दाने के साथ लें), जो एक निश्चित प्रभाव की तरह लगता है, यादृच्छिक प्रभाव नहीं। यही है, उपचार प्रकार एक चर की तरह लगता है जो माध्य प्रतिक्रिया में एक निश्चित बदलाव के अनुरूप होगा, न कि कुछ ऐसा जो उन विषयों के बीच सहसंबंध को प्रेरित करेगा जिनके पास समान उत्तेजना प्रकार था। लेकिन, यह तथ्य कि यह 123 स्तर का कारक है, यह मॉडल में प्रवेश करने के लिए बोझिल बनाता है। मुझे लगता है कि मैं यह जानना चाहता हूं कि इससे आपको कितना प्रभाव पड़ेगा। प्रभाव के आकार के बावजूद, यह आपके ढलान के अनुमानों में पूर्वाग्रह उत्पन्न नहीं करेगा क्योंकि यह एक रेखीय मॉडल है, लेकिन इसे छोड़ना आपके मानक त्रुटियों को बड़ा कर सकता है, क्योंकि वे अन्यथा नहीं होंगे।


2
वाह। धन्यवाद मैक्रों, मेरी इच्छा है कि मैं और अधिक अंक दे सकूं।
Cel

चूंकि यादृच्छिक प्रभावों को यादृच्छिक के बजाय पार किया जाता है, इसलिए नोटेशन को और (बजाय ) होना चाहिए, क्योंकि मरीज को पार किया गया है (और नहीं नेस्टेड)? ηiθjθj
यहोशू रोसेनबर्ग
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.