यादृच्छिक प्रभाव सहसंबंध के साथ क्या करना है जो 1 या -1 के बराबर है?


9

जटिल अधिकतम मिश्रित मॉडल (दिए गए डेटा और मॉडल के लिए सभी संभव यादृच्छिक प्रभावों का आकलन) के साथ व्यवहार करते समय इतनी असामान्य घटना नहीं होती है जो कुछ यादृच्छिक प्रभावों के बीच एकदम सही (+1 या -1) या लगभग सही सहसंबंध है। चर्चा के उद्देश्य के लिए, आइए निम्नलिखित मॉडल और मॉडल सारांश देखें

Model: Y ~ X*Cond + (X*Cond|subj)

# Y = logit variable  
# X = continuous variable  
# Condition = values A and B, dummy coded; the design is repeated 
#             so all participants go through both Conditions  
# subject = random effects for different subjects  

Random effects:
 Groups  Name             Variance Std.Dev. Corr             
 subject (Intercept)      0.85052  0.9222                    
         X                0.08427  0.2903   -1.00            
         CondB            0.54367  0.7373   -0.37  0.37      
         X:CondB          0.14812  0.3849    0.26 -0.26 -0.56
Number of obs: 39401, groups:  subject, 219

Fixed effects:
                 Estimate Std. Error z value Pr(>|z|)    
(Intercept)       2.49686    0.06909   36.14  < 2e-16 ***
X                -1.03854    0.03812  -27.24  < 2e-16 ***
CondB            -0.19707    0.06382   -3.09  0.00202 ** 
X:CondB           0.22809    0.05356    4.26 2.06e-05 ***

इन पूर्ण सहसंबंधों के पीछे का कारण यह है कि हमने एक मॉडल बनाया है जो हमारे पास मौजूद डेटा के लिए बहुत जटिल है। इन स्थितियों में जो सामान्य सलाह दी जाती है, वह है (जैसे, Matuschek et al।, 2017; पेपर ), overparameterized गुणांक को 0 पर ठीक करने के लिए, क्योंकि ऐसे पतित मॉडल की शक्ति कम होती है। यदि हम एक कम मॉडल में निश्चित प्रभावों में एक उल्लेखनीय परिवर्तन का निरीक्षण करते हैं, तो हमें उस एक को स्वीकार करना चाहिए; यदि कोई परिवर्तन नहीं है, तो मूल को स्वीकार करने में कोई समस्या नहीं है।

हालाँकि, मान लें कि हम केवल आरई (यादृच्छिक प्रभाव) के लिए नियंत्रित निश्चित प्रभावों में ही दिलचस्पी नहीं रखते हैं, बल्कि आरई संरचना में भी। दिए गए मामले में, यह मानने के लिए सैद्धांतिक रूप से ध्वनि होगी कि Interceptऔर ढलान Xमें गैर-शून्य नकारात्मक सहसंबंध है। कई प्रश्न निम्नलिखित हैं:

  1. ऐसी स्थितियों में क्या करना है? क्या हमें सही सहसंबंध की रिपोर्ट करनी चाहिए और कहना चाहिए कि "वास्तविक" सहसंबंध का अनुमान लगाने के लिए हमारा डेटा "पर्याप्त अच्छा" नहीं है? या हमें 0 सहसंबंध मॉडल की रिपोर्ट करनी चाहिए? या क्या हमें शायद 0 से कुछ अन्य सहसंबंधों को स्थापित करने की कोशिश करनी चाहिए ताकि "महत्वपूर्ण" एक और सही नहीं होगा? मुझे नहीं लगता कि यहां कोई 100% सही उत्तर हैं, मैं ज्यादातर आपकी राय सुनना चाहूंगा।

  2. अन्य मापदंडों के बीच सहसंबंधों को प्रभावित किए बिना कोड को 0 से 2 विशिष्ट यादृच्छिक प्रभावों के सहसंबंध को कैसे ठीक किया जाए?


पैकेज nlme आपको यादृच्छिक प्रभावों के विचरण-सहसंयोजक मैट्रिक्स के बारे में ठीक नियंत्रण देता है। मुझे वास्तव में कभी भी इसकी आवश्यकता नहीं थी, लेकिन अगर मैंने किया तो मैं एस और एस-प्लस (पिनहेरो और बेट्स, 2000) में मिश्रित-प्रभाव वाले मॉडल को फिर से तैयार करूंगा ।
रोलैंड

3
एक कट्टरपंथी विकल्प, मॉडल को नियमित करने है यानी यादृच्छिक प्रभाव ढांचे पर कुछ हद तक जानकारीपूर्ण महंतों (जैसे के माध्यम से के साथ एक बायेसियन मॉडल फिट blme, MCMCglmm, rstanarm, brms...)
बेन Bolker

@ बेनबॉलर बेन। मुझे यकीन नहीं है कि यह एक कट्टरपंथी विचार है, क्योंकि एक अनियमित मॉडल को फिट करना एक मॉडल को फिट करने के लिए अधिक कट्टरपंथी तरीका हो सकता है।)
D_Williams

महान जवाब के लिए आप सभी को धन्यवाद ... दुर्भाग्य से, मैं कुछ दिनों के लिए ऑफ़लाइन था, लेकिन मैं वापस आ गया हूं।
उपयोगकर्ता 33268

जवाबों:


13

विलक्षण यादृच्छिक-प्रभाव सहसंयोजक matrices

+1 या -1 के यादृच्छिक प्रभाव सहसंबंध अनुमान को प्राप्त करने का मतलब है कि अनुकूलन एल्गोरिथ्म "एक सीमा" को हिट करता है: सहसंबंध +1 से अधिक या -1 से कम नहीं हो सकता है। यहां तक ​​कि अगर कोई स्पष्ट अभिसरण त्रुटियां या चेतावनी नहीं हैं, तो यह संभावित रूप से अभिसरण के साथ कुछ समस्याओं को इंगित करता है क्योंकि हम सीमा पर झूठे सहसंबंधों की अपेक्षा नहीं करते हैं। जैसा कि आपने कहा, इसका आम तौर पर मतलब है कि सभी मापदंडों का मज़बूती से अनुमान लगाने के लिए पर्याप्त डेटा नहीं हैं। Matuschek एट अल। 2017 कहता है कि इस स्थिति में शक्ति से समझौता किया जा सकता है।

सीमा से टकराने का एक और तरीका है 0 का एक विचरण अनुमान प्राप्त करना : डेटा में कुछ भिन्नता होने के बावजूद मुझे अपने मिश्रित मॉडल में यादृच्छिक प्रभाव का शून्य विचरण क्यों मिलता है?

दोनों स्थितियों को यादृच्छिक प्रभावों के पतित सहसंयोजक मैट्रिक्स को प्राप्त करने के रूप में देखा जा सकता है (आपके उदाहरण में आउटपुट सहसंयोजक मैट्रिक्स ); एक शून्य विचरण या एक पूर्ण सहसंबंध का मतलब है कि सहसंयोजक मैट्रिक्स पूर्ण रैंक नहीं है और [कम से कम] इसका एक प्रतिजन शून्य है। इस अवलोकन से तुरंत पता चलता है कि पतित कोवरियन मैट्रिक्स प्राप्त करने के लिए अन्य , अधिक जटिल तरीके हैं: किसी भी शून्य या पूर्ण सहसंबंध के बिना एक सहसंयोजक मैट्रिक्स हो सकता है, लेकिन फिर भी रैंक-कमी (विलक्षण)। बेट्स एट अल। 2015 पर्सिमोनियस मिक्स्ड मॉडल4×44×4(अप्रकाशित प्रिफरेंस) प्रिंसिपल कंपोनेंट एनालिसिस (पीसीए) का उपयोग करके यह जांचने की सलाह देते हैं कि प्राप्त सहसंयोजक मैट्रिक्स विलक्षण है या नहीं। यदि ऐसा है, तो वे इस स्थिति का उसी तरह से इलाज करने का सुझाव देते हैं, जैसा कि उपरोक्त विलक्षण स्थितियों।

इसलिए क्या करना है?

यदि किसी मॉडल के सभी मापदंडों का मज़बूती से अनुमान लगाने के लिए पर्याप्त डेटा नहीं है, तो हमें मॉडल को सरल बनाने पर विचार करना चाहिए। अपने उदाहरण के मॉडल को लेते हुए X*Cond + (X*Cond|subj), इसे सरल बनाने के विभिन्न संभावित तरीके हैं:

  1. यादृच्छिक प्रभावों में से एक को निकालें, आमतौर पर उच्चतम-क्रम सहसंबंध:

    X*Cond + (X+Cond|subj)
  2. सभी सहसंबंध मापदंडों से छुटकारा पाएं:

    X*Cond + (X*Cond||subj)

    अद्यतन: @ हेनरिक नोटों के रूप में, ||वाक्यविन्यास केवल सहसंबंधों को हटा देगा यदि इसके बाईं ओर के सभी चर संख्यात्मक हैं। यदि श्रेणीबद्ध चर (जैसे Cond) शामिल हैं, तो किसी को अपने सुविधाजनक afexपैकेज (या बोझिल मैनुअल वर्कआर्ड्स) का उपयोग करना चाहिए । अधिक विवरण के लिए उसका उत्तर देखें।

  3. शब्द को कई में तोड़कर कुछ सहसंबंध मापदंडों से छुटकारा पाएं, जैसे:

    X*Cond + (X+Cond|subj) + (0+X:Cond|subj)
  4. कुछ विशिष्ट तरीके से सहसंयोजक मैट्रिक्स को संकुचित करें, जैसे कि एक विशिष्ट सहसंबंध (जो कि सीमा से टकराता है) को शून्य पर सेट करके, जैसा कि आप सुझाव देते हैं। lme4इसे प्राप्त करने का कोई अंतर्निहित तरीका नहीं है । कुछ स्मार्ट हैकिंग के माध्यम से इसे कैसे प्राप्त किया जा सकता है, इसके प्रदर्शन के लिए @ बेनबॉलर के उत्तर पर देखें ।

आपने जो कहा उसके विपरीत, मुझे नहीं लगता कि माटुशेक एट अल। 2017 विशेष रूप से # 4 की सिफारिश करते हैं। Matuschek एट अल का सार। 2017 और बेट्स एट अल। 2015 ऐसा लगता है कि एक अधिकतम मॉडल के साथ एक ला बर्र एट अल शुरू होता है 2013 और फिर जटिलता कम हो जाती है जब तक कि कोवरियन मैट्रिक्स पूर्ण रैंक नहीं है। (इसके अलावा, वे अक्सर शक्ति को बढ़ाने के लिए जटिलता को और भी कम करने की सिफारिश करेंगे।) अपडेट: इसके विपरीत, बर्र एट अल। केवल जटिलता को कम करने की सलाह देते हैं यदि मॉडल नहीं जुटाता है; वे विलक्षण सहसंयोजक matrices को सहन करने के लिए तैयार हैं। @ हेनरिक का जवाब देखें।

यदि कोई बेट्स / माटुशेक के साथ सहमत है, तो मुझे लगता है कि "कम से कम नुकसान" करते समय काम करने वाले व्यक्ति को खोजने के लिए जटिलता को कम करने के विभिन्न तरीकों की कोशिश करना ठीक है। ऊपर मेरी सूची को देखते हुए, मूल सहसंयोजक मैट्रिक्स में 10 पैरामीटर हैं; # 1 में 6 पैरामीटर हैं, # 2 में 4 पैरामीटर हैं, # 3 में 7 पैरामीटर हैं। कौन सा मॉडल सही सहसंबंधों से छुटकारा पायेगा उन्हें फिटिंग के बिना कहना असंभव है।

लेकिन क्या होगा अगर आप इस पैरामीटर में रुचि रखते हैं?

उपर्युक्त चर्चा यादृच्छिक प्रभाव सहसंयोजक मैट्रिक्स को एक उपद्रव पैरामीटर के रूप में मानती है। आप एक दिलचस्प सवाल उठाते हैं कि क्या करें यदि आप विशेष रूप से एक सहसंबंध पैरामीटर में रुचि रखते हैं जिसे आपको एक सार्थक पूर्ण-रैंक समाधान प्राप्त करने के लिए "छोड़ना" पड़ता है।

ध्यान दें कि शून्य पर सहसंबंध पैरामीटर तय करना आवश्यक रूप से BLUPs ( ranef) का उत्पादन नहीं करेगा जो असंबंधित हैं; वास्तव में, वे भी इतना प्रभावित नहीं हो सकते हैं कि ( प्रदर्शन के लिए @ प्लासीडिया का जवाब देखें )। तो एक विकल्प यह होगा कि आप BLUP के सहसंबंधों को देखें और रिपोर्ट करें।

एक और, शायद कम आकर्षक, subjectएक निश्चित प्रभाव के रूप में उपचार का उपयोग करने का विकल्प होगा Y~X*cond*subj, प्रत्येक विषय के लिए अनुमान प्राप्त करें और उनके बीच सहसंबंध की गणना करें। यह Y~X*condप्रत्येक विषय के लिए अलग-अलग पंजीकरण चलाने के बराबर है और उनसे सहसंबंध अनुमान प्राप्त करते हैं।


बेन बोल्कर के मिश्रित मॉडल में एकल मॉडल पर अनुभाग भी देखें

यह बहुत सामान्य है कि मिश्रित मॉडल के लिए एकल फिट बैठता है। तकनीकी रूप से, एकवचन का अर्थ है कि चोलस्की कारक के विकर्ण तत्वों के अनुरूप कुछ (वैरिएन-कोविरेन्स चोल्स्की अपघटन) पैरामीटर बिल्कुल शून्य हैं, जो व्यवहार्य स्थान के किनारे है, या समकक्ष रूप से विचरण-सहसंयोजक मैट्रिक्स में कुछ शून्य है। eigenvalues ​​(यानी सकारात्मक निश्चित के बजाय सकारात्मक अर्धचालक), या (लगभग समकक्ष) कि कुछ प्रकार के शून्य के रूप में अनुमानित हैं या कुछ सहसंबंधों का अनुमान +/- 1 के रूप में लगाया गया है।θ


1
मेरा उदाहरण क्या दिखाता है कि (Machine||Worker) lmerअनुमानों के लिए एक से अधिक भिन्नता है (Machine|Worker)। इसलिए कारकों lmerके ||साथ जो किया जाता है, उसे 'केवल कारकों के बीच सहसंबंधों को हटाकर नहीं, बल्कि एक श्रेणीबद्ध कारक के स्तरों के बीच में वर्णित किया जा सकता है।' यह यादृच्छिक प्रभाव संरचना को कुछ अजीब तरीके से बदल देता है (यह विस्तार (Machine||Worker)करता है (1|Worker) + (0+Machine|Worker), इसलिए अतिरिक्त विचरण)। मेरा संपादन बदलने के लिए स्वतंत्र महसूस करें। मेरा मुख्य मुद्दा यह है कि इस कथन में संख्यात्मक और श्रेणीबद्ध कोवरिएट के बीच अंतर को स्पष्ट किया जाना चाहिए।
हेनरिक

1
नहीं, बाइनरी चर के साथ भी काम नहीं करता है, अपने लिए देखें machines2 <- subset(Machines, Machine %in% c("A", "B")); summary(lmer(score ~ Machine + (Machine || Worker), data=machines2)):। यह सामान्य रूप से इस विस्तार के कारण कारकों के साथ काम नहीं करता है और जिस तरह Rसे कारकों से संबंधित है model.matrix
हेनरिक

@amoeba: मुझे लगता है कि आपने ranefयादृच्छिक प्रभावों के बीच सहसंबंध का अध्ययन करने के लिए मूल्यों को चालू करने का सुझाव देकर एक दिलचस्प बिंदु बनाया । मैं इस विषय में बहुत गहरी नहीं हूं, लेकिन मुझे पता है कि आमतौर पर इसके निकाले गए मूल्यों के साथ काम करने की अनुशंसा नहीं की जाती है ranef, बल्कि अनुमानित सहसंबंधों और भिन्नताओं के साथ। उस पर आपकी क्या राय है? इसके अलावा, मुझे नहीं पता कि कोई समीक्षक को कैसे समझाएगा कि मॉडल में सहसंबंध को स्थगित नहीं किया गया था, लेकिन हम अभी भी निकाले गए मूल्यों के सहसंबंध की गणना करते हैं। इसका कोई मतलब नहीं है
User33268

1
@RockyRaccoon हां, मुझे लगता है कि अनुमानित सहसंबंध पैरामीटर का उपयोग करना / रिपोर्ट करना बेहतर है लेकिन यहां हम उस स्थिति के बारे में बात कर रहे हैं जब हम यकीनन इसका अनुमान नहीं लगा सकते क्योंकि यह 1 में परिवर्तित होता है। यही वह है जो मैं एक पेपर में लिखूंगा: "पूर्ण रूपेण रूपांतरित गलियारे के साथ समाधान करने के लिए = [उद्धरण] में निम्न सलाह के बाद हमने एक कम मॉडल [विवरण] का उपयोग किया। इस मॉडल में यादृच्छिक प्रभाव BLUPs के बीच सहसंबंध 0.9 था। " फिर, जब आप सहसंबंध को शामिल नहीं कर रहे हैं, तो आप मॉडल को उन्हें असंबद्ध मानने के लिए विवश नहीं कर रहे हैं! आप स्पष्ट रूप से इस सहसंबंध को मॉडलिंग नहीं कर रहे हैं ।
अमीबा

मेरे पास एक और सवाल है: क्या करीबी-से-शून्य संस्करण और यादृच्छिक प्रभावों के सही और करीबी-से-संबंधित सहसंबंध मापदंडों के वास्तविक मूल्य के बारे में कुछ कहते हैं? उदाहरण के लिए, -1 सहसंबंधों का अर्थ है कि वास्तविक सहसंबंध कम से कम नकारात्मक है और / या यह कम से कम गैर-शून्य है? अधिक संक्षेप में, यदि हम उस सहसंबंध का अनुमान लगाने की कोशिश करते हैं जो वास्तव में 0 है, तो क्या यह संभव है कि हमें -1 अनुमान प्राप्त होगा?
User33268

9

मैं अमीबा के जवाब में कही गई हर बात से सहमत हूं जो इस मुद्दे पर मौजूदा चर्चा का एक बड़ा सारांश प्रदान करती है। मैं कुछ अतिरिक्त अंक जोड़ने की कोशिश करूंगा और अन्यथा अपने हाल के मिश्रित मॉडल पाठ्यक्रम के हैंडआउट को संदर्भित करूंगा जो इन बिंदुओं को संक्षेप में प्रस्तुत करता है।


सहसंबंधी मानकों (अमीबा के जवाब में विकल्प 2 और 3) को दबाकर ||केवल संख्यात्मक कोविरेट के लिए काम करता है lmerऔर कारकों के लिए नहीं। रीइनहोल्ड क्लिगल द्वारा कोड के साथ कुछ विस्तार से चर्चा की गई है ।

हालाँकि, मेरा afexपैकेज कारक के बीच सहसंबंध को दबाने के लिए कार्यक्षमता प्रदान करता है यदि expand_re = TRUEकॉल में तर्क mixed()(कार्य भी देखें lmer_alt())। यह अनिवार्य रूप से रेनहोल्ड क्लीगल द्वारा चर्चा किए गए दृष्टिकोण को लागू करने के द्वारा ऐसा करता है (यानी, संख्यात्मक सहसंयोजकों में कारकों को स्थानांतरित करना और उन पर यादृच्छिक-प्रभाव संरचना को निर्दिष्ट करना)।

एक सरल उदाहरण:

library("afex")
data("Machines", package = "MEMSS") # same data as in Kliegl code

# with correlation:
summary(lmer(score ~ Machine + (Machine  | Worker), data=Machines))
# Random effects:
#  Groups   Name        Variance Std.Dev. Corr       
#  Worker   (Intercept) 16.6405  4.0793              
#           MachineB    34.5467  5.8776    0.48      
#           MachineC    13.6150  3.6899   -0.37  0.30
#  Residual              0.9246  0.9616              
# Number of obs: 54, groups:  Worker, 6

## crazy results:
summary(lmer(score ~ Machine + (Machine  || Worker), data=Machines))
# Random effects:
#  Groups   Name        Variance Std.Dev. Corr     
#  Worker   (Intercept)  0.2576  0.5076            
#  Worker.1 MachineA    16.3829  4.0476            
#           MachineB    74.1381  8.6103   0.80     
#           MachineC    19.0099  4.3600   0.62 0.77
#  Residual              0.9246  0.9616            
# Number of obs: 54, groups:  Worker, 6

## as expected:
summary(lmer_alt(score ~ Machine + (Machine  || Worker), data=Machines))
# Random effects:
#  Groups   Name         Variance Std.Dev.
#  Worker   (Intercept)  16.600   4.0743  
#  Worker.1 re1.MachineB 34.684   5.8894  
#  Worker.2 re1.MachineC 13.301   3.6471  
#  Residual               0.926   0.9623  
# Number of obs: 54, groups:  Worker, 6

न जानने वालों के afexलिए, मिश्रित मॉडल के लिए मुख्य कार्यक्षमता निश्चित प्रभावों के लिए पी-मान प्रदान करना है, जैसे:

(m1 <- mixed(score ~ Machine + (Machine  || Worker), data=Machines, expand_re = TRUE))
# Mixed Model Anova Table (Type 3 tests, KR-method)
# 
# Model: score ~ Machine + (Machine || Worker)
# Data: Machines
#    Effect      df        F p.value
# 1 Machine 2, 5.98 20.96 **    .002
# ---
# Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘+’ 0.1 ‘ ’ 1

summary(m1)  
# [...]
# Random effects:
#  Groups   Name         Variance Std.Dev.
#  Worker   (Intercept)  27.4947  5.2435  
#  Worker.1 re1.Machine1  6.6794  2.5845  
#  Worker.2 re1.Machine2 13.8015  3.7150  
#  Residual               0.9265  0.9626  
# Number of obs: 54, groups:  Worker, 6
# [...]

डेल बर्र बर्र एट अल से। अमीबा के जवाब में प्रस्तुत किए गए यादृच्छिक-प्रभाव संरचना को कम करने की सिफारिश करने के लिए (2013) कागज अधिक सतर्क है। हाल ही में एक ट्विटर एक्सचेंज में उन्होंने लिखा:

  • "मॉडल को कम करने से एंटीकॉन्सेर्वेटिविटी के अज्ञात जोखिम का परिचय होता है, और सावधानी के साथ किया जाना चाहिए, अगर बिल्कुल भी।" तथा
  • "मेरी मुख्य चिंता यह है कि लोग मॉडल में कमी से जुड़े जोखिमों को समझते हैं और इस जोखिम को कम करने के लिए आमतौर पर अपनाए जाने वाले नियमों की तुलना में अधिक रूढ़िवादी दृष्टिकोण की आवश्यकता होती है (उदाहरण के लिए .05 पर परीक्षण किया गया प्रत्येक ढलान)।"

इसलिए सावधानी बरतने की सलाह दी जाती है।


समीक्षकों में से एक के रूप में मैं भी हम बेट्स एट अल क्यों पर कुछ अंतर्दृष्टि प्रदान कर सकते हैं (2015) का पेपर अप्रकाशित रहा। मुझे और अन्य दो समीक्षकों (जिस पर हस्ताक्षर किए गए, लेकिन यहां नाम नहीं रहेगा) ने पीसीए दृष्टिकोण के साथ कुछ आलोचना की थी (यह अप्रत्याशित है और ऐसा कोई सबूत नहीं है कि यह शक्ति के मामले में श्रेष्ठ है)। इसके अलावा, मेरा मानना ​​है कि सभी तीनों ने आलोचना की कि पेपर यादृच्छिक-प्रभाव संरचना को कैसे निर्दिष्ट किया जाए, इस मुद्दे पर ध्यान केंद्रित नहीं करता है, बल्कि जीआईएमएस को पेश करने की भी कोशिश करता है। इस प्रकार, बेट्स एट अल (2015) पेपर को मैटस्केक एट अल में जोड़ दिया गया (2017) कागज जो सिमुलेशन और Baayen एट अल के साथ यादृच्छिक-प्रभाव संरचना के मुद्दे को संबोधित करता है (2017) पेपर GAMMs की शुरुआत करता है।

बेट्स एट अल की मेरी पूरी समीक्षा। मसौदा यहां पाया जा सकता है । IIRC, अन्य समीक्षाओं में इसी तरह के मुख्य बिंदु थे।


ठीक। फिर मैं इसमें कुछ छोटे संपादन / अपडेट सम्मिलित कर सकता हूं जो आपके द्वारा बनाए जा रहे कुछ बिंदुओं को स्पष्ट करने के लिए होगा। बेट्स प्रीप्रिंट के संबंध में यह विभिन्न मामलों में बहुत अच्छी तरह से उप-रूपी हो सकता है। लेकिन मैं बेट्स एट अल से पूरी तरह सहमत हूं। उस विलक्षण कोवरियस मैट्रीस ठीक वैसी ही समस्या है जैसी कि + 1 / -1 के सहसंबंधों की होती है। गणितीय रूप से, कोई अंतर नहीं है। इसलिए यदि हम स्वीकार करते हैं कि पूर्ण सहसंबंध शक्ति से समझौता करते हैं, तो हमें विलक्षण कोव से बहुत सावधान रहना चाहिए। यहां तक ​​कि स्पष्ट सिमुलेशन के अभाव में यह दिखा रहा है। मैं असहमत हूं कि यह "अप्रतिष्ठित" है।
अमीबा

@amoeba lmer_altमूल रूप से ठीक उसी तरह lmer(या यहां तक ​​कि glmer) काम करता है एकमात्र अंतर के साथ जो इसे ||सिंटैक्स की अनुमति देता है । इसलिए मुझे यकीन नहीं है कि आप afexहर कीमत पर बचना चाहेंगे । यह भी बिना अटैचमेंट के काम करना चाहिए (यानी, afex::lmer_alt(...))।
हेनरिक

@amoeba यह क्या करता है मूल रूप से रीनहोल्ड क्लीगल (यानी, यादृच्छिक प्रभावों का विस्तार) द्वारा कोड में वर्णित दृष्टिकोण है। सूत्र के प्रत्येक यादृच्छिक प्रभावों के लिए यह एक मॉडल मैट्रिक्स बनाता है (यानी, कारकों को संख्यात्मक सहसंयोजकों में परिवर्तित करता है)। यह model.matrix तब cbindडेटा के लिए है। फिर सूत्र में यादृच्छिक-प्रभाव शब्द को एक नए के साथ बदल दिया जाता है जिसमें प्रत्येक नए बनाए गए कॉलम को एक + के साथ समाहित किया जाता है। लाइनें 690 से 730 में github.com/singmann/afex/blob/master/R/mixed.R पर देखें
हेनरिक

के बाईं ओर स्पष्ट चर के बारे में ||, यह वास्तव में एक महत्वपूर्ण बिंदु है, इसे ऊपर लाने और इसे मुझे समझाने के लिए धन्यवाद (मैंने इसे प्रतिबिंबित करने के लिए अपना उत्तर संपादित किया)। मुझे इसकी कार्यक्षमता पसंद lmer_altहै afex। मैं यहाँ पूर्णता के लिए उल्लेख करूँगा कि वेनिला lmerकॉल के साथ बिना किसी अतिरिक्त प्रीप्रोसेसिंग के समान आउटपुट प्राप्त कर सकते हैं (1+dummy(Machine,'B')+dummy(Machine,'C') || Worker)। यह स्पष्ट रूप से बहुत बोझिल हो जाता है जब श्रेणीगत चर के कई स्तर होते हैं।
अमीबा

2
@amoeba यह ध्यान रखना महत्वपूर्ण है कि dummy()डिफ़ॉल्ट का उपयोग केवल डिफ़ॉल्ट उपचार विरोधाभासों के साथ काम करता है, न कि जब यादृच्छिक-प्रभाव राशि-से-शून्य विरोधाभासों का उपयोग करता है (जो किसी को उस मामले में उपयोग करना चाहिए जिसमें मॉडल की सहभागिता है)। आप उदाहरण के लिए, यह देख सकते हैं कि यदि आप lmer_altकॉल के साथ कॉल के लिए ऊपर दिए गए उदाहरण में विचरण घटकों की तुलना करते mixedहैं।
हेनरिक

1

अधिकतम संभावना अनुमान का उपयोग करते समय मुझे भी यह समस्या हुई है - केवल मैं गोल्डस्टीन IGLS एल्गोरिथ्म का उपयोग करता हूं जैसा कि MLwiN सॉफ़्टवेयर के माध्यम से कार्यान्वित किया गया है और R में LME4 नहीं है। हालांकि प्रत्येक में और बहुत ही समस्या का समाधान हुआ है जब मैंने MCMC आकलन का उपयोग किया है। सॉफ्टवेयर। मैं भी 3 से अधिक में एक संबंध है जो हल जब मैं अनुमान बदल दिया है। IGLS का उपयोग करके, सहसंबंध की गणना पोस्ट अनुमान के रूप में की जाती है क्योंकि संबंधित संस्करण के उत्पाद के वर्गमूल के उत्पाद द्वारा विभाजित सहसंयोजक - और यह घटक के प्रत्येक अनुमान में अनिश्चितता को ध्यान में नहीं रखता है।

IGLS सॉफ़्टवेयर को यह पता नहीं है कि सहसंबंध एक सहसंबंध का अर्थ है और बस एक निरंतर, रैखिक, द्विघात आदि विचरण समारोह के अनुमानों की गणना करता है। इसके विपरीत MCMC दृष्टिकोण एक बहुभिन्नरूपी सामान्य वितरण से नमूनों की धारणा पर बनाया गया है जो अच्छी संपत्तियों और पूर्ण त्रुटि प्रचार के साथ भिन्नता और सहसंयोजी से मेल खाता है ताकि सहसंयोजकों के आकलन में अनिश्चितता को ध्यान में रखा जाए। और इसके विपरीत।

MLwin ने IGMC अनुमानों के साथ MCMC अनुमान श्रृंखला और गैर-नकारात्मक निश्चित भिन्नता कोवरियन मैट्रिक्स को नमूना शुरू करने से पहले शुरू में कोवरियन को शून्य में बदलकर बदलने की आवश्यकता हो सकती है।

एक काम के उदाहरण के लिए देखें

प्रासंगिकता, विविधता और एमएलवीएन 3, वॉल्यूम 1 (अद्यतन सितंबर 2017) का उपयोग करके परिवर्तन के विश्लेषण के लिए बहुस्तरीय मॉडल विकसित करना; वॉल्यूम 2 ​​भी RGate पर है

https://www.researchgate.net/publication/320197425_Vol1Training_manualRevisedSept2017

अध्याय 10 में परिशिष्ट

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.