संपादित 2: मैंने मूल रूप से सोचा था कि मुझे एक कारक पर दोहराए गए उपायों के साथ दो-कारक एनोवा को चलाने की आवश्यकता है, लेकिन मुझे लगता है कि एक रैखिक मिश्रित-प्रभाव मॉडल मेरे डेटा के लिए बेहतर काम करेगा। मुझे लगता है कि मुझे लगभग पता है कि क्या होने की जरूरत है, लेकिन अभी भी कुछ बिंदुओं से भ्रमित हूं।
जिन प्रयोगों का मुझे विश्लेषण करना है, वे इस प्रकार हैं:
- कई उपचार समूहों में से एक को विषय सौंपे गए
- प्रत्येक विषय के माप कई दिनों पर लिए गए थे
- इसलिए:
- उपचार के भीतर विषय निहित है
- उपचार दिन के साथ पार किया जाता है
(प्रत्येक विषय को केवल एक उपचार के लिए सौंपा गया है, और प्रत्येक दिन प्रत्येक विषय पर माप लिया जाता है)
मेरे डेटासेट में निम्नलिखित जानकारी है:
- विषय = अवरुद्ध कारक (यादृच्छिक कारक)
- दिन = विषय या दोहराया उपायों के भीतर कारक (निश्चित कारक)
- उपचार = विषय कारक (निश्चित कारक) के बीच
- अवलोकन = मापा (निर्भर) चर
अद्यतन ठीक है, इसलिए मैंने जाकर एक सांख्यिकीविद् से बात की, लेकिन वह एसएएस उपयोगकर्ता है। वह सोचता है कि मॉडल होना चाहिए:
उपचार + दिन + विषय (उपचार) + दिन * विषय (उपचार)
स्पष्ट रूप से उनका अंकन आर सिंटैक्स से अलग है, लेकिन इस मॉडल के लिए हिसाब करना चाहिए:
- उपचार (निश्चित)
- दिन (निश्चित)
- उपचार * दिन बातचीत
- उपचार के भीतर निहित विषय (यादृच्छिक)
- दिन "उपचार के भीतर विषय" के साथ पार किया (यादृच्छिक)
तो, यह सही वाक्यविन्यास उपयोग करने के लिए है?
m4 <- lmer(Obs~Treatment*Day + (1+Treatment/Subject) + (1+Day*Treatment/Subject), mydata)
मैं इस बात को लेकर विशेष रूप से चिंतित हूं कि क्या दिन "उपचार के भीतर विषय" के साथ पार हुआ है या नहीं। क्या कोई एसएएस से परिचित है, या आश्वस्त है कि वे समझते हैं कि उसके मॉडल में क्या चल रहा है, इस पर टिप्पणी करने में सक्षम है कि क्या आर सिंटैक्स मैचों में मेरा दुखद प्रयास?
यहां मॉडल बनाने और लेखन सिंटैक्स पर मेरे पिछले प्रयास हैं (उत्तर और टिप्पणियों में चर्चा की गई):
m1 <- lmer(Obs ~ Treatment * Day + (1 | Subject), mydata)
मैं इस तथ्य से कैसे निपटता हूं कि उपचार के भीतर विषय निहित है? कैसे m1
अलग है:
m2 <- lmer(Obs ~ Treatment * Day + (Treatment|Subject), mydata)
m3 <- lmer(Obs ~ Treatment * Day + (Treatment:Subject), mydata)
और कर रहे हैं m2
और m3
बराबर (और यदि नहीं, तो क्यों)?
इसके अलावा, अगर मुझे सहसंबंध संरचना (जैसे correlation = corAR1
) निर्दिष्ट करना चाहते हैं तो क्या मुझे lme4 के बजाय nlme का उपयोग करने की आवश्यकता है ? दोहराया उपायों के अनुसार , एक कारक पर दोहराया उपायों के साथ दोहराया उपायों के विश्लेषण के लिए, सहसंयोजक संरचना (एक ही विषय के माप के बीच सहसंबंधों की प्रकृति) महत्वपूर्ण है।
जब मैं बार-बार एनोवा को करने की कोशिश कर रहा था, तो मैंने टाइप II एसएस का उपयोग करने का फैसला किया; क्या यह अभी भी प्रासंगिक है, और यदि हां, तो मैं इसे कैसे निर्दिष्ट करूं?
यहाँ एक उदाहरण है कि डेटा कैसा दिखता है:
mydata <- data.frame(
Subject = c(13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 29, 30, 31, 32, 33,
34, 35, 36, 37, 38, 39, 40, 62, 63, 64, 65, 13, 14, 15, 16, 17, 18,
19, 20, 21, 22, 23, 24, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39,
40, 62, 63, 64, 65, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24,
29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 62, 63, 64, 65),
Day = c(rep(c("Day1", "Day3", "Day6"), each=28)),
Treatment = c(rep(c("B", "A", "C", "B", "C", "A", "A", "B", "A", "C", "B", "C",
"A", "A", "B", "A", "C", "B", "C", "A", "A"), each = 4)),
Obs = c(6.472687, 7.017110, 6.200715, 6.613928, 6.829968, 7.387583, 7.367293,
8.018853, 7.527408, 6.746739, 7.296910, 6.983360, 6.816621, 6.571689,
5.911261, 6.954988, 7.624122, 7.669865, 7.676225, 7.263593, 7.704737,
7.328716, 7.295610, 5.964180, 6.880814, 6.926342, 6.926342, 7.562293,
6.677607, 7.023526, 6.441864, 7.020875, 7.478931, 7.495336, 7.427709,
7.633020, 7.382091, 7.359731, 7.285889, 7.496863, 6.632403, 6.171196,
6.306012, 7.253833, 7.594852, 6.915225, 7.220147, 7.298227, 7.573612,
7.366550, 7.560513, 7.289078, 7.287802, 7.155336, 7.394452, 7.465383,
6.976048, 7.222966, 6.584153, 7.013223, 7.569905, 7.459185, 7.504068,
7.801867, 7.598728, 7.475841, 7.511873, 7.518384, 6.618589, 5.854754,
6.125749, 6.962720, 7.540600, 7.379861, 7.344189, 7.362815, 7.805802,
7.764172, 7.789844, 7.616437, NA, NA, NA, NA))