प्रसंग
यह प्रश्न आर का उपयोग करता है, लेकिन सामान्य सांख्यिकीय मुद्दों के बारे में है।
मैं समय के साथ कीट जनसंख्या वृद्धि दर पर मृत्यु दर कारकों (बीमारी और परजीवीता के कारण% मृत्यु) के प्रभावों का विश्लेषण कर रहा हूं, जहां लार्वा आबादी 8 साल के लिए एक वर्ष में 12 साइटों से नमूना लिया गया था। जनसंख्या वृद्धि दर डेटा समय के साथ एक स्पष्ट लेकिन अनियमित चक्रीय प्रवृत्ति प्रदर्शित करता है।
एक साधारण सामान्यीकृत रैखिक मॉडल (विकास दर ~% रोग +% परजीवीवाद + वर्ष) के अवशेषों ने समय के साथ एक समान स्पष्ट लेकिन अनियमित चक्रीय प्रवृत्ति प्रदर्शित की। इसलिए, एक ही रूप के सामान्यीकृत कम से कम मॉडल भी अस्थायी सहसंबंध, उदाहरण के लिए समरूपता, ऑटोरेग्रेसिव प्रक्रिया क्रम 1 और ऑटोरेग्रेसिव मूविंग सहसंबंध संरचनाओं से निपटने के लिए उपयुक्त सहसंबंध संरचनाओं के साथ डेटा के लिए फिट थे।
सभी मॉडल में एक ही निश्चित प्रभाव होते हैं, AIC की तुलना में किया गया था, और REML द्वारा फिट किया गया था (AIC द्वारा विभिन्न सहसंबंध संरचनाओं की तुलना करने के लिए)। मैं आर पैकेज nlme और gls फ़ंक्शन का उपयोग कर रहा हूं।
प्रश्न 1
जीएलएस मॉडल के अवशेष अभी भी लगभग समान चक्रीय पैटर्न प्रदर्शित करते हैं जब समय के खिलाफ साजिश रची जाती है। क्या ऐसे पैटर्न हमेशा बने रहेंगे, यहां तक कि उन मॉडलों में भी, जो ऑटोक्रेलेशन संरचना के लिए सटीक रूप से खाते हैं?
मैंने अपने दूसरे प्रश्न के नीचे आर में कुछ सरलीकृत लेकिन समान डेटा का अनुकरण किया है, जो कि मॉडल अवशेषों में अस्थायी रूप से स्वतःसंबंधित पैटर्न का आकलन करने के लिए आवश्यक तरीकों की मेरी मौजूदा समझ के आधार पर मुद्दा दिखाता है , जो अब मुझे पता है कि गलत हैं (उत्तर देखें)।
प्रश्न 2
मैंने अपने डेटा के लिए सभी संभावित प्रशंसनीय सहसंबंध संरचनाओं के साथ जीएलएस मॉडल फिट किए हैं, लेकिन कोई भी वास्तव में जीएलएम की तुलना में किसी भी सहसंबंध संरचना के बिना पर्याप्त रूप से बेहतर फिटिंग नहीं है: बस एक जीएलएस मॉडल थोड़ा बेहतर है (एआईसी स्कोर = 1.8 कम), जबकि बाकी सभी हैं उच्च AIC मान। हालांकि, यह केवल ऐसा मामला है जब सभी मॉडल REML द्वारा फिट किए जाते हैं, एमएल नहीं जहां GLS मॉडल स्पष्ट रूप से बहुत बेहतर होते हैं, लेकिन मैं आँकड़े पुस्तकों से समझता हूं कि आपको विभिन्न सहसंबंध संरचनाओं के साथ मॉडल की तुलना करने के लिए केवल REML का उपयोग करना चाहिए और कारणों के लिए एक ही निश्चित प्रभाव मैं यहाँ विस्तार नहीं करूँगा।
डेटा के स्पष्ट रूप से अस्थायी रूप से स्वतःसंबंधित प्रकृति को देखते हुए, यदि कोई मॉडल साधारण GLM की तुलना में मामूली रूप से बेहतर नहीं है, तो यह निर्णय लेने के लिए कि किस मॉडल का उपयोग करने के लिए सबसे उपयुक्त तरीका है, यह मानते हुए कि मैं एक उपयुक्त विधि का उपयोग कर रहा हूं (मैं अंततः उपयोग करना चाहता हूं। विभिन्न चर संयोजनों की तुलना करने के लिए AIC)?
Q1 'सिमुलेशन' उचित सहसंबंध संरचनाओं के साथ और बिना मॉडल में अवशिष्ट पैटर्न की खोज करता है
'समय' के चक्रीय प्रभाव और 'x' के सकारात्मक रैखिक प्रभाव के साथ सिम्युलेटेड प्रतिक्रिया चर उत्पन्न करें:
time <- 1:50
x <- sample(rep(1:25,each=2),50)
y <- rnorm(50,5,5) + (5 + 15*sin(2*pi*time/25)) + (x/1)
y को यादृच्छिक भिन्नता के साथ 'समय' पर एक चक्रीय प्रवृत्ति प्रदर्शित करनी चाहिए:
plot(time,y)
और यादृच्छिक भिन्नता के साथ 'x' के साथ एक सकारात्मक रैखिक संबंध:
plot(x,y)
"Y ~ time + x" का एक सरल रैखिक एडिटिव मॉडल बनाएँ:
require(nlme)
m1 <- gls(y ~ time + x, method="REML")
मॉडल 'समय' के खिलाफ साजिश रचने पर अवशेषों में स्पष्ट चक्रीय पैटर्न प्रदर्शित करता है, जैसा कि अपेक्षित होगा:
plot(time, m1$residuals)
और 'x' के खिलाफ साजिश रचने पर अवशेषों में किसी भी पैटर्न या प्रवृत्ति का एक अच्छा, स्पष्ट अभाव होना चाहिए:
plot(x, m1$residuals)
"Y ~ टाइम + x" का एक सरल मॉडल जिसमें ऑर्डर 1 का एक ऑटोरेस्पिरेटिव सहसंबंध संरचना शामिल है, को ऑटोकरेलेशन संरचना के कारण पिछले मॉडल की तुलना में डेटा को बेहतर ढंग से फिट करना चाहिए, जब एआईसी का उपयोग करके मूल्यांकन किया जाता है:
m2 <- gls(y ~ time + x, correlation = corAR1(form=~time), method="REML")
AIC(m1,m2)
हालांकि, मॉडल को अभी भी लगभग अस्थायी रूप से 'अस्थायी रूप से निरंकुश अवशिष्ट' प्रदर्शित करना चाहिए:
plot(time, m2$residuals)
किसी भी सलाह के लिए बहुत बहुत धन्यवाद।