सादे अंग्रेजी में: मेरे पास एक एकाधिक प्रतिगमन या एनोवा मॉडल है लेकिन प्रत्येक व्यक्ति के लिए प्रतिक्रिया चर समय का वक्र कार्य है।
- मैं यह कैसे बता सकता हूं कि दाएं-हाथ के कौन-से चर चर के आकार या ऊर्ध्वाधर ऑफसेट में महत्वपूर्ण अंतर के लिए जिम्मेदार हैं?
- क्या यह समय-श्रृंखला की समस्या है, बार-बार की समस्या है, या पूरी तरह से कुछ और है?
- इस तरह के डेटा का विश्लेषण करने के लिए सबसे अच्छा अभ्यास क्या हैं (अधिमानतः
R
, लेकिन मैं अन्य सॉफ़्टवेयर का उपयोग करने के लिए खुला हूं)?
अधिक सटीक शब्दों में: लेट्स कहते हैं मैं एक मॉडल है लेकिन वास्तव में से एकत्र किए गए आंकड़ों-अंक की एक श्रृंखला है एक ही व्यक्ति कई समय बिंदुओं पर है, जो एक संख्यात्मक चर के रूप में दर्ज किए गए। डेटा को प्लॉट करना दर्शाता है कि प्रत्येक व्यक्ति के लिए का एक द्विघात या चक्रीय कार्य है, जिसका लंबवत ऑफसेट, आकार या आवृत्ति (चक्रीय मामले में) काफी हद तक सहसंयोजकों पर निर्भर हो सकता है। Covariates समय के साथ नहीं बदलते हैं - यानी, डेटा संग्रह की अवधि के लिए किसी व्यक्ति के पास निरंतर शरीर का वजन या उपचार समूह होता है।y मैं j कश्मीर कश्मीर टी y मैं j कश्मीर टी
अब तक मैंने निम्नलिखित R
तरीकों की कोशिश की है :
Manova
Anova(lm(YT~A*B,mydata),idata=data.frame(TIME=factor(c(1:10))),idesign=~TIME);
... जहां
YT
एक मैट्रिक्स है जिसके कॉलम समय बिंदु हैं, उनमें से 10 इस उदाहरण में हैं, लेकिन वास्तविक डेटा में कहीं अधिक हैं।समस्या: यह समय को एक कारक के रूप में मानता है, लेकिन समय-बिंदु प्रत्येक व्यक्ति के लिए बिल्कुल मेल नहीं खाते हैं। इसके अलावा, उनमें से कई नमूना आकार के सापेक्ष हैं इसलिए मॉडल संतृप्त हो जाता है। ऐसा लगता है कि समय के साथ प्रतिक्रिया चर के आकार को नजरअंदाज कर दिया गया है।
मिश्रित मॉडल (पिनेहिरो और बेट्स के रूप में, एस और एस-प्लस में मिश्रित प्रभाव मॉडल )
lme(fixed=Y~ A*B*TIME + sin(2*pi*TIME) + cos(2*pi*TIME), data=mydata, random=~(TIME + sin(2*pi*TIME) + cos(2*pi*TIME))|ID), method='ML')
... जहां
ID
एक कारक है जो व्यक्तिगत रूप से डेटा समूह करता है। इस उदाहरण में प्रतिक्रिया समय के साथ चक्रीय है, लेकिन इसके बजाय द्विघात या समय के अन्य कार्य हो सकते हैं।समस्या: मैं निश्चित नहीं हूं कि क्या प्रत्येक समय अवधि आवश्यक है (विशेष रूप से द्विघात शब्दों के लिए) और कौन से कोवारी से प्रभावित हैं।
- है
stepAIC()
उन्हें चुनने के लिए एक अच्छा तरीका? - यदि यह एक समय-निर्भर शब्द को हटा देता है, तो क्या यह इसे
random
तर्क से भी हटा देगा ? - क्या होगा अगर मैं एक ऑटोकॉरेलेशन फ़ंक्शन (जैसे कि
corEXP()
) का उपयोग करता हूं जोcorrelation
तर्क में एक फॉर्मूला लेता है - क्या मुझे उस फॉर्मूलेcorEXP()
को उसी के रूप मेंrandom
या सिर्फ एक के लिए बनाना चाहिए~1|ID
? nlme
पैकेज शायद ही कभी समय श्रृंखला के बाहर पिन्हीयरो और बेट्स के संदर्भ में बताया गया है ... यह अच्छी तरह से इस समस्या के लिए अनुकूल नहीं माना जाता है?
- है
प्रत्येक व्यक्ति के लिए एक द्विघात या त्रिकोणमितीय मॉडल फिट करना, और फिर प्रत्येक गुणांक का उपयोग कई प्रतिगमन या ANOVA के लिए प्रतिक्रिया चर के रूप में करना।
समस्या: एकाधिक तुलना सुधार आवश्यक है। किसी भी अन्य समस्याओं के बारे में नहीं सोच सकते हैं जो मुझे संदेह है कि मैं कुछ अनदेखी कर रहा हूँ।
जैसा कि पहले इस साइट पर सुझाव दिया गया है ( एक से अधिक भविष्यवाणियों वाले टाइम सीरीज़ रिग्रेशन के लिए क्या शब्द है? ), ARIMAX और ट्रांसफर फ़ंक्शन / डायनेमिक रिग्रेशन मॉडल हैं ।
समस्या: ARMA- आधारित मॉडल असतत समय मानते हैं, है न? गतिशील प्रतिगमन के रूप में, मैंने आज पहली बार इसके बारे में सुना, लेकिन इससे पहले कि मैं अभी तक एक और नई विधि में तल्लीन करूं जो शायद बिल्कुल भी बाहर न निकले, मैंने सोचा कि उन लोगों से पूछना विवेकपूर्ण होगा जिन्होंने सलाह के लिए पहले ऐसा किया है।