क्या मिश्रित मॉडल में भविष्यवक्ता के रूप में समय को शामिल करने की अनुमति है?


10

मैं हमेशा यह मानता था कि समय का उपयोग प्रतिगामियों (incl। Gam) के भविष्यवक्ता के रूप में नहीं किया जाना चाहिए क्योंकि, तब, एक ही प्रवृत्ति का "वर्णन" करेगा। यदि एक अध्ययन का उद्देश्य तापमान आदि जैसे पर्यावरणीय मापदंडों को खोजना है, जो किसी जानवर की गतिविधि को स्पष्ट करते हैं, तो मुझे आश्चर्य होता है कि समय कैसे किसी काम का हो सकता है? बिना किसी पैरामीटर के प्रॉक्सी के रूप में?

बंदरगाह porpoises के गतिविधि डेटा पर समय में कुछ रुझान यहां देखे जा सकते हैं: -> GAMM करते समय समय श्रृंखला में अंतराल को कैसे संभालना है?

मेरी समस्या यह है: जब मैं अपने मॉडल में समय शामिल करता हूं (जूलियन दिनों में मापा जाता है), तो अन्य सभी मापदंडों का 90% महत्वहीन हो जाता है (mgcv से ts-संकोचन चिकनी उन्हें बाहर निकालता है)। अगर मैं समय निकालता हूं, तो उनमें से कुछ महत्वपूर्ण हैं ...

सवाल यह है: क्या समय की भविष्यवाणी के रूप में अनुमति दी गई है (शायद जरूरत भी है?) या यह मेरे विश्लेषण को गड़बड़ कर रहा है?

अग्रिम में बहुत धन्यवाद

जवाबों:


12

समय की अनुमति है; क्या यह आवश्यक है कि आप क्या मॉडल बनाने की कोशिश कर रहे हैं पर निर्भर करेगा? आपके पास समस्या यह है कि आपके पास सहसंयोजक हैं जो डेटा में प्रवृत्ति को फिट करने के लिए एक साथ दिखाई देते हैं, जो समय बस के रूप में अच्छी तरह से कर सकता है लेकिन स्वतंत्रता की कम डिग्री का उपयोग कर रहा है - इसलिए वे समय के बजाय बाहर निकल जाते हैं।

यदि रुचि प्रणाली को मॉडल करने के लिए है, तो प्रतिक्रिया और समय के बीच सहसंबंधों के बीच संबंध, बजाय मॉडल के कि प्रतिक्रिया समय के साथ कैसे बदलती है, तो समय को सहसंयोजक के रूप में शामिल न करें। यदि उद्देश्य प्रतिक्रिया के औसत स्तर में परिवर्तन को मॉडल करना है, तो समय शामिल करें लेकिन कोवरिएट शामिल न करें। आप जो कहते हैं, उससे यह प्रतीत होता है कि आप पूर्व को चाहते हैं, बाद वाले को नहीं , और अपने मॉडल में समय को शामिल नहीं करना चाहिए । (लेकिन नीचे दी गई अतिरिक्त जानकारी पर विचार करें।)

हालांकि कुछ युगल हैं। धारण करने के सिद्धांत के लिए, अवशिष्टों को आईआईडी होना चाहिए (या आईडी यदि आप एक सहसंबंध संरचना का उपयोग करके स्वतंत्रता की धारणा को शांत करते हैं)। यदि आप सहसंयोजकों के एक समारोह के रूप में प्रतिक्रिया को मॉडलिंग कर रहे हैं और वे डेटा में किसी भी प्रवृत्ति को पर्याप्त रूप से मॉडल नहीं करते हैं, तो अवशिष्टों में एक प्रवृत्ति होगी, जो सिद्धांत की मान्यताओं का उल्लंघन करती है, जब तक कि फिट की गई संरचना इस प्रवृत्ति का सामना नहीं कर सकती।

इसके विपरीत, यदि आप केवल (केवल समय सहित) प्रतिक्रिया में प्रवृत्ति को मॉडलिंग कर रहे हैं, तो अवशिष्ट (व्यवस्थित प्रवृत्ति के बारे में) में व्यवस्थित भिन्नता हो सकती है जिसे प्रवृत्ति (समय) द्वारा समझाया नहीं गया है, और यह मान्यताओं का उल्लंघन भी हो सकता है। अवशिष्टों के लिए। ऐसे मामलों में आपको अवशिष्ट iid को प्रस्तुत करने के लिए अन्य कोवरिएट को शामिल करने की आवश्यकता हो सकती है

यह एक मुद्दा क्यों है? जब आप परीक्षण कर रहे होते हैं, यदि उदाहरण के लिए, प्रवृत्ति घटक महत्वपूर्ण है, या क्या सहसंयोजक के प्रभाव महत्वपूर्ण हैं, तो उपयोग किए गए सिद्धांत अवशिष्ट मान लेंगे यदि वे iid नहीं हैं तो मान्यताओं को पूरा नहीं किया जाएगा और p- मान पक्षपाती होंगे।

इस सबका बिंदु यह है कि आपको डेटा के सभी विभिन्न घटकों को मॉडल करने की आवश्यकता है जैसे कि आपके द्वारा उपयोग किए जाने वाले सिद्धांत के लिए अवशिष्ट iid हैं, यह परीक्षण करने के लिए कि यदि फिट किए गए घटक महत्वपूर्ण हैं, तो वैध होने के लिए।

एक उदाहरण के रूप में, मौसमी डेटा पर विचार करें और हम एक मॉडल फिट करना चाहते हैं जो डेटा में दीर्घकालिक भिन्नता, प्रवृत्ति का वर्णन करता है। यदि हम केवल ट्रेंड को मॉडल करते हैं न कि मौसमी चक्रीय भिन्नता को, तो हम यह जांचने में असमर्थ हैं कि क्या फिटेड ट्रेंड महत्वपूर्ण है क्योंकि रेसिड्यूल्स iid नहीं होंगे। ऐसे डेटा के लिए, हमें एक मौसमी घटक और एक ट्रेंड दोनों के साथ एक मॉडल फिट करने की आवश्यकता होगी घटक, और एक अशक्त मॉडल जिसमें सिर्फ मौसमी घटक शामिल था। फिर हम फिट किए गए रुझान के महत्व का आकलन करने के लिए सामान्यीकृत संभावना अनुपात परीक्षण का उपयोग करते हुए दो मॉडलों की तुलना करेंगे। यह उपयोग किए गए दो मॉडल anova()के $lmeघटकों पर उपयोग करके किया जाता है gamm()


प्रिय गैविन, आपकी बहुत उपयोगी टिप्पणियों के लिए बहुत धन्यवाद। मुझे आशा है कि मैं तुम्हें जल्द ही मदद कर सकते हैं;) जब मैं एनोवा साथ GLRT कोशिश यह मुझे "वस्तु 'स्थिर' नहीं मिला ':( बताता है
जेन्स

1
@ जेन्स कॉल होना चाहिए anova(mod1$lme, mod2$lme)। यदि आप एक गैर-गाऊसी मॉडल फिट कर रहे हैं, तो यह काम नहीं कर सकता है क्योंकि PQL तरीकों में एक वास्तविक लॉग-संभावना नहीं है, PQL नाम में अर्ध-संभावना की संभावना को बढ़ाता है। यह gamm4 का उपयोग करने का एक कारण है , लेकिन फिर आपको सहसंबंध संरचना के बारे में कुछ करने की आवश्यकता है क्योंकि lme4 उन्हें अनुमति नहीं देता है।
गैविन सिम्पसन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.