बैकग्राउंड: मैं वर्तमान में विभिन्न बायेसियन पदानुक्रमित मॉडल की तुलना में कुछ काम कर रहा हूं। डेटा भागीदार के लिए अच्छी तरह से किया जा रहा है के संख्यात्मक उपाय कर रहे हैं और समय । मेरे पास लगभग 1000 प्रतिभागी हैं और प्रति प्रतिभागी में 5 से 10 प्रेक्षण हैं।
अधिकांश अनुदैर्ध्य डेटासेट के साथ, मैं ऑटो-सहसंबंध के कुछ रूप को देखने की उम्मीद कर रहा हूं जिससे समय के करीब आने वाली टिप्पणियों में उन लोगों की तुलना में अधिक सहसंबंध होता है जो आगे अलग हैं। कुछ चीजों को सरल बनाना, मूल मॉडल इस प्रकार है:
जहाँ मैं एक अंतराल मॉडल की तुलना कर रहा हूँ:
अंतराल मॉडल के साथ:
मुझे जो परिणाम मिल रहे हैं, वे संकेत देते हैं कि:
- लैग पैरामीटर लगभग 18 है, 95% CI [.14, .21]। यानी, यह गैर-शून्य है
- माध्य विचलन और डीआईसी दोनों में कई सौ की वृद्धि होती है जब लैग को मॉडल में शामिल किया जाता है
- पश्चवर्ती पूर्वानुमान जांच से पता चलता है कि अंतराल प्रभाव को शामिल करके, डेटा में ऑटो-सहसंबंध को पुनर्प्राप्त करने के लिए मॉडल बेहतर है
इसलिए सारांश में, गैर-शून्य लैग पैरामीटर और पश्चवर्ती भविष्यवाणिय जांच यह सुझाव देती है कि लैग मॉडल बेहतर है; अभी तक विचलन और डीआईसी का सुझाव है कि कोई अंतराल मॉडल बेहतर नहीं है। यह मुझे पहेली है।
मेरा सामान्य अनुभव यह है कि यदि आप एक उपयोगी पैरामीटर जोड़ते हैं, तो इसका मतलब कम से कम अवमूल्यन को कम करना चाहिए (भले ही जटिलता के दंड के बाद डीआईसी में सुधार न हो)। इसके अलावा, लैग पैरामीटर के लिए शून्य का मान बिना लैग मॉडल के समान विचलन प्राप्त करेगा।
सवाल
लैग पैरामीटर गैर शून्य होने पर भी एक बायेसियन पदानुक्रमित मॉडल में लैग इफेक्ट वृद्धि का मतलब क्यों हो सकता है?
प्रारंभिक विचार
- मैंने बहुत सारे अभिसरण जांच किए हैं (उदाहरण के लिए, ट्रेसप्लेट्स को देखते हुए, चेन और आर-पार के विचलन परिणामों में भिन्नता की जांच करना) और दोनों मॉडल को पीछे की ओर परिवर्तित किया गया प्रतीत होता है।
- मैंने एक कोड जांच की है, जहां मैंने लैग प्रभाव को शून्य होने के लिए मजबूर किया, और इसने नो लैग मॉडल डेविएन्स को पुनर्प्राप्त किया।
- मैंने माध्य विचलन को कम से कम दंड के रूप में देखा, जिसमें अपेक्षित मूल्यों पर अवमूल्यन होना चाहिए, और इनने लैग मॉडल को भी बदतर बना दिया।
- शायद कुछ समस्या है कि मैंने पहले अवलोकन से पहले निहित समय बिंदु का अनुमान कैसे लगाया है।
- शायद इस डेटा में अंतराल प्रभाव सिर्फ कमजोर है
- मैं का उपयोग कर अधिकतम liklihood का उपयोग कर मॉडल का आकलन करने की कोशिश की
lme
के साथcorrelation=corAR1()
। अंतराल पैरामीटर का अनुमान बहुत समान था। इस मामले में लैग मॉडल की एक बड़ी लॉग लाइबिलिटी थी और एक छोटा एआईसी (लगभग 100) एक लैग के बिना एक से अधिक था (यानी, यह सुझाव दिया कि लैग मॉडल बेहतर था)। तो इसने इस विचार को मजबूत किया कि लैग को जोड़ने से बायेसियन मॉडल में कमी को कम किया जाना चाहिए। - शायद बायेसियन अवशेषों के बारे में कुछ खास है। यदि अंतराल मॉडल पूर्ववर्ती समय बिंदु पर अनुमानित और वास्तविक y के बीच के अंतर का उपयोग करता है, तो यह मात्रा अनिश्चित होने वाली है। इस प्रकार, अंतराल प्रभाव ऐसे अवशिष्ट मूल्यों के एक विश्वसनीय अंतराल पर काम कर रहा होगा।