क्यों बेगियन पदानुक्रमित मॉडल में लैग प्रभाव वृद्धि का मतलब है कि विचलन को जोड़ना है?


14

बैकग्राउंड: मैं वर्तमान में विभिन्न बायेसियन पदानुक्रमित मॉडल की तुलना में कुछ काम कर रहा हूं। डेटा yमैंजे भागीदार के लिए अच्छी तरह से किया जा रहा है के संख्यात्मक उपाय कर रहे हैं मैं और समय जे । मेरे पास लगभग 1000 प्रतिभागी हैं और प्रति प्रतिभागी में 5 से 10 प्रेक्षण हैं।

अधिकांश अनुदैर्ध्य डेटासेट के साथ, मैं ऑटो-सहसंबंध के कुछ रूप को देखने की उम्मीद कर रहा हूं जिससे समय के करीब आने वाली टिप्पणियों में उन लोगों की तुलना में अधिक सहसंबंध होता है जो आगे अलग हैं। कुछ चीजों को सरल बनाना, मूल मॉडल इस प्रकार है:

yमैंजे~एन(μमैंजे,σ2)

जहाँ मैं एक अंतराल मॉडल की तुलना कर रहा हूँ:

μमैंजे=β0मैं

अंतराल मॉडल के साथ:

μमैंजे=β0मैं+β1(yमैं(जे-1)-β0मैं)

β0मैंβ1yमैं0

मुझे जो परिणाम मिल रहे हैं, वे संकेत देते हैं कि:

  • लैग पैरामीटर लगभग 18 है, 95% CI [.14, .21]। यानी, यह गैर-शून्य है
  • माध्य विचलन और डीआईसी दोनों में कई सौ की वृद्धि होती है जब लैग को मॉडल में शामिल किया जाता है
  • पश्चवर्ती पूर्वानुमान जांच से पता चलता है कि अंतराल प्रभाव को शामिल करके, डेटा में ऑटो-सहसंबंध को पुनर्प्राप्त करने के लिए मॉडल बेहतर है

इसलिए सारांश में, गैर-शून्य लैग पैरामीटर और पश्चवर्ती भविष्यवाणिय जांच यह सुझाव देती है कि लैग मॉडल बेहतर है; अभी तक विचलन और डीआईसी का सुझाव है कि कोई अंतराल मॉडल बेहतर नहीं है। यह मुझे पहेली है।

मेरा सामान्य अनुभव यह है कि यदि आप एक उपयोगी पैरामीटर जोड़ते हैं, तो इसका मतलब कम से कम अवमूल्यन को कम करना चाहिए (भले ही जटिलता के दंड के बाद डीआईसी में सुधार न हो)। इसके अलावा, लैग पैरामीटर के लिए शून्य का मान बिना लैग मॉडल के समान विचलन प्राप्त करेगा।

सवाल

लैग पैरामीटर गैर शून्य होने पर भी एक बायेसियन पदानुक्रमित मॉडल में लैग इफेक्ट वृद्धि का मतलब क्यों हो सकता है?

प्रारंभिक विचार

  • मैंने बहुत सारे अभिसरण जांच किए हैं (उदाहरण के लिए, ट्रेसप्लेट्स को देखते हुए, चेन और आर-पार के विचलन परिणामों में भिन्नता की जांच करना) और दोनों मॉडल को पीछे की ओर परिवर्तित किया गया प्रतीत होता है।
  • मैंने एक कोड जांच की है, जहां मैंने लैग प्रभाव को शून्य होने के लिए मजबूर किया, और इसने नो लैग मॉडल डेविएन्स को पुनर्प्राप्त किया।
  • मैंने माध्य विचलन को कम से कम दंड के रूप में देखा, जिसमें अपेक्षित मूल्यों पर अवमूल्यन होना चाहिए, और इनने लैग मॉडल को भी बदतर बना दिया।
  • β0मैं
  • शायद कुछ समस्या है कि मैंने पहले अवलोकन से पहले निहित समय बिंदु का अनुमान कैसे लगाया है।
  • शायद इस डेटा में अंतराल प्रभाव सिर्फ कमजोर है
  • मैं का उपयोग कर अधिकतम liklihood का उपयोग कर मॉडल का आकलन करने की कोशिश की lmeके साथ correlation=corAR1()। अंतराल पैरामीटर का अनुमान बहुत समान था। इस मामले में लैग मॉडल की एक बड़ी लॉग लाइबिलिटी थी और एक छोटा एआईसी (लगभग 100) एक लैग के बिना एक से अधिक था (यानी, यह सुझाव दिया कि लैग मॉडल बेहतर था)। तो इसने इस विचार को मजबूत किया कि लैग को जोड़ने से बायेसियन मॉडल में कमी को कम किया जाना चाहिए।
  • शायद बायेसियन अवशेषों के बारे में कुछ खास है। यदि अंतराल मॉडल पूर्ववर्ती समय बिंदु पर अनुमानित और वास्तविक y के बीच के अंतर का उपयोग करता है, तो यह मात्रा अनिश्चित होने वाली है। इस प्रकार, अंतराल प्रभाव ऐसे अवशिष्ट मूल्यों के एक विश्वसनीय अंतराल पर काम कर रहा होगा।

आप कहते हैं कि अंतराल पैरामीटर लगभग 18 है। क्या आपने लैग-पैरामीटर सीखा? यदि हाँ, तो आपने पहले क्या उपयोग किया था?
शिखर सम्मेलन

एन(β0मैं,σ2)

जवाबों:


1

यहाँ मेरे विचार हैं:

  • डीआईसी, बीआईसी, एआईसी के बजाय मैं सीमांत संभावना (जिसे सबूत के रूप में भी जाना जाता है ) के साथ सीधे काम करने का सुझाव देता हूं यदि आप इसे बर्दाश्त कर सकते हैं। सबूत जितना बड़ा होगा , आपकी मॉडल कक्षा उतनी ही अधिक होगी। यह एक बड़ा अंतर नहीं हो सकता है, लेकिन डीआईसी, बीआईसी, एआईसी, सब के बाद, केवल सन्निकटन हैं।
  • 0.18
  • आइए एक कदम आगे बढ़ें: उस मॉडल को लें जो लैग-इफेक्ट (सी) पर विचार नहीं करता है और इसकी सीमांत संभावना की गणना करता है । अगला, अपना मॉडल वर्ग (डी) लें जो लैग-प्रभाव को शामिल करता है और लैग-पैरामीटर पर एक पूर्व होता है; (d) के सीमांत संभावना की गणना करें । आप उम्मीद करेंगे कि (d) में बड़ा मार्जिन है । तो क्या, अगर तुम नहीं?

    (1) सीमांत संभावना मॉडल वर्ग को संपूर्ण मानती है। इसमें अंतराल-प्रभाव, मापदंडों की संख्या, संभावना, पूर्व शामिल हैं।

    (2) विभिन्न प्रकार के मापदंडों की तुलना करने वाले मॉडल हमेशा नाजुक होते हैं, अगर अतिरिक्त मापदंडों से पहले काफी अनिश्चितता हो।

    (३) यदि आप अपने लैग-पैरामीटर से पहले अनिश्चितता को अनुचित रूप से बड़ा बताते हैं, तो आप पूरे मॉडल वर्ग को दंडित करते हैं।

    (४) ऐसी कौन सी जानकारी है जो नकारात्मक अंतराल के लिए और सकारात्मक अंतराल के लिए समान संभावनाओं का समर्थन करती है? मेरा मानना ​​है कि एक नकारात्मक अंतराल का निरीक्षण करना बहुत संभव नहीं है, और इसे पूर्व में शामिल किया जाना चाहिए।

    (५) आपने अपने लैग-पैरामीटर पर जो पूर्व चुना है वह एक समान है। यह आमतौर पर एक अच्छा विकल्प नहीं है: क्या आप पूरी तरह से सुनिश्चित हैं कि आपके पैरामीटर वास्तव में निर्दिष्ट सीमा के अंदर झूठ होना चाहिए? क्या सीमा के अंदर प्रत्येक अंतराल-मूल्य की वास्तव में समान संभावना है? मेरा सुझाव: बीटा-वितरण के साथ जाएं (यदि आप सुनिश्चित हैं कि अंतराल बाध्य है, या लॉग-सामान्य के साथ यदि आप शून्य से छोटे मूल्यों को बाहर कर सकते हैं ।

    (६) यह एक विशेष उदाहरण है, जहाँ गैर-सूचनात्मक पुजारियों का उपयोग ठीक नहीं है ( सीमान्त संभावना को देखते हुए ): आप हमेशा उस मॉडल का पक्ष लेंगे जिसमें अनिश्चित मापदंडों की संख्या कम हो; इससे कोई फर्क नहीं पड़ता कि अधिक मापदंडों वाला मॉडल कितना अच्छा या बुरा कर सकता है।

मुझे आशा है कि मेरे विचार आपको कुछ नए विचार, संकेत देंगे ?!


सुझावों के लिए धन्यवाद। बस चीजों को राउंड करने के लिए, मैंने लैग पैरामीटर को पोस्टीरियर (यानी, 0.18) के माध्य का मान रखने के लिए विवश करने की कोशिश की। नो लैग मॉडल में अभी भी छोटे माध्य विचलन था।
जेरोमे एंग्लीम
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.