बायेसियन मॉडल में क्रॉस-सत्यापन की स्थिरता


19

मैं JAGS में के-फोल्ड क्रॉस-वैलिडेशन (k = 5) का उपयोग करके एक बायेसियन HLM फिट कर रहा हूं। मुझे पता है कि पैरामीटर का अनुमान है कि क्या करना चाहते हैं सभी परतों भर में स्थिर रहे हैं। ऐसा करने का सबसे अच्छा तरीका क्या है?β

एक विचार के कूल्हे के मतभेदों को मिल रहा है और अगर 0 अंतर का 95% सीआई में है देखने के लिए। दूसरे शब्दों में, के 95% अंतराल में 0 है β कश्मीर = 1 - β कश्मीर = 2 (और फिर परतों के सभी जोड़े के लिए दोहराएँ)।ββ=1-β=2

एक और विचार अलग एमसीएमसी चेन के रूप में प्रत्येक गुना से कूल्हे के इलाज के लिए, और Gelman की गणना करने के लिए है इन छद्म चेन भर में (संभावितआर^

क्या इनमें से एक बेहतर है, और क्या कोई विकल्प है?


1
यह देखने के लिए अजीब लगता है कि क्या शून्य विश्वसनीय अंतरों के बीच है, निश्चित रूप से आप उम्मीद करते हैं कि सिलवटों के बीच कुछ अंतर होगा। एक सुझाव यह की calculate बिंदु अनुमान होगा प्रत्येक गुना और इन के प्रसार पर देखने के लिए। β
रासमस बैथ

3
क्रॉस-मान्यता और बेसेसियन सामान के बारे में बस एक सामान्य टिप्पणी: क्यों न केवल WAIC की गणना करें? यह asymptotically LOOCV के बराबर है, और आप अभी भी अपने सभी डेटा का उपयोग कर सकते हैं।
ब्राश इक्विलिब्रियम

1
आप के पीछे सिमुलेशन कैसे उत्पन्न होगा ? β=1-β=2
स्टीफन लॉरेंट

मेरे पूर्व कारखाने में हमारे परीक्षणों में हमें यह साबित करना था कि 0% उपज हानि 95% सीआई में थी। पर्याप्त, स्वतंत्र नमूनों और द्विपद परीक्षण की प्रकृति के प्रश्न हावी थे। क्या आप अंदाजा लगा सकते हैं कि आपके नमूने के आकार क्या हैं?
एंग्रीस्टूडेंट -

जवाबों:


2

मुझे नहीं पता कि यह टिप्पणी के रूप में या उत्तर के रूप में योग्य है। मैं यहाँ डाल रहा हूँ क्योंकि यह एक जवाब की तरह लगता है।

K- गुना क्रॉस-वैरिफिकेशन में आप अपने डेटा को k समूहों में विभाजित कर रहे हैं। यदि आप "मूल बातें" को भी कवर कर रहे हैं तो आप प्रत्येक बी डिब्बे के लिए समान रूप से यादृच्छिक रूप से सदस्यों का चयन कर रहे हैं।

जब मैं डेटा की बात करता हूं, तो मैं प्रत्येक पंक्ति को नमूने के रूप में, और प्रत्येक कॉलम को एक आयाम के रूप में समझता हूं। मुझे चर महत्व, स्तंभ महत्व निर्धारित करने के लिए विभिन्न तरीकों का उपयोग करने के लिए उपयोग किया जाता है।

क्या होगा यदि आप एक विचार अभ्यास के रूप में, "पाठ्यपुस्तक" वर्दी यादृच्छिक से चले गए, और निर्धारित किया कि कौन सी पंक्तियाँ महत्वपूर्ण थीं? हो सकता है कि वे एक बार में एक ही चर को सूचित करते हैं, लेकिन शायद वे अधिक जानकारी देते हैं। क्या कुछ पंक्तियाँ हैं जो दूसरों की तुलना में कम महत्वपूर्ण हैं? हो सकता है कि बहुत से बिंदु जानकारीपूर्ण हों, शायद बहुत कम हैं।

चर के महत्व को जानते हुए, शायद आप उन्हें महत्व देकर बिन कर सकते हैं। हो सकता है कि आप सबसे महत्वपूर्ण नमूनों के साथ एक ही बिन बना सकें। यह आपके "k" के आकार को परिभाषित कर सकता है। इस तरह, आप "सबसे अधिक जानकारीपूर्ण" kth बाल्टी का निर्धारण करेंगे और इसकी तुलना दूसरों के साथ, और कम से कम सूचनात्मक बाल्टी के खिलाफ करेंगे।

इससे आपको अपने मॉडल मापदंडों की अधिकतम भिन्नता का अंदाजा हो सकता है। यह केवल एक रूप है।

केटी बाल्टी को विभाजित करने का एक दूसरा तरीका परिमाण और प्रभाव की दिशा है। तो आप ऐसे नमूने डाल सकते हैं जो एक पैरामीटर या मापदंडों को एक दिशा में एक बाल्टी में डालते हैं और एक ही पैरामीटर या पैरामीटर को विपरीत दिशा में एक अलग बाल्टी में डालते हैं।

इस रूप में पैरामीटर भिन्नता सूचना घनत्व पर नहीं, बल्कि सूचना नस्ल के आधार पर, चर को व्यापक रूप दे सकती है।

शुभकामनाएँ।


0

यह एक पूर्ण उत्तर नहीं हो सकता है, लेकिन यदि 0 कई अंतरों के लिए 95% सीआई में नहीं है, तो यह कहना काफी सुरक्षित है कि वे 0.05 के स्तर पर समान नहीं हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.