MCMC आधारित प्रतिगमन मॉडल में अवशिष्ट निदान


21

मैंने हाल ही में बायसीयन फ्रेमवर्क में फिटिंग रिग्रेशन मिक्स्ड मॉडल्स को अपनाया है, जो MCMC कलन विधि (वास्तव में R में MCMCglmm फंक्शन) का उपयोग करता है।

मेरा मानना ​​है कि मैंने समझा है कि अनुमान प्रक्रिया (ट्रेस, geweke प्लॉट, ऑटोकॉरेलेशन, पोस्टीरियर डिस्ट्रिब्यूशन ...) के अभिसरण का निदान कैसे किया जाता है।

बेयसियन ढांचे में एक चीज जो मुझे चौंकाती है, वह यह है कि उन निदानों को करने के लिए बहुत प्रयास किया जाता है, जबकि फिट किए गए मॉडल के अवशेषों की जांच करने के मामले में बहुत कम दिखाई देता है। उदाहरण के लिए MCMCglmm में अवशिष्ट। Cmc () फ़ंक्शन मौजूद है, लेकिन वास्तव में अभी तक लागू नहीं किया गया है (यानी ।returns: "MCMCglmm ऑब्जेक्ट्स के लिए अभी तक अवशिष्ट नहीं लागू किया गया है"; predict.mcmc () के लिए एक ही कहानी)। ऐसा लगता है कि अन्य पैकेजों की भी कमी है, और आमतौर पर मैंने जो साहित्य पाया है उसमें बहुत कम चर्चा की गई है (डीआईसी के अलावा जो काफी चर्चा में है)।

क्या कोई मुझे कुछ उपयोगी संदर्भों की ओर इशारा कर सकता है, और आदर्श रूप से आर कोड मैं के साथ खेल सकता हूं या संशोधित कर सकता हूं?

बहुत धन्यवाद।


बड़ा सवाल है। मुझे वास्तव में बाइसियन मॉडल की जाँच के बारे में कॉस्मा शालिज़ी के साथ एंड्रयू जेलमैन का पेपर पसंद आया।
डेविड जे। हैरिस

जवाबों:


7

मुझे लगता है कि अवशिष्ट शब्द का उपयोग बायेसियन रिग्रेशन के अनुरूप नहीं है। याद रखें, अक्सर संभावना मॉडल में, यह ऐसे पैरामीटर हैं जिन्हें निश्चित अनुमानित मात्रा माना जाता है और डेटा जनरेटिंग तंत्र में कुछ यादृच्छिक संभावना मॉडल होते हैं जो अवलोकन किए गए डेटा से जुड़े होते हैं। Bayesians के लिए, संभाव्यता मॉडल के मापदंडों को परिवर्तनशील माना जाता है और निश्चित डेटा उन मापदंडों के बारे में हमारी धारणा को अद्यतन करता है। इसलिए, यदि आप एक प्रतिगमन मॉडल में मनाया शून्य से फिट मानों के विचरण की गणना कर रहे थे , तो मनाया गयाघटक में 0 भिन्नता होगी, जबकि फिट किया गया घटक मॉडल मापदंडों के लिए पीछे की संभावना घनत्व के एक समारोह के रूप में भिन्न होगा। यह वह चीज है जो आप लगातार प्रतिगमन मॉडल से प्राप्त करेंगे। मुझे लगता है कि अगर किसी को अपने बायेसियन रिग्रेशन मॉडल की संभाव्य मान्यताओं की जांच करने में रुचि थी, तो पैरामीटर अनुमानों के पिछले घनत्व का एक सरल QQplot (हमारे MCMC नमूनाकरण से अनुमानित) बनाम एक सामान्य वितरण में नैदानिक ​​शक्ति अनुरूप होना चाहिए जो अवशिष्ट (या पियर्सन अवशिष्ट का विश्लेषण करने के लिए अनुरूप हो) गैर-रैखिक लिंक कार्यों के लिए)।


1
यह एक अच्छा जवाब है। अभी तक ऐसे उत्तर हो सकते हैं, जो देखे गए माइनस-फिट रेजिडेंशियल से गणना किए गए उपयोगी बायेसियन निर्माणों को देते हैं, लेकिन यह निश्चित रूप से कम नहीं होना चाहिए।
एली

3
इसके अलावा, यह स्पष्ट करने योग्य हो सकता है कि बायेसियन सेटिंग में आपके पास वास्तव में "फिट" मान नहीं हैं। आप किसी दिए गए इनपुट के लिए पोस्टीरियर माध्य की गणना कर सकते हैं, उस इनपुट के लिए लक्ष्य चर के अपेक्षित मूल्य का अधिकतम पोस्टीरियर अनुमान प्राप्त करने के लिए। लेकिन यह अनुमानों को इंगित करने के लिए सब कुछ कम कर देगा, जो आमतौर पर वांछित नहीं है यदि आप बायेसियन इंट्रेंस कर रहे हैं।
Ely

2
@ उनमें से कोई भी सार्थक अवशेष हैं। सिर्फ इसलिए कि एक बायेसियन है इसका मतलब यह नहीं है कि कोई भी यह जांच नहीं कर सकता है कि क्या आंकड़े डेटा में दिखाई देते हैं।
Glen_b -Reinstate मोनिका 6’13

1
अध्ययन के प्रयोगों के प्रतिकृति में, "सेटिंग" (सशर्त अर्थ) से सशर्त रूप से स्वतंत्र होने के लिए, लगातार सेटिंग में सटीक संभाव्य निष्कर्ष (जगह में सामान्यता मान्यताओं) के लिए, "अवशिष्ट" होगा। बेय्स दुनिया में, डेटा यादृच्छिक नहीं हैं, तो क्या सशर्त रूप से स्वतंत्र होगा क्या?
एडम सेप

1
[Y|एक्स]एक्सY
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.