MCMC / EM सीमाएँ? EM पर MCMC?


9

मैं वर्तमान में R से JAGS का उपयोग करके पदानुक्रमित बायेसियन मॉडल सीख रहा हूं, और पायथन ( "हैकर्स के लिए बायेसियन मेथड्स" ) का उपयोग करके भी pymc ।

मैं इस पोस्ट से कुछ अंतर्ज्ञान प्राप्त कर सकता हूं : "आप संख्याओं के ढेर के साथ समाप्त हो जाएंगे जो दिखता है" जैसे कि "आप किसी भी तरह से उस जटिल वितरण से स्वतंत्र नमूने लेने में कामयाब रहे जिसके बारे में आप जानना चाहते थे।" यह कुछ ऐसा है जैसे मैं सशर्त संभावना दे सकता हूं, फिर मैं सशर्त संभाव्यता के आधार पर एक स्मृतिहीन प्रक्रिया उत्पन्न कर सकता हूं। जब मैं प्रक्रिया को लंबे समय तक उत्पन्न करता हूं, तो संयुक्त संभावना परिवर्तित हो सकती है। और फिर मैं उत्पन्न अनुक्रम के अंत में संख्याओं का ढेर ले सकता हूं। यह वैसे ही है जैसे मैं जटिल संयुक्त वितरण से स्वतंत्र नमूने लेता हूं। उदाहरण के लिए, मैं हिस्टोग्राम बना सकता हूं और यह वितरण फ़ंक्शन को अनुमानित कर सकता है।

फिर मेरी समस्या यह है कि क्या मुझे यह साबित करने की जरूरत है कि क्या एमसीएमसी एक निश्चित मॉडल के लिए अभिसरण करती है? मैं यह जानने के लिए प्रेरित हूं क्योंकि मैंने पहले GMM और LDA (ग्राफिकल मॉडल) के लिए EM एल्गोरिथ्म सीखा था। अगर मैं सिर्फ यह साबित किए बिना एमसीएमसी एल्गोरिथ्म का उपयोग कर सकता हूं कि क्या यह परिवर्तित होता है, तो यह ईएम की तुलना में बहुत अधिक समय बचा सकता है। चूँकि मुझे अपेक्षित लॉग लाइबिलिटी फंक्शन की गणना करनी होगी (पोस्टीरियर संभावना की गणना करनी होगी), और उसके बाद अपेक्षित लॉग लाइबिलिटी को अधिकतम करें। यह स्पष्ट रूप से एमसीएमसी की तुलना में अधिक बोझिल है (मुझे बस सशर्त संभावना तैयार करने की आवश्यकता है)।

मैं यह भी सोच रहा हूं कि क्या संभावना समारोह और पूर्व वितरण संयुग्म हैं। क्या इसका मतलब यह है कि MCMC को अभिसरण करना चाहिए? मैं MCMC और EM की सीमाओं के बारे में सोच रहा हूँ।


2
MCMC के रूप में परिवर्तित nपरिभाषा से। बल्कि तो यह साबित करना आप का निदान की जाँच करने के अभिसरण, अगर आपका मॉडल जैसे कन्वर्ज्ड है math.pku.edu.cn/teachers/xirb/Courses/QR2013/ReadingForFinal/... या people.fas.harvard.edu/~plam/teaching/methods / अभिसरण / ...
टिम

3
ईएम तेज है, यह गैर-बायेसियन है (सभी को बायेसियन आँकड़े पसंद नहीं हैं) और कुछ मामलों में इसकी पहचान कम है (यह एक अधिकतम अधिकतम मान में परिवर्तित होता है जबकि एमसीएमसी दृष्टिकोण के साथ आपके पास एक संपूर्ण वितरण है जो अधिक जटिल हो सकता है फिर बिंदु अनुमान ) आदि
टिम

2
EM का उपयोग अधिकतम संभावना या अधिकतम पश्च-निर्धारण अनुमान के लिए किया जाता है, लेकिन शुरुआत में इसे ML एल्गोरिथ्म के रूप में वर्णित किया गया था और आमतौर पर इसका उपयोग ML दृष्टिकोण ( en.wikipedia.org/wiki/… देखें ) में किया जाता है।
टिम

1
यहां तक ​​कि अगर आप एमएल के बजाय एमएपी आकलन के लिए ईएम का उपयोग करते हैं, तो यह मेरे लिए गैर-बायेसियन है क्योंकि यह पीछे के वितरण को चिह्नित करने की कोशिश करता है, लेकिन केवल आपको इसका स्थानीय मोड मिलता है।
लुका

1
मेरे लिए EM का उपयोग करना गैर-बायेसियन है क्योंकि यह आपको ब्याज के अपने मापदंडों का एक बिंदु अनुमान देता है और पूर्ण वितरण के बाद की मात्रा को निर्धारित नहीं करता है। EM और MCMC दोनों के साथ एक पूर्ण संभाव्य मॉडल हो सकता है जिसमें पादरी, अव्यक्त और अवलोकित यादृच्छिक चर हो सकते हैं, लेकिन अंतर्विरोध अलग है। MCMC का लक्ष्य पूर्ण पश्च वितरण को चिह्नित करना है जबकि EM देता है पूर्ण पश्च वितरण की जानकारी नहीं देता है। मेरे लिए एक बायेसियन वह है जो निर्णय लेने के लिए पश्च वितरण का उपयोग करता है। हालाँकि, यह सरल हो सकता है। मैं भी इस सामान को सीख रहा हूं।
लुका

जवाबों:


13

ईएम एक अनुकूलन तकनीक है: उपयोगी अव्यक्त चर के साथ एक संभावना दी जाती है, यह एक स्थानीय अधिकतम देता है, जो शुरुआती मूल्य के आधार पर वैश्विक अधिकतम हो सकता है।

MCMC एक सिमुलेशन विधि है: अव्यक्त चर के साथ या उसके बिना एक संभावना दी जाती है, और एक पूर्व, यह एक नमूना पैदा करता है जो लगभग पश्च वितरण से वितरित होता है। उस नमूने के पहले मूल्य आमतौर पर शुरुआती मूल्य पर निर्भर करते हैं, जिसका अर्थ है कि उन्हें अक्सर जला (या वार्म-अप) चरण के रूप में त्याग दिया जाता है।

जब इस नमूने का उपयोग पीछे के वितरण [मामलों के भारी बहुमत] से जुड़े अभिन्न लोगों का मूल्यांकन करने के लिए किया जाता है, तो अभिसरण गुण अनिवार्य रूप से इरोड मोंटे कार्लो सन्निकटन के समान होते हैं, एर्गोडिक प्रमेय के आधार पर।

यदि अधिक की जरूरत है, यानी, एक गारंटी है कि (xt,,xt+T) पीछे से एक नमूना है π(x|D), कुछ अभिसरण मूल्यांकन तकनीकें आर पैकेज CODA में उदाहरण के लिए उपलब्ध हैं । सैद्धांतिक रूप से, उपकरण जो अभिसरण सुनिश्चित करते हैं, संभवतः आपकी पहुंच से परे हैं। उदाहरण के लिए, सही नमूना या रीव्यूअल तरीके

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.