हमें MCMC श्रृंखलाओं में तेजी से मिश्रण की परवाह क्यों करनी चाहिए?


21

जब मार्कोव चेन मोंटे कार्लो के साथ काम कर रहे थे, तो हमें एक श्रृंखला की आवश्यकता थी, जो तेजी से मिक्स हो, यानी तेजी से पीछे वितरण का समर्थन तेजी से बढ़ता है। लेकिन मुझे समझ नहीं आ रहा है कि हमें इस संपत्ति की आवश्यकता क्यों है, क्योंकि मैं जो समझता हूं, स्वीकार किए गए कैंडिडेट ड्रॉ होने चाहिए और पीछे वितरण के उच्च घनत्व वाले हिस्से में केंद्रित होंगे। अगर मैं जो समझता हूं वह सच है, तो क्या हम अभी भी चाहते हैं कि श्रृंखला समर्थन के माध्यम से आगे बढ़े (जिसमें कम घनत्व वाला भाग भी शामिल हो)?

इसके अलावा, यदि मैं अनुकूलन करने के लिए एमसीएमसी का उपयोग कर रहा हूं, तो क्या मुझे अभी भी तेजी से मिश्रण की देखभाल करने की आवश्यकता है और क्यों?

अपने विचारों को बांटने के लिए धन्यवाद!


यह MCMC साहित्य में जाना जाता है कि जब एक मार्कोव श्रृंखला ज्यामितीय रूप से क्षत-विक्षत होती है, तो इसमें तेजी से अल्फा-मिक्सिंग क्षय होता है। मैं स्पष्ट नहीं हूं कि X_ {n} लक्ष्य वितरण में तेजी से कैसे परिवर्तित हो सकता है और फिर भी क्रमिक नमूनों के बीच उच्च सहसंबंध बनाए रख सकता है। क्या कोई सरल उदाहरण हैं? किसी भी जानकारी के लिए धन्यवाद!

जवाबों:


16

आदर्श मोंटे कार्लो एल्गोरिदम स्वतंत्र क्रमिक यादृच्छिक मूल्यों का उपयोग करता है । MCMC में, क्रमिक मूल्य स्वतंत्र नहीं हैं, जो विधि को आदर्श मोंटे कार्लो की तुलना में धीमा बनाता है; हालाँकि, यह जितनी तेजी से मिक्स होता है, उतनी ही तेजी से निर्भरता क्रमिक पुनरावृत्तियों में तय होती है, और जिस तेजी से यह परिवर्तित होता है।

¹ मैं यहाँ मतलब है कि लगातार मूल्यों जल्दी से प्रारंभिक अवस्था की "लगभग स्वतंत्र", या कहें कि मूल्य दिया जाता है एक बिंदु पर, मूल्यों एक्स ń + कश्मीर की जल्दी से "लगभग स्वतंत्र" बन एक्स एन के रूप में कश्मीर बढ़ता है, इसलिए, जैसा कि कखली टिप्पणियों में कहता है, "श्रृंखला राज्य के एक निश्चित क्षेत्र में नहीं अटकती है"।XnXń+kXnk

संपादित करें: मुझे लगता है कि निम्नलिखित उदाहरण मदद कर सकता है

कल्पना करें कि आप MCMC द्वारा पर एक समान वितरण के माध्यम का अनुमान लगाना चाहते हैं । आप क्रमबद्ध अनुक्रम ( 1 , , n ) से शुरू करते हैं ; प्रत्येक चरण पर, आपने k > 2 तत्वों को अनुक्रम में चुना और बेतरतीब ढंग से उन्हें फेरबदल किया। प्रत्येक चरण पर, स्थिति 1 पर तत्व दर्ज किया गया है; यह समान वितरण में परिवर्तित होता है। K का मान मिश्रण की कठोरता को नियंत्रित करता है: जब k = 2 , यह धीमा है; जब k = n , क्रमिक तत्व स्वतंत्र होते हैं और मिश्रण तेज होता है।{1,,n}(1,,n)k>2kk=2k=n

यहाँ इस MCMC एल्गोरिथ्म के लिए एक आर समारोह है:

mcmc <- function(n, k = 2, N = 5000)
{
  x <- 1:n;
  res <- numeric(N)
  for(i in 1:N)
  {
    swap <- sample(1:n, k)
    x[swap] <- sample(x[swap],k);
    res[i] <- x[1];
  }
  return(res);
}

आइए इसे लिए लागू करें , और MCMC पुनरावृत्तियों के साथ माध्य μ = 50 के क्रमिक अनुमान को प्लॉट करें :n=99μ=50

n <- 99; mu <- sum(1:n)/n;

mcmc(n) -> r1
plot(cumsum(r1)/1:length(r1), type="l", ylim=c(0,n), ylab="mean")
abline(mu,0,lty=2)

mcmc(n,round(n/2)) -> r2
lines(1:length(r2), cumsum(r2)/1:length(r2), col="blue")

mcmc(n,n) -> r3
lines(1:length(r3), cumsum(r3)/1:length(r3), col="red")

legend("topleft", c("k = 2", paste("k =",round(n/2)), paste("k =",n)), col=c("black","blue","red"), lwd=1)

mcmc अभिसरण

आप यहाँ देख सकते हैं कि (काले रंग में) के लिए, अभिसरण धीमा है; के लिए कश्मीर = 50 (नीले रंग में), यह तेजी से होता है, लेकिन अभी भी साथ की तुलना में धीमी कश्मीर = 99 (लाल रंग में)।k=2k=50k=99

आप निश्चित संख्या के पुनरावृत्तियों के बाद अनुमानित साधनों के वितरण के लिए हिस्टोग्राम की भी साजिश कर सकते हैं, जैसे कि 100 पुनरावृत्तियों:

K <- 5000;
M1 <- numeric(K)
M2 <- numeric(K)
M3 <- numeric(K)
for(i in 1:K)
{
  M1[i] <- mean(mcmc(n,2,100));
  M2[i] <- mean(mcmc(n,round(n/2),100));
  M3[i] <- mean(mcmc(n,n,100));
}

dev.new()
par(mfrow=c(3,1))
hist(M1, xlim=c(0,n), freq=FALSE)
hist(M2, xlim=c(0,n), freq=FALSE)
hist(M3, xlim=c(0,n), freq=FALSE)

हिस्टोग्राम

k=2k=50k=99

> mean(M1)
[1] 19.046
> mean(M2)
[1] 49.51611
> mean(M3)
[1] 50.09301
> sd(M2)
[1] 5.013053
> sd(M3)
[1] 2.829185

4
मुझे नहीं लगता कि यह कथन "जितनी तेजी से मिक्स होता है, उतनी ही तेजी से निर्भरता क्रमिक पुनरावृत्तियों में गिरावट" सही है। उदाहरण के लिए, क्रमिक पुनरावृत्तियाँ हमेशा मेट्रोपोलिस-हेस्टिंग्स एल्गोरिथम का उपयोग करने पर निर्भर होंगी। मिक्सिंग के साथ यह करना है कि आपके नमूने कितनी तेजी से लक्ष्य वितरण में परिवर्तित हो जाते हैं, न कि लगातार निर्भर होने वाले पुनरावृत्तियों पर।
मैक्रों

यह समान है: यदि यह तेजी से लक्ष्य वितरण में परिवर्तित होता है, तो प्रारंभिक अवस्था से निर्भरता तेजी से घटती है ... निश्चित रूप से यह श्रृंखला के किसी भी बिंदु पर समान होगा (जिसे प्रारंभिक अवस्था के रूप में चुना जा सकता था)। मुझे लगता है कि उपरोक्त उदाहरण का अंतिम भाग इस पहलू के लिए ज्ञानवर्धक है।
एल्विस

1
हां, प्रारंभिक अवस्था से निर्भरता, जरूरी पुनरावृत्तियों के बीच निर्भरता नहीं है।
मैक्रों

मैंने "क्रमिक पुनरावृत्तियों में" लिखा, "बीच में" नहीं। मेरा वास्तव में "साथ" है ... यह अस्पष्ट है, मैं सही करूँगा।
एल्विस

2
मुझे लगता है कि मैं समझता हूं कि तेजी से मिश्रण का मतलब क्या है। ऐसा नहीं है कि लक्ष्य वितरण के समर्थन के प्रत्येक भाग में श्रृंखला चलती है। इसके बजाय, यह उस श्रृंखला के बारे में अधिक है जो समर्थन के कुछ हिस्से में नहीं फंसती है।
१:२२ बजे ०२:१२

10

पहले के दोनों जवाबों को पूरा करने में, मिश्रण केवल एक ही है(Xn)α

α(n)=supA,B{|P(X0A,XnB)P(X0A)P(XnB)},nN,
(Xn)π

Xn

आपकी विशिष्ट टिप्पणी के बारे में

... स्वीकार किए गए उम्मीदवार को खींचना चाहिए और पीछे के वितरण के उच्च घनत्व वाले हिस्से में केंद्रित होना चाहिए। अगर मैं जो समझता हूं वह सच है, तो क्या हम अभी भी चाहते हैं कि श्रृंखला समर्थन के माध्यम से आगे बढ़े (जिसमें कम घनत्व वाला भाग भी शामिल हो)?

(Xn)


1
+1 एंटीटेटिक सिमुलेशन के बारे में टिप्पणी के लिए बहुत धन्यवाद, यह अच्छा है
एल्विस

ααα0

ρβ

3

तेजी से मिक्सिंग चेन की इच्छा को प्रेरित करने वाले अनुमान यह हैं कि आप कंप्यूटिंग समय के बारे में परवाह करते हैं और यह कि आप पोस्टीरियर से प्रतिनिधि नमूना चाहते हैं। पूर्व समस्या की जटिलता पर निर्भर करेगा: यदि आपके पास एक छोटी / सरल समस्या है, तो यह ज्यादा मायने नहीं रखता कि आपका एल्गोरिथ्म कुशल है या नहीं। उत्तरार्द्ध बहुत महत्वपूर्ण है यदि आप पीछे की अनिश्चितता में रुचि रखते हैं या उच्च परिशुद्धता के साथ पीछे का मतलब जानना चाहते हैं। हालाँकि, यदि आप पोस्टीरियर के प्रतिनिधि नमूने के बारे में परवाह नहीं करते हैं क्योंकि आप केवल अनुमानित अनुकूलन करने के लिए MCMC का उपयोग कर रहे हैं, तो यह आपके लिए बहुत महत्वपूर्ण नहीं हो सकता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.