मार्कोव श्रृंखला को अवशोषित करने वाले दो को देखते हुए, क्या संभावना है कि एक दूसरे से पहले समाप्त हो जाएगा?


9

मेरे पास दो अलग-अलग मार्कोव श्रृंखलाएं हैं, जिनमें से प्रत्येक में एक अवशोषित अवस्था और एक ज्ञात प्रारंभिक स्थिति है। मैं इस संभावना को निर्धारित करना चाहता हूं कि श्रृंखला 1 श्रृंखला 2 से कम चरणों में एक अवशोषित अवस्था तक पहुंच जाएगी।

मुझे लगता है कि मैं n चरणों के बाद किसी विशेष श्रृंखला में अवशोषित अवस्था तक पहुंचने की संभावना की गणना कर सकता हूं: एक संक्रमण मैट्रिक्स P के बाद अवशोषित होने की संभावना n कदम है Pijn कहाँ पे i प्रारंभिक अवस्था है और j अवशोषित अवस्था है।

मैं निश्चित नहीं हूँ कि यहाँ से कहाँ जाऊँ। समसामयिक समस्याओं मैं पासा शामिल है (उदाहरण के लिए, 8 की राशि से पहले 7 की राशि रोलिंग), लेकिन यह हल करने के लिए आसान है क्योंकि एक विशेष राशि रोलिंग की संभावना स्थिर है और अब तक उठाए गए चरणों की संख्या से स्वतंत्र है।

जवाबों:


13

श्रृंखलाओं को समानांतर में चलाएं। परिणामी उत्पाद श्रृंखला में तीन अवशोषित राज्यों को परिभाषित करें:

  1. पहली श्रृंखला एक अवशोषित अवस्था तक पहुँचती है लेकिन दूसरी नहीं।

  2. दूसरी श्रृंखला एक अवशोषित अवस्था तक पहुँचती है लेकिन पहली नहीं होती है।

  3. दोनों श्रृंखलाएँ एक साथ अवशोषित अवस्था में पहुँचती हैं।

उत्पाद श्रृंखला में इन तीन राज्यों की सीमित संभावनाएं ब्याज की संभावना देती हैं।


इस समाधान में कुछ (सरल) निर्माण शामिल हैं। सवाल में, चलोP=Pij,1i,jn एक श्रृंखला के लिए एक संक्रमण मैट्रिक्स हो P। जब चेन राज्य में हैi, Pij राज्य के लिए एक संक्रमण की संभावना देता है j। एक अवशोषित राज्य संभावना के साथ खुद को संक्रमण बनाता है1

  1. कोई भी राज्य iपंक्ति को प्रतिस्थापित करने पर अवशोषित किया जा सकता हैPi=(Pij,j=1,2,,n) एक संकेतक वेक्टर द्वारा (0,0,,0,1,0,,0) के साथ 1 स्थिति में i
  2. कोई भी सेट Aनई श्रृंखला बनाकर अवशोषित राज्यों का विलय किया जा सकता हैP/A किसके राज्य हैं {i|iA}{A}। संक्रमण मैट्रिक्स द्वारा दिया जाता है

    (P/A)ij={PijiA,jAkAPikiA,j=A0i=A,jA1i=j=A.

    इसके कॉलम को समेटना है P तदनुसार A और पंक्तियों को बदलने के अनुरूप हैं A एक एकल पंक्ति द्वारा जो खुद को एक संक्रमण बनाता है।

  3. दो श्रृंखलाओं का उत्पादP राज्यों पर SP तथा Q राज्यों पर SQ, संक्रमण मेट्रिसेस के साथ P तथा Q, क्रमशः, राज्यों पर एक मार्कोव श्रृंखला है SP×SQ={(p,q)|pSP,qSQ} संक्रमण मैट्रिक्स के साथ

    (PQ)(i,j),(k,l)=PikQjl.

    वास्तव में, उत्पाद श्रृंखला दो श्रृंखलाओं को समानांतर में चलाता है, अलग-अलग ट्रैकिंग जहां प्रत्येक है, और स्वतंत्र रूप से संक्रमण कर रहा है।


एक साधारण उदाहरण इन निर्माणों को स्पष्ट कर सकता है। मान लीजिए कि पॉली एक मौका लेकर एक सिक्का उछाल रहा हैpलैंडिंग के प्रमुख। वह ऐसा करने की योजना बना रही है, जब तक कि वह एक सिर का अवलोकन न कर ले। सिक्का लंघन प्रक्रिया के लिए राज्य हैंSP={T,H} सबसे हाल के फ्लिप के परिणामों का प्रतिनिधित्व: T पूंछ के लिए, Hप्रमुखों के लिए। प्रमुखों को रोकने की योजना बनाकर, पोली निर्माण करके पहला निर्माण करेगीHएक अवशोषित अवस्था। परिणामी परिवर्तन मैट्रिक्स है

P=(1pp01).

यह एक यादृच्छिक स्थिति में शुरू होता है (1p,p) पहले टॉस द्वारा दिया गया।

पोली के साथ समय में, क्विंसी एक उचित सिक्का टॉस करेगा। वह एक बार में दो सिर देखने के बाद रुकने की योजना बनाता है। इसलिए उनकी मार्कोव श्रृंखला को पूर्ववर्ती परिणाम के साथ-साथ वर्तमान परिणाम का भी ध्यान रखना है। दो सिर और दो पूंछ के चार ऐसे संयोजन हैं, जिन्हें मैं "TH", उदाहरण के लिए, जहां पहला अक्षर पिछले परिणाम है और दूसरा अक्षर वर्तमान परिणाम है। क्विंसी बनाने के लिए निर्माण (1) लागू होता है।HHएक अवशोषित अवस्था। ऐसा करने के बाद, उसे पता चलता है कि उसे वास्तव में चार राज्यों की आवश्यकता नहीं है: वह अपनी श्रृंखला को तीन राज्यों तक सरल बना सकता है:T इसका मतलब है कि वर्तमान परिणाम पूंछ रहा है, H इसका मतलब है कि वर्तमान परिणाम प्रमुख हैं, और Xइसका मतलब है कि अंतिम दो परिणाम दोनों प्रमुख थे - यह अवशोषित अवस्था है। संक्रमण मैट्रिक्स है

Q=(1212012012001).

उत्पाद श्रृंखला छह राज्यों पर चलती है: (T,T),(T,H),(T,X);(H,T),(H,H),(H,X)। संक्रमण मैट्रिक्स का एक टेंसर उत्पाद हैP तथा Qऔर बस आसानी से गणना की जाती है। उदाहरण के लिए,(PQ)(T,T),(T,H) मौका है कि पोली से एक संक्रमण बनाता है T सेवा T और, एक ही समय में (और स्वतंत्र रूप से), क्विंसी से एक संक्रमण बनाता है T सेवा H। पूर्व का एक मौका है1p और बाद का मौका 1/2। क्योंकि जंजीरें स्वतंत्र रूप से चलाई जाती हैं, वे संभावना कई गुना अधिक होती हैं(1p)/2। पूर्ण संक्रमण मैट्रिक्स है

PQ=(1p21p20p2p201p201p2p20p2001p00p0001212000012012000001).

यह दूसरी मैट्रिक्स के अनुरूप ब्लॉक के साथ ब्लॉक मैट्रिक्स रूप में है Q:

PQ=(P11QP12QP21QP22Q)=((1p)QpQ0Q).

पोली और क्विंसी यह देखने के लिए प्रतिस्पर्धा करते हैं कि कौन पहले अपना लक्ष्य हासिल करेगा। जब भी कोई संक्रमण पहली बार किया जाता है तो विजेता पोली होगा(H,*) कहाँ पे * नहीं है X; जब भी कोई संक्रमण पहली बार किया जाता है तो विजेता क्विंसी होगा(T,X); और यदि उनमें से किसी एक से पहले संक्रमण हो सकता है(H,X), परिणाम एक ड्रा होगा। ट्रैक रखने के लिए, हम राज्यों को बनाएंगे(H,T) तथा (H,H)दोनों अवशोषित (निर्माण के माध्यम से (1)) और फिर उन्हें विलय (निर्माण के माध्यम से (2))। राज्यों द्वारा आदेशित परिणामी रूपांतरण मैट्रिक्स(T,T),(T,H),(T,X),{(H,T),(H,H)},(H,X) है

R=(1p21p20p01p201p2p2p2001000001000001).

पोली और क्विंसी द्वारा एक साथ पहली बार फेंकने के परिणाम राज्य होंगे (T,T),(T,H),(T,X),{(H,T),(H,H)},(H,X) संभावनाओं के साथ μ=((1p)/2,(1p)/2,0,p,0), क्रमशः: यह प्रारंभिक अवस्था है, जिस पर श्रृंखला शुरू की जाती है।

के रूप में सीमा में है n,

μRn11+4pp2(0,0,(1p)2,p(5p),p(1p)).

इस प्रकार तीन अवशोषित राज्यों की सापेक्ष संभावनाएं (T,X),{(H,T),(H,H)},(H,X) (क्विंसी जीत, पोली जीत का प्रतिनिधित्व करते हैं, वे आकर्षित करते हैं) (1p)2:p(5p):p(1p)

आकृति

के कार्य के रूप में p (मौका है कि पोली के थ्रो में से कोई भी प्रमुख होगा), लाल वक्र प्लॉट पॉली के जीतने की संभावना, ब्लू वक्र प्लॉट्स क्विनसी के जीतने की संभावना, और गोल्ड वक्र प्लॉट ड्रॉ का मौका देता है।


1
बहुत साफ उदाहरण, इसके लिए धन्यवाद। मैं अभी भी उन्हें अपने लिए देखने के लिए विवरणों पर काम कर रहा हूं। बस एक सवाल: यहां हमने दो घटनाओं (पोली और क्विंसी थ्रो) को एक साथ ग्रहण किया, अगर हम उन्हें अनुक्रमिक बना देते हैं, या फिर हर बार यादृच्छिक रूप से चुना जाता है जो अगली बार फेंक देंगे?
user929304

1
@ user929304 आपको अलग-अलग उत्तर मिलेंगे, संभवतः काफी हद तक। उदाहरण के लिए, मान लीजिए कि P और Q एक श्रृंखला चला रहे हैं, जिसमें राज्यों को A और B में विभाजित किया जाता है, जहां A से B तक के सभी संक्रमण होते हैं और B से A तक सभी जाने जाते हैं। P और Q दोनों A में राज्यों में शुरू होते हैं। उत्पाद श्रृंखला वे दोनों एक साथ ए और बी के बीच वैकल्पिक करते हैं, लेकिन अनुक्रमिक और यादृच्छिक-विकल्प श्रृंखला उस अपरिवर्तनीय पैटर्न को तोड़ते हैं।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.