(यह उत्तर आपके द्वारा दिए गए दूसरे लिंक का उपयोग करता है।)
L[θ|X]=Pr[X|θ]=∑ZPr[X,Z|θ]
θ=(θA,θB)X=(X1,…,X5)XiZ=(Z1,…,Z5)
हम अधिकतम संभावना अनुमानक खोजना चाहते हैं । एक्सपेक्टेशन-मैक्सिमाइजेशन (ईएम) एल्गोरिदम एक ऐसी विधि है जो कम से कम (कम से कम स्थानीय) को खोजने की है । यह सशर्त अपेक्षा को खोजने के द्वारा काम करता है, जिसका उपयोग तब अधिकतम करने के लिए किया जाता है । विचार यह है कि
प्रत्येक पुनरावृत्ति में लगातार अधिक संभावना (यानी अधिक संभावित) को खोजने से हम लगातार बढ़ाएंगे, जिससे फ़ंक्शन की संभावना बढ़ जाती है। ईएम-आधारित एल्गोरिथ्म को डिजाइन करने से पहले तीन चीजें हैं जिन्हें करने की आवश्यकता है। θ θθपीआर[एक्स,जेड| θ]θ^θ^θθपीआर [ एक्स, जेड| θ]
- मॉडल का निर्माण
- मॉडल के तहत सशर्त उम्मीद की गणना (ई-स्टेप)
- हमारे (M-Step) के वर्तमान अनुमान को अपडेट करके हमारी संभावना को अधिकतम करेंθ
मॉडल का निर्माण
इससे पहले कि हम ईएम के साथ आगे बढ़ें हमें यह पता लगाने की आवश्यकता है कि वास्तव में यह क्या है हम कंप्यूटिंग कर रहे हैं। ई-चरण में हम the लिए अपेक्षित मूल्य की गणना कर रहे हैं । तो क्या यह मूल्य है, वास्तव में? ध्यान रखें कि
इसका कारण यह है कि हमारे पास खाते के लिए 5 प्रयोग हैं, और हम नहीं जानते कि प्रत्येक में किस सिक्के का उपयोग किया गया था। असमानता कारण हैलॉग इन Pr [ X , Z | θ ]लॉगपीआर [ एक्स, जेड| θ]लॉग
लॉगपीआर [ एक्स, जेड| θ]= ∑मैं = १5लॉगΣसी∈ { एक , बी }पीआर [ एक्समैं, जेडमैं= सी| θ]= ∑मैं = १5लॉगΣसी∈ { एक , बी }पीआर [ जेडमैं= सी| एक्समैं, Θ ] ⋅ पीआर [ एक्समैं, जेडमैं= सी|θ ]पीआर[ जेडमैं= सी|एक्समैं, Θ ]≥ Σमैं = १5Σसी∈ { एक , बी }पीआर [ जेडमैं= सी| एक्समैं, Θ ] ⋅ लॉगपीआर [ एक्समैं, जेडमैं= सी| θ ]पीआर [ जेडमैं= सी| एक्समैं, Θ ]।
लॉगअवतल होना और जेनसन की असमानता को लागू करना। हमें निम्न बाउंड की आवश्यकता होती है, इसलिए हम सीधे आर्गे अधिकतम की गणना मूल समीकरण से नहीं कर सकते हैं। हालाँकि हम इसे अंतिम निचले बाउंड के लिए गणना कर सकते हैं।
अब क्या है? यह संभावना है कि हम सिक्का को प्रयोग और । सशर्त संभावनाओं का उपयोग करते हुए, हमारे पाससी एक्स मैं θ पीआर [ जेड मैं = सी | एक्स मैं , θ ] = पीआर [ एक्स मैं , जेड मैं = सी | θ ]Pr[Zi=C|Xi,θ]CXiθ
Pr[Zi=C|Xi,θ]=Pr[Xi,Zi=C|θ]Pr[Xi|θ].
जबकि हमने कुछ प्रगति की है, हम अभी तक मॉडल के साथ नहीं हुए हैं। क्या संभावना है कि किसी दिए गए सिक्के ने अनुक्रम फ़्लिप किया ? दे
अब स्पष्ट रूप से केवल या की दोनों संभावनाओं के तहत संभावना है । चूँकि हमारे पास,
h i = # हेड इन X i Pr [ X i , Z i = C | θ ] = 1Xihi=#heads in Xi
Pr[Xi| θ]जेडमैं=एकजेडमैं=बीपीआर[जेडमैं=एक]=पीआर[जेडमैं=बी]=1/2
Pr[Xi,Zi=C|θ]=12⋅θhiC(1−θC)10−hi, for C∈{A,B}.
Pr[Xi|θ]Zi=AZi=BPr[Zi=A]=Pr[Zi=B]=1/2Pr[Xi|θ]=1/2⋅(Pr[Xi|Zi=A,θ]+Pr[Xi|Zi=B,θ]).
ई-कदम
ठीक है ... यह बहुत मजेदार नहीं था, लेकिन हम अब कुछ ईएम काम करना शुरू कर सकते हैं। EM एल्गोरिथ्म लिए कुछ यादृच्छिक अनुमान लगाकर शुरू होता है । इस उदाहरण में हमारे पास । हम
यह मान कागज में क्या है, के साथ है। अब हम में सिर की अपेक्षित संख्या की गणना कर सकता सिक्का से ,
सिक्का लिए एक ही काम करना, हमें मिलता है,
θ 0 = ( 0.6 , 0.5 ) पीआर [ जेड 1 = एक | एक्स 1 , θ ] = 1 / 2 ⋅ ( 0.6 5 ⋅ 0.4 5 )θθ0=(0.6,0.5)
Pr[Z1=A|X1,θ]=1/2⋅(0.65⋅0.45)1/2⋅((0.65⋅0.45)+(0.55⋅0.55))≈0.45.
X1=(H,T,T,T,H,H,T,H,T,H)AE[#heads by coin A|X1,θ]=h1⋅Pr[Z1=A|X1,θ]=5⋅0.45≈2.2.
BE[#heads by coin B|X1,θ]=h1⋅Pr[Z1=B|X1,θ]=5⋅0.55≈2.8.
हम लिए को प्रतिस्थापित करके पूंछ की संख्या के लिए समान गणना कर सकते हैं । यह और अन्य सभी मूल्यों के लिए जारी है । अपेक्षा की रैखिकता के लिए धन्यवाद, हम
h110−h1Xihi 1≤i≤5E[#heads by coin A|X,θ]=∑i=15E[#heads by coin A|Xi,θ]
एम-कदम
हाथ में हमारे अपेक्षित मानों के साथ, अब एम कदम जहाँ हम अधिकतम करना चाहते हैं आता है
हमारे अपेक्षित मानों दिया। यह सामान्य सामान्यीकरण द्वारा किया जाता है!
इसी तरह । यह प्रक्रिया ई-स्टेप और साथ फिर से शुरू होती है और तब तक जारी रहती है, जब तक कि _ अभिसरण (या कुछ स्वीकार्य थ्रेसहोल्ड) के लिए मान परिवर्तित नहीं हो जाते। इस उदाहरण में हमारे पास 10 पुनरावृत्तियों और । प्रत्येक पुनरावृत्ति में बेहतर अनुमान के कारण, का मान
बढ़ता हैθ
θ1A=E[ # सिर X पर by सिक्का ए | एक्स, Θ ]इ[ # सिर और पूंछ पर एक्स by सिक्का ए | एक्स, Θ ]= 21.321.3 + 9.6≈ 0.71।
बीθ1θθ^= θ10= ( 0.8 , 0.52 )पीआर [ एक्स, जेड| θ ]θ ।
अब इस मामले में मॉडल काफी सरल था। चीजें बहुत अधिक जटिल हो सकती हैं बहुत जल्दी, हालांकि ईएम एल्गोरिथ्म हमेशा अभिसरण करेगा, और हमेशा एक अधिकतम संभावना अनुमानक उत्पादन करेगा । यह एक स्थानीय अनुमानक हो सकता है , लेकिन इसके आस-पास प्राप्त करने के लिए हम एक अलग आरंभीकरण के साथ EM प्रक्रिया को पुनः आरंभ कर सकते हैं। हम इसे लगातार कर सकते हैं और सर्वोत्तम परिणामों को बनाए रख सकते हैं (यानी, उच्चतम अंतिम संभावना वाले लोग)।θ^