मैंने इन नोटों को यह पता लगाने में बहुत मददगार पाया कि पूरक सामग्री में क्या चल रहा था।
मैं इन सवालों के निरंतरता के लिए आदेश से थोड़ा बाहर का जवाब दूँगा।
पहला: ऐसा क्यों है
θ( 0 )≠ θ( 1 )
कारण यह है कि हमारे फंक्शन को इस तरह चुना जाता है कि यह हमारे शुरुआती अनुमान the के बिंदु पर 2 होने की घटना के साथ, कम से कम या बराबर होने की गारंटी है । यदि हमारी पूर्व धारणाएँ सही प्रारंभिक अनुमान थीं तो आप सही होंगे और अपरिवर्तित रहेंगे। लेकिन हम बनाए गए फ़ंक्शन में उच्च मान पा सकते हैं , इसलिए the लिए पैरामीटर का हमारा अगला पुनरावृत्ति हमारे मूल से अधिक होने की गारंटी है। लॉग ( पी ( एक्स , θ ) ) θ ( 0 ) θ ( 1 ) जी 0 θजी0लॉग( पी( x ; θ ) )θ( 0 )θ( 1 )जी0θ
दूसरा: असमानता तंग क्यों है जब
क्यू ( z)) = पी( z)| x; θ)
इस बारे में फुटनोट्स में एक संकेत है जहां यह कहता है,
समानता रखती है अगर और केवल अगर यादृच्छिक चर संभावना 1 के साथ स्थिर है (यानी, )y= ई[ य]
जिसका अर्थ है कि के बारे में हमारी पसंद बनाता है निरंतर। इसे देखने के लिए, इस पर विचार करें:क्यूपी( x , z; θ )क्यू ( z))
पी( x , z; θ ) = पी( z)| x; θ)पी( x ; θ )
जो हमारा अंश बनाता है
पी( z)| x; θ)पी( x ; θ )पी( z)| x; θ)= पी( x ; θ )
तो क्या है और क्या यह स्थिर है? खैर, विचार करें कि हम से अधिक रकम की गणना कर रहे हैं जिसके लिए यह शब्द स्वतंत्र (स्थिर) है। आइए इसे रूप में और यह समीकरण बन जाता है:पी( x ; θ )zC
log(∑zQ(z)C)≥∑zQ(z)log(C)
यहाँ से हम बहुत जल्दी देख सकते हैं कि 2 भुजाएँ समान हैं, जैसे कि एक स्थिरांक की अपेक्षा यह होगी कि निरंतर कोई भी भार ( )Q(z)
अंत में: क्या हैgt
मेरे द्वारा लिंक किए गए नोट्स में दिए गए उत्तर पूरक नोटों में से एक से थोड़ा अलग है, लेकिन वे केवल एक निरंतरता से भिन्न होते हैं और हम इसे अधिकतम कर रहे हैं इसलिए यह परिणाम का नहीं है। नोटों में एक (व्युत्पत्ति के साथ) है:
gt(θ)=log(P(x|θ(t)))+∑zP(z|x;θ(t))log(P(x|z;θ)P(z|θ)P(z|x;θ(t))P(x|θ(t)))
पूरक नोटों में इस जटिल सूत्र की लंबाई के बारे में बात नहीं की गई है, शायद इसलिए कि इनमें से बहुत सारे शब्द ऐसे स्थिरांक होंगे जो अधिकतम होने पर दूर फेंक दिए जाते हैं। यदि आप इस बात में रुचि रखते हैं कि हम यहां पहले स्थान पर कैसे पहुंचे, तो मैं उन नोट्स को सुझाता हूं जिन्हें मैंने लिंक किया था।
दूसरे प्रश्न के उत्तर में किए गए एक समान तर्क का उपयोग करते हुए, लॉग में शब्द लिए 1 के बराबर है, इसलिए योग शब्द दूर हो जाता है और अपेक्षा के अनुसार।जी टी ( θ ( टी ) ) = लॉग ऑन पी ( एक्स | θ ( टी ) )gt(θ(t))gt(θ(t))=logP(x|θ(t))