भिन्नता संबंधी आविष्कार, केएल विचलन के लिए सच्चे आवश्यकता होती है


12

मेरे (बहुत मामूली) के लिए एक अनुमान लगाने के लिए, परिवर्तन संबंधी अनुमान की समझ में एक की कोशिश करता अज्ञात वितरण एक वितरण का पता लगाकर निम्न का अनुकूलन:pq

KL(p||q)=xp(x)logp(x)q(x)

जब भी मैं परिवर्तनशील अनुमान को समझने में समय लगाता हूं तो मैं इस सूत्र को मारता रहता हूं और मदद नहीं कर पाता, लेकिन ऐसा महसूस करता हूं कि मुझे बात याद आ रही है। ऐसा लगता है जैसे मुझे गणना करने के लिए जानना आवश्यक है । लेकिन पूरे बिंदु मैं इस वितरण पता नहीं था ।pKL(p||q)p

यह सटीक बिंदु है जो मुझे हर बार जब मैं कुछ वैरिएबल पढ़ने की कोशिश कर रहा होता है, तो मुझे बुरा लगता है। मुझे किसकी याद आ रही है?

संपादित करें :

मैं @wij के उत्तर के परिणामस्वरूप यहां कुछ अतिरिक्त टिप्पणियां जोड़ूंगा, मैं और अधिक सटीक होने का प्रयास करूंगा।

जिन मामलों में मेरी दिलचस्पी है, उन पर विचार करना वास्तव में पूरी तरह से उचित लगता है;

p(θ|D)=p(D|θ)p(θ)p(D)p(D|θ)p(θ)

इस स्थिति में मुझे पता चल सकता है कि को आनुपातिक रूप से कैसा दिखना चाहिए क्योंकि मैंने और लिए एक मॉडल विकल्प बनाया होगा । क्या मैं तब यह कहने में सही हो जाऊंगा कि मुझे फिर एक पारिवारिक वितरण लेने की आवश्यकता है [गॉसियन कहने देता है] जैसे कि अब मैं अनुमान लगा सकता हूं ।ऐसा महसूस होता है कि इस मामले में मैं एक गैर-सामान्यीकृत करीब होने की कोशिश कर रहा हूं । क्या ये सही है?pp(D|θ)p(θ)qKL(p(θ|D)||q)p(D|θ)p(θ)

यदि ऐसा है, तो ऐसा लगता है कि मैं मान रहा हूं कि मेरा पीछे का हिस्सा एक सामान्य वितरण है और मैं केवल विचलन के संबंध में इस वितरण के लिए संभावित मूल्यों को खोजने की कोशिश करता हूं ।KL

जवाबों:


7

मुझे लगता है कि आप को पूरी तरह से अज्ञात वस्तु मानते हैं । मुझे नहीं लगता कि यह मामला है। यह शायद आपने याद किया।p

मान लें कि हम (iid) का निरीक्षण करते हैं और हम का अनुमान चाहते हैं, जहां हम मान लेते हैं कि लिए और मॉडल द्वारा निर्दिष्ट किए गए हैं। बायस नियम से,Y={yi}i=1np(x|Y)p(y|x)p(x)xRd

p(x|Y)=p(x)p(Y)p(Y|x)=p(x)p(Y)i=1np(yi|x).

पहला अवलोकन यह है कि हम पश्च वितरण बारे में कुछ जानते हैं । यह ऊपर दिया गया है। आमतौर पर, हम सिर्फ इसके नॉर्मलाइज़र नहीं जानते हैं । यदि संभावना बहुत जटिल है, तो हम कुछ जटिल वितरण समाप्त करते हैं ।p(x|Y)p(Y)p(y|x)p(x|Y)

दूसरी बात जो कि वैधानिक आक्षेप करना संभव बनाती है, वह यह है कि इस रूप में एक बाधा है कि ले सकता है। बिना किसी अड़चन के, होगा जो आमतौर पर होता है । आमतौर पर, को घातीय परिवार के चुने हुए सबसेट में रहना माना जाता है। उदाहरण के लिए, यह पूरी तरह से कारक गौसियन वितरणों का परिवार हो सकता है अर्थात, । यह पता चला है कि यदि यह आपका बाधा सेट है, तो प्रत्येक घटक द्वारा दिया गया हैqargminqKL(p||q)pqqQ={i=1dqi(xi)each qi is a one-dimensional Gaussian}q

qiexp(Ejiqjlogp(x,Y)),

जहाँसटीक सूत्र ज्यादा मायने नहीं रखता है। बिंदु यह है कि अनुमानित वास्तविक के ज्ञान पर निर्भर होकर पाया जा सकता है , और उस रूप पर अनुमान जो अनुमानित को लेना चाहिए।p(x,Y)=p(x)i=1np(yi|x).qpq

अपडेट करें

निम्नलिखित प्रश्न में अद्यतन किए गए भाग का उत्तर देना है। मुझे बस एहसास हुआ कि मैं बारे में सोच रहा हूं । मैं हमेशा सही मात्रा के लिए उपयोग करेगा , और लगभग एक के लिए । वैरिएबल इंट्रेंस या वैरिएबल बेयस में, द्वारा दिया जाता हैKL(q||p(x|Y))pqq

q=argminqQKL(q||p(x|Y)).

ऊपर के रूप में बाधा सेट साथ, समाधान पहले दिया गया है। अब अगर आप सोच रहे हैंQ

q=argminqQKL(p(x|Y)||q),

for को घातीय परिवार का सबसेट माना जाता है , फिर इस अनुमान को प्रत्याशा प्रसार (EP) कहा जाता है । इस मामले में का हल एक ऐसा है कि इसका क्षण मेल खाता है ।Qqp(x|Y)

किसी भी तरह से, आप यह कहने में सही हैं कि अनिवार्य रूप से आप कुछ फार्म लेने के लिए विवश किए गए वितरण द्वारा केएल अर्थ में सही पीछे वितरण को अनुमानित करने की कोशिश करते हैं ।q


मैं इसके साथ बहस नहीं कर सकता। मुझे लगता है कि इस पर मेरी खुद की चमक सहित अधिकांश स्पष्टीकरण हैं।
पाडर कोयल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.