लाप्लास स्मूथिंग और डिरिचलेट से पहले


11

लाप्लास स्मूदी (या एडिटिव स्मूदी) के विकिपीडिया लेख पर, यह कहा जाता है कि एक बायसियन दृष्टिकोण से,

यह पूर्ववर्ती के रूप में पैरामीटर साथ एक सममित डिरिचलेट वितरण का उपयोग करके, पीछे के वितरण के अपेक्षित मूल्य से मेल खाता है ।α

मैं हैरान हूं कि वास्तव में यह कैसे सच है। क्या कोई मुझे यह समझने में मदद कर सकता है कि वे दो चीजें कैसे समान हैं?

धन्यवाद!

जवाबों:


10

ज़रूर। यह अनिवार्य रूप से अवलोकन है कि ड्यूरिच वितरण बहुराष्ट्रीय वितरण से पहले एक संयुग्म है । इसका मतलब है कि उनके पास एक ही कार्यात्मक रूप है। लेख में इसका उल्लेख है, लेकिन मैं सिर्फ इस बात पर जोर दूंगा कि यह बहुराष्ट्रीय नमूनाकरण मॉडल से आता है। तो, यह करने के लिए नीचे हो रही है ...

अवलोकन पोस्टीरियर के बारे में है, इसलिए चलो कुछ डेटा, को प्रस्तुत करते हैं, जो कि अलग-अलग आइटम हैं। हम नमूने देखें। हम मान लेंगे कि को एक अज्ञात वितरण से तैयार किया गया है (जिस पर हम -simplex पर पहले एक डालेंगे)।कश्मीर एन = Σ कश्मीर मैं = 1 एक्स मैं एक्स π डी मैं आर ( α ) कश्मीरxKN=i=1KxixπDir(α)K

दिए गए और डेटा की पिछली संभावना हैअल्फा एक्सπαx

p(π|x,α)=p(x|π)p(π|α)

संभावना, , बहुपद वितरण है। अब आइये पीडीएफ लिखते हैं:p(x|π)

p(x|π)=N!x1!xk!π1x1πkxk

तथा

p(π|α)=1B(α)i=1Kπiα1

जहाँ । गुणा, हम पाते हैं कि,B(α)=Γ(α)KΓ(Kα)

p(π|α,x)=p(x|π)p(π|α)i=1Kπixi+α1.

दूसरे शब्दों में, पोस्टीरियर भी डिरिचलेट है। प्रश्न पश्च माध्य के बारे में था। चूँकि पोस्टीरियर ड्यूरिचलेट है, हम उसे खोजने के लिए एक डिरिचलेट के माध्यम के लिए फार्मूला लागू कर सकते हैं,

E[πi|α,x]=xi+αN+Kα.

उम्मीद है की यह मदद करेगा!


p(π|α,x)=p(x|π)p(π|α)/p(x|α), इसलिए यह कहना गलत नहीं है किवे संबंध में आनुपातिक हैं , लेकिन एक समानता लिखना मेरे विचार से सच नहीं है। p(π|α,x)=p(x|π)p(π|α)?π
-'१६

मैं लंबे समय से इस बारे में उलझन में था, और मैं अपना अहसास साझा करना चाहता हूं। Dirichlet द्वारा लाप्लास स्मूथिंग के लिए प्रेरित करने वाले ये लोग MAP नहीं बल्कि पोस्टीरियर मीन का उपयोग कर रहे हैं। सादगी के लिए, बीटा वितरण ( का सबसे सरल मामला) मान लें कि पीछे का मतलब जबकि एमएपी है । इसलिए अगर कोई कहता है कि 1 से 1 अंश और 2 को हर से जोड़ने के लिए मेल खाता है, यह इसलिए है क्योंकि वे पोस्टीरियर मीन का उपयोग कर रहे हैं। α+nsuccessα+β+nsuccess+nfailuresα+nsuccess1α+β+nsuccess+nfailures2α=β=1
RMurphy

0

एक साइड नोट के रूप में, मैं उपरोक्त व्युत्पत्ति में एक और बिंदु जोड़ना चाहूंगा, जो वास्तव में मुख्य प्रश्न से संबंधित नहीं है। हालांकि, बहुराष्ट्रीय वितरण पर डिरिचलेट के पुजारियों के बारे में बात करते हुए, मैंने यह उल्लेख करने के लायक सोचा कि यदि उपद्रव चर के रूप में हम संभावनाओं को लेने जा रहे हैं तो संभावना फ़ंक्शन का रूप क्या होगा।

के रूप में इसे सही ढंग से sydeulissie द्वारा द्वारा बताया गया है, है आनुपातिक करने के लिए । अब यहाँ मैं गणना करना चाहूंगा ।p(π|α,x)i=1Kπixi+α1p(x|α)

p(x|α)=i=1Kp(x|πi,α)p(π|α)dπ1dπ2...dπK

गामा फ़ंक्शंस के लिए एक अभिन्न पहचान का उपयोग करते हुए, हमारे पास:

p(x|α)=Γ(Kα)Γ(N+Kα)i=1KΓ(xi+α)Γ(α)

श्रेणीबद्ध डेटा के लिए संभावना की उपरोक्त व्युत्पत्ति मामलों के लिए इस डेटा से निपटने के अधिक मजबूत तरीके का प्रस्ताव करती है कि नमूना आकार इतना बड़ा नहीं है।N

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.