गणना में संभाव्यता घनत्व कार्यों का उपयोग। दूसरे शब्दों में ऐसे समीकरणों का मूल्यांकन कैसे करें।
मुझे लगता है कि आप अभी भी एक लगातार दृष्टिकोण से सोच रहे हैं: यदि आप एक बिंदु अनुमान की तलाश कर रहे हैं, तो पीछे यह आपको नहीं देगा। आप पीडीएफ डालते हैं, आप पीडीएफ निकालते हैं। आप अपने पीछे के वितरण से आंकड़ों की गणना करके बिंदु अनुमान प्राप्त कर सकते हैं, लेकिन मैं इसे थोड़ा सा प्राप्त करूंगा।
मुझे पोस्टर्स बनाम पोस्टर्स की अवधारणा मिलती है और समझ में आता है कि मैन्युअल रूप से टेबल का उपयोग करके उन्हें कैसे लागू किया जाए। मुझे लगता है (मुझे लगता है!) कि पी माना जाता जनसंख्या अनुपात या संभावना का प्रतिनिधित्व करता है।
के रूप में एक ही बात है: वे दोनों पीडीएफ़ कर रहे हैं। केवल पारंपरिक रूप से यह बताने के लिए उपयोग किया जाता है कि विशेष PDF एक पूर्व घनत्व है।π(x)πp(x)π
मुझे संदेह है कि आपको पुजारी और पोस्टएयर नहीं मिलते हैं, जैसा कि आप सोचते हैं कि आप ऐसा करते हैं, तो आइए इसे बेसेनियन सांख्यिकी के मूल आधार पर वापस करते हैं: विषय संभावित ।
विषय संभावित में एक सोचा प्रयोग
मान लीजिए कि मैं आपको एक सिक्का पेश करता हूं और आपसे पूछता हूं कि आपको लगता है कि यह सिक्का एक उचित सिक्का है या नहीं। आपने बहुत से लोगों को संभावना वर्ग में अनुचित सिक्कों के बारे में बात करते सुना है, लेकिन आपने वास्तव में वास्तविक जीवन में कभी नहीं देखा है, इसलिए आप जवाब देते हैं, "हाँ, निश्चित रूप से, मुझे लगता है कि यह एक उचित सिक्का है।" लेकिन, यह तथ्य कि मैं आपसे यह प्रश्न पूछ रहा हूं, आपको थोड़ा-बहुत बंद कर देता है, इसलिए यद्यपि आपका अनुमान है कि यह उचित है, तो आप वास्तव में आश्चर्यचकित नहीं होंगे यदि यह नहीं था। बहुत कम हैरानी की बात है अगर आपको यह सिक्का आपकी जेब बदलने में मिला (क्योंकि आप मानते हैं कि यह सभी वास्तविक मुद्रा है, और आपको वास्तव में मुझ पर भरोसा नहीं है क्योंकि अब मैं संदिग्ध अभिनय कर रहा हूं)।
अब, हम कुछ प्रयोग चलाते हैं। 100 फ़्लिप के बाद, सिक्का 53 हेड्स वापस देता है। आप बहुत अधिक आश्वस्त हैं कि यह एक उचित सिक्का है, लेकिन आप अभी भी इस संभावना के लिए खुले हैं कि यह नहीं है। अंतर यह है कि अब आप बहुत आश्चर्यचकित होंगे अगर यह सिक्का किसी तरह के पूर्वाग्रह से बाहर निकला।
हम कैसे अपने पूर्व और पीछे विश्वासों यहाँ विशेष रूप से संभावना है कि सिक्का सिर (जिसे हम निरूपित जाएगा दिखाएगा के बारे में प्रतिनिधित्व कर सकते हैं,, )? एक frequentist की स्थापना में, अपने पूर्व विश्वास - अपने शून्य परिकल्पना - जो है θ = 0.5 । प्रयोग चलाने के बाद, आप अशक्त को अस्वीकार करने में सक्षम नहीं हैं, और इसलिए आप इस धारणा के साथ जारी रखते हैं कि हां, सिक्का संभवतः उचित है। लेकिन हम आपके विश्वास में बदलाव को कैसे रोकते हैं कि सिक्का उचित है? प्रयोग के बाद आप इस स्थिति में होते हैं कि आप शर्त लगाते हैं कि सिक्का उचित है, लेकिन प्रयोग से पहले आप थकाऊ होंगे।θθ=0.5
बायेसियन सेटिंग में, आप संभावनाओं को स्केलर मानों के रूप में नहीं बल्कि यादृच्छिक चर के रूप में कार्य करते हुए प्रस्तावों पर अपना विश्वास अतिक्रमण करते हैं। इसके बजाय कह के हम कहते हैं θ ~ एन ( 0.5 , σ 2 ) , और इस तरह पीडीएफ के विचरण में हमारे विश्वास को संपुटित। हम एक उच्च विचरण सेट करते हैं, हम कह रहे हैं, "मुझे लगता है कि संभावना 0.5 है, लेकिन अगर संभावना मैं वास्तव में दुनिया में निरीक्षण तक इस मूल्य से दूर है मैं हैरान नहीं किया जाएगा। मुझे लगता है कि θ = 0.5θ=0.5θ∼N(0.5,σ2)θ=0.5, लेकिन स्पष्ट रूप से मैं वास्तव में निश्चित नहीं हूं। "कम विचरण सेट करके, हम कह रहे हैं," न केवल मुझे विश्वास है कि संभावना 0.5 है, लेकिन मुझे बहुत आश्चर्य होगा यदि प्रयोग एक मूल्य प्रदान करता है जो बहुत करीब नहीं है । "इसलिए, इस उदाहरण में जब आप प्रयोग शुरू करते हैं तो आपके पास उच्च विचरण के साथ एक पूर्व होता है। आपके पूर्व में पुष्टि करने वाले डेटा प्राप्त करने के बाद, पूर्व का अर्थ समान रहता था, लेकिन विचरण बहुत संकीर्ण हो गया था।" θ = 0.5 पहले की तुलना में प्रयोग चलाने के बाद बहुत अधिक है।θ=0.5θ=0.5
तो हम गणना कैसे करते हैं?
हम पीडीएफ के साथ शुरू करते हैं, और हम पीडीएफ के साथ समाप्त होते हैं। जब आपको एक बिंदु अनुमान की रिपोर्ट करने की आवश्यकता होती है, तो आप अपने पिछले वितरण के माध्य, माध्य या मोड जैसे आंकड़ों की गणना कर सकते हैं (आपके नुकसान फ़ंक्शन के आधार पर, जो मुझे अब नहीं मिलेगा। चलो बस इस मतलब के साथ रहें)। यदि आपके पास अपने पीडीएफ के लिए एक बंद फॉर्म समाधान है, तो संभवतः इन मूल्यों को निर्धारित करना तुच्छ होगा। यदि पश्च भाग जटिल है, तो आप अपने द्वारा लिए गए नमूने से अपने पिछले और व्युत्पन्न आँकड़ों से नमूना लेने के लिए MCMC जैसी प्रक्रियाओं का उपयोग कर सकते हैं।
उदाहरण में जहां आपके पास एक बीटा पूर्व और एक द्विपद संभावना है, पश्च की गणना बहुत साफ गणना में कम हो जाती है। दिया हुआ:
- पहले: θ∼Beta(α,β)
- संभावना: X|θ∼Binomial(θ)
तब पीछे करने के लिए कम हो जाता है:
- पोस्टीरियर: θ|X∼Beta(α+∑ni=1xi,β+n−∑ni=1xi)
यह किसी भी समय होगा जब आपके पास एक बीटा पूर्व और एक द्विपद संभावना है, और यही कारण है कि डीजेई द्वारा प्रदान की गई गणना में स्पष्ट होना चाहिए । जब एक विशेष पूर्व-संभावना मॉडल हमेशा एक ऐसा पश्च देता है जिसमें पूर्व की तरह समान वितरण होता है, तो पूर्व और संभावना के लिए उपयोग किए जाने वाले वितरण के प्रकारों के बीच संबंध को कंजुगेट कहा जाता है । कर रहे हैं वितरण के कई जोड़े के संयुग्म रिश्ते हैं कि, और conjugacy बहुत बार सरल गणना के Bayesians द्वारा आपूर्तित है। एक विशेष संभावना को देखते हुए, आप पहले से एक संयुग्म का चयन करके अपने जीवन को बहुत आसान बना सकते हैं (यदि कोई मौजूद है और आप अपनी पसंद का औचित्य साबित कर सकते हैं)।
मेरा मानना है कि बीटा (1,1) एक पीडीएफ को संदर्भित करता है जहां माध्य 1 है और स्टदेव 1 है?
सामान्य वितरण के सामान्य पैरामीटर में, दो पैरामीटर वितरण के माध्य और मानक विचलन को दर्शाते हैं। लेकिन यह है कि हम सामान्य वितरण को कैसे मापते हैं। अन्य प्रायिकता वितरण को बहुत अलग तरीके से परिचालित किया जाता है।
Beta(α,β)αβ
XE[X]var[X]∼Beta(α,β)=αα+β=αβ(α+β)2(α+β+1)
जैसा कि आप स्पष्ट रूप से देख सकते हैं, माध्य और विचरण इस वितरण के मानकीकरण का हिस्सा नहीं हैं, लेकिन उनके पास बंद समाधान हैं जो इनपुट मापदंडों के सरल कार्य हैं।
Beta(1,1)Uniform(0,1)