फ्लैट, संयुग्म, और हाइपर-पुजारी। वे क्या हैं?


15

मैं वर्तमान में यांग द्वारा संगणना आणविक विकास में बायेसियन विधियों के बारे में पढ़ रहा हूं। खंड 5.2 में यह पुजारियों और विशेष रूप से गैर-सूचनात्मक / फ्लैट / अस्पष्ट / फैलाना, संयुग्मित, और हाइपर-पुजारियों के बारे में बात करता है।

यह एक निरीक्षण के लिए पूछ रहा हो सकता है लेकिन, क्या कोई इस प्रकार के पुजारियों के बीच के अंतर को समझा सकता है और यह कैसे एक विश्लेषण / निर्णय के परिणाम को प्रभावित करता है जो मैं एक बायेसियन विश्लेषण की प्रक्रिया के दौरान करूंगा?

(मैं एक सांख्यिकीविद् नहीं हूं और मैं बस बायसियन सीखने के लिए सड़क पर शुरू कर रहा हूं ताकि आम आदमी के संदर्भ में यह बेहतर हो)

जवाबों:


15

सीधे शब्दों में कहें, एक फ्लैट / गैर-सूचनात्मक पूर्व का उपयोग तब किया जाता है जब किसी को डेटा के बारे में बहुत कम / कोई जानकारी नहीं होती है और इसलिए आपके विश्लेषण के परिणामों पर इसका कम से कम प्रभाव पड़ता है (अर्थात पश्च-आक्षेप)।

संयुग्म वितरण वे होते हैं जिनके पूर्व और पश्च वितरण समान होते हैं, और पूर्व को संयुग्म पूर्व कहा जाता है। यह इसकी बीजीय उपयुक्तताओं के लिए इष्ट है , खासकर जब संभावना का घातीय परिवार (गौसियन, बीटा, आदि) के रूप में वितरण होता है । गिब्स नमूना का उपयोग करके पीछे सिमुलेशन करते समय यह बेहद फायदेमंद है।

और अंत में कल्पना करें कि एक पूर्व वितरण आपके मॉडल में एक पैरामीटर पर सेट है, हालांकि आप जटिलता / अनिश्चितता का एक और स्तर जोड़ना चाहते हैं। फिर आप पूर्वोक्त पूर्व के मापदंडों पर एक पूर्व वितरण लागू करेंगे, इसलिए हाइपर- नाम ।

मुझे लगता है कि गेलमैन के बायेसियन डेटा विश्लेषण उन लोगों के लिए एक शानदार शुरुआत है, जो बायेसियन सांख्यिकी सीखने में रुचि रखते हैं :)


1
बायेसियन डेटा विश्लेषण का दूसरा समर्थन।
साइकोरैक्स का कहना है कि मोनिका जूल

14

उच्चतम स्तर पर, हम सभी प्रकार के पुजारियों के बारे में सोच सकते हैं क्योंकि कुछ मात्रा में जानकारी निर्दिष्ट की जाती है, जो शोधकर्ता डेटा के बाहर विश्लेषण पर खुद को लाता है: डेटा को देखने से पहले, मापदंडों के कौन से मान अधिक होने की संभावना है?

बायेसियन विश्लेषण के अंधेरे युग में, जब बायेसियन इसे फ़्रीक्वेंटर्स के साथ लड़ रहे थे, तो एक धारणा थी कि शोधकर्ता पहले से संभव के रूप में विश्लेषण के लिए कम जानकारी के रूप में पेश करना चाहते हैं। तो वहाँ बहुत सारे अनुसंधान और तर्क यह समझने के लिए समर्पित थे कि कैसे, ठीक है, एक पूर्व इस तरह से "गैर-जानकारीपूर्ण" हो सकता है। बायसेनियन डेटा एनालिसिस में कहा गया है कि आज गेलमैन नॉनफॉर्मेटिव पादरियों की स्वचालित पसंद के खिलाफ तर्क देता हैवर्णन "noninformative" पूर्व के किसी भी "विशेष" गणितीय विशेषताओं के बजाय, उसके प्रति दृष्टिकोण को दर्शाता है। (इसके अलावा, शुरुआती साहित्य में एक सवाल था कि किस पैमाने पर एक गैर-सूचनात्मक है। मुझे नहीं लगता कि यह आपके प्रश्न के लिए विशेष रूप से महत्वपूर्ण है, लेकिन लगातार परिप्रेक्ष्य से इस तर्क के अच्छे उदाहरण के लिए, शुरुआत देखें गैरी किंग की, राजनीतिक पद्धति को एकीकृत करते हुए। )

पूर्व में एक "फ्लैट" एक समान रूप से इंगित करता है जहां सीमा के सभी मूल्य समान रूप से होने की संभावना है। फिर, इस बारे में तर्क दिए जाने चाहिए कि क्या ये वास्तव में गैर-सूचनात्मक हैं, क्योंकि यह निर्दिष्ट करने के बाद कि सभी मान समान रूप से, किसी तरह, जानकारी में हैं, और मॉडल कैसे पैरामीटर है के प्रति संवेदनशील हो सकता है। बेयर्स विश्लेषण में फ्लैट पुजारियों का एक लंबा इतिहास रहा है, जो कि बेयस और लाप्लास में वापस फैला है।

एक "अस्पष्ट" पूर्व में बहुत अधिक फैलता है, हालांकि जरूरी नहीं कि सपाट हो, और यह व्यक्त करता है कि मूल्यों की एक बड़ी श्रृंखला विशिष्ट श्रेणी के आसपास संभाव्यता द्रव्यमान को ध्यान केंद्रित करने के बजाय प्रशंसनीय है। अनिवार्य रूप से, यह उच्च विचरण (आपके संदर्भ में "उच्च" विचरण का अर्थ है) के साथ एक पूर्व है।

संयुग्मक पुरोहितों की सुविधाजनक विशेषता है कि, जब उचित संभावना से गुणा किया जाता है, तो वे एक बंद-रूप अभिव्यक्ति का उत्पादन करते हैं। इसका एक उदाहरण द्विपदीय संभावना से पहले बीटा है, या पॉज़ियन संभावना से पहले गामा है। इंटरनेट और विकिपीडिया पर इन सभी की सहायक तालिकाएँ हैं। घातांक परिवार इस संबंध में बेहद सुविधाजनक है।

संयुग्मक पुरोहित अक्सर अपने सुविधाजनक गुणों के कारण कुछ समस्याओं के लिए "डिफ़ॉल्ट" विकल्प होते हैं, लेकिन इसका मतलब यह नहीं है कि वे "सर्वश्रेष्ठ" हैं जब तक कि किसी को पूर्व संयुग्म के माध्यम से ज्ञान नहीं व्यक्त किया जा सकता है। अभिकलन में अग्रिम का अर्थ है कि संयुग्मता उतनी बेशकीमती नहीं है जितनी एक बार थी (cf गिब्स नमूना बनाम एनयूटीएस), इसलिए हम बहुत अधिक परेशानी के बिना गैर-मान्यता प्राप्त पुरोहितों के साथ आसानी से प्रवेश कर सकते हैं।

N(μ,σ2)μσ2μσ2


1
इसके अलावा, कभी-कभी यह स्पष्ट नहीं होता है कि, डेटा ’क्या है और 'पूर्व सूचना’ क्या है, उदाहरण के लिए मेरे उत्तर का आँकड़ा देखें ।stackexchange.com/questions/112451/…
kjetil b halvorsen
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.