पदानुक्रमित बायेसियन मॉडल की ताकत का वर्णन करने के लिए एक अच्छा सादृश्य क्या है?


10

मैं बायेसियन आंकड़ों के लिए अपेक्षाकृत नया हूं और हाल ही में विभिन्न डेटासेट पर पदानुक्रमित बायेसियन मॉडल बनाने के लिए जेएजीएस का उपयोग कर रहा हूं। हालांकि मैं परिणामों से बहुत संतुष्ट हूं (मानक glm मॉडल की तुलना में), मुझे गैर-सांख्यिकीविदों को यह समझाने की आवश्यकता है कि मानक सांख्यिकीय मॉडल के साथ अंतर क्या है। विशेष रूप से, मैं यह बताना चाहता हूं कि एचबीएम सरल मॉडल की तुलना में क्यों और कब बेहतर प्रदर्शन करते हैं।

एक सादृश्य उपयोगी होगा, विशेष रूप से एक जो कुछ प्रमुख तत्वों को दिखाता है:

  • विषमता के कई स्तर
  • मॉडल को फिट करने के लिए अधिक कम्प्यूटेशन की आवश्यकता है
  • एक ही डेटा से अधिक "सिग्नल" निकालने की क्षमता

ध्यान दें कि उत्तर वास्तव में गैर-आँकड़े लोगों के लिए एक अनुरूप ज्ञानवर्धक होना चाहिए , न कि एक आसान और बढ़िया उदाहरण के लिए।


4
क्लासिक "आठ स्कूलों" की समस्या एचबीएम शुरू करने के लिए एक महान उम्मीदवार की तरह लगती है। andrewgelman.com/2014/01/21/…
कहना है कि मोनिका

2
@ cafe876। मैं यह नहीं देखती कि मॉडलिंग का बायसियन स्वभाव आपकी बात के लिए कैसे विशिष्ट है। क्या आपका प्रश्न वास्तव में बायेसियन पदानुक्रमित मॉडल के लिए विशिष्ट है? या बस पदानुक्रमित मॉडल के लिए?
peuhp

मेरे अनुभव से बेइपियन ढांचे से @peuhp बहुत अधिक जटिल मॉडल का अनुमान संभव बनाता है।
nassimhddd 19

जवाबों:


3

मैं उदाहरण के तौर पर कैंसर की दर (जैसा कि जॉनसन और अल्बर्ट 1999 में हूं) से संबंधित एक उदाहरण देना चाहूंगा। यह आपकी रुचि के पहले और तीसरे तत्व को स्पर्श करेगा।
इसलिए समस्या विभिन्न शहरों में कैंसर की दर की भविष्यवाणी कर रही है। मान लें कि हमारे पास विभिन्न शहरों में लोगों की संख्या और कैंसर x i के साथ मरने वालों की संख्या है । हम कैंसर की दर अनुमान लगाना चाहते कहो θ मैं । उन्हें मॉडल करने के विभिन्न तरीके हैं और जैसा कि हम उनमें से प्रत्येक के साथ समस्याओं को देखते हैं। हम देखेंगे कि कैसे विषम बेयरिंग मॉडलिंग कुछ समस्या को दूर कर सकती है। 1. एक तरह से अलग से आकलन करने के लिए है, लेकिन हम विरल डेटा समस्या से ग्रस्त होगा और कम के लिए के रूप में दरों में से एक कम हो जाएगा एन मैंNixiθमैं
एनमैं
2. विरल डेटा की समस्या को प्रबंधित करने के लिए एक और दृष्टिकोण सभी शहरों के लिए एक ही का उपयोग करना और मापदंडों को टाई करना होगा, लेकिन यह भी एक बहुत मजबूत धारणा है। 3. तो क्या किया जा सकता है सब है θ मैं की किसी तरह से समान है लेकिन यह भी शहर विशिष्ट बदलाव के साथ कर रहे हैं। तो एक इस तरह से मॉडल सकता है कि सभी θ मैं एक सामान्य वितरण से लिए गए हैं। कहो x मैं ~ बी मैं n ( एन मैं , θ मैं ) और θ मैं ~ बी टी एक ( एक ,θमैं
θमैंθमैंएक्समैं~बीमैंn(एनमैं,θमैं) एक पूर्ण संयुक्त वितरण तो होगा पी ( डी , θ , η | एन ) = पी ( η ) Π एन मैं = 1 बी मैं n ( एक्स मैं | एन मैं , θ मैं ) बी टी एक ( θ मैं | η ) जहां η = ( , बी ) । हम अनुमान लगाने के लिए की जरूरत है ηθमैं~बीटी(,)
पी(डी,θ,η|एन)=पी(η)Πमैं=1एनबीमैंn(एक्समैं|एनमैं,θमैं)बीटी(θमैं|η)η=(,)ηडेटा से। यदि इसे स्थिर किया जाता है तो सूचना बीच नहीं आएगी और वे सशर्त रूप से स्वतंत्र होंगे। लेकिन इलाज से η अज्ञात के रूप में हम कम डेटा के साथ शहरों और अधिक डेटा के साथ शहरों से सांख्यिकीय ताकत उधार अनुमति देते हैं। हाइपरपैरेटर्स में अनिश्चितता का मॉडल बनाने के लिए मुख्य विचार अधिक बेयसियन और पुजारियों पर सेटिंग करना है। इस बीच प्रभाव के प्रवाह की अनुमति देता है θ मैं 'इस उदाहरण में है।θमैंη
θमैं


धन्यवाद, यह एक बहुत अच्छा उदाहरण है, हालांकि यह एक सादृश्य नहीं है। मैं वास्तव में एक ऐसी चीज की तलाश में हूं जिसे मैं एक गैर-सांख्यिकीविद् को समझा सकता हूं।
nassimhddd

मुझे लगता है कि विभिन्न स्तरों पर साझाकरण और भिन्नता का उपयोग गैर सांख्यिकीविदों के लिए किया जा सकता है।
dksahuji

यह सच है, लेकिन यह वर्णन करने के लिए एक और अधिक सरल कहानी नहीं है?
nassimhddd

3

जब आप बीमार होते हैं, तो आप लक्षणों का निरीक्षण करते हैं लेकिन आप जो चाहते हैं वह एक निदान है। यदि आप एक चिकित्सक नहीं हैं, तो मुझे लगता है कि आप केवल निदान पा सकते हैं जो आपके लक्षणों से सबसे अच्छा मेल खाता है। लेकिन आपके लक्षणों को देखने के लिए Ph HBM क्या करती है, उनकी सापेक्ष सार्थकता, वे आपकी विभिन्न पिछली स्वास्थ्य समस्याओं, आपके परिवार में से एक, वर्तमान सामान्य बीमारियों और पर्यावरणीय स्थितियों, आपकी कमजोरी, आपकी ताकत को कैसे फिट / संबंधित करती हैं ... और फिर वह अपने ज्ञान का उपयोग करके इन सामानों का संयोजन करेगा जो आपके स्वास्थ्य की स्थिति का अनुमान लगाता है और आपको अधिक संभावित निदान देगा।

मुझे यकीन है कि यह सादृश्य जल्द ही अपनी सीमा को प्राप्त कर लेता है, लेकिन मुझे लगता है कि यह एक अच्छा अंतर्ज्ञान दे सकता है कि कोई एचबीएम से क्या उम्मीद करेगा, क्या आप? (और मुझे एक बेहतर नहीं मिला)


मुझे वह सादृश्य पसंद है! हो सकता है कि मांस को थोड़ा जोड़कर बाहर निकाला जाए, जो यह कह सकता है कि कुछ लक्षण दूसरों की तुलना में कुछ संभावित निष्कर्षों (रक्त परीक्षणों के परिणाम) के लिए अधिक सार्थक हैं (कभी-कभी मेरे बाएं बछड़े को थोड़ा सा दर्द होता है)
मिकप

अच्छा उदाहरण ... जहां मुझे लगता है कि यह कम हो जाता है, इसका मतलब यह है कि एचबीएम की ताकत अधिक जानकारी (इतिहास, परिवार, आदि) तक पहुंच में है; जबकि मैं व्यक्त करना चाहता हूं कि एचबीएम एसएएमई जानकारी के साथ अधिक परिष्कृत है। क्या आपकी कहानी को अनुकूलित करने का कोई तरीका है?
nassimhddd

@ cafe876। Thks, मुझे इसके बारे में सोचने के लिए थोड़ा समय दें।
peuhp
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.