अनइनफॉर्मेटिव बीटा पादरियों के बीच चयन


17

मैं एक द्विपद प्रक्रिया (हिट / मिस) के साथ काम करने के लिए बीटा वितरण के लिए बिना सूचना के पुजारियों की तलाश कर रहा हूं। पहले मैं पर उपयोग करने के बारे में सोचा या जेफरी पहले कि एक वर्दी पीडीएफ उत्पन्न, α = 0.5 , β = 0.5 । लेकिन मैं वास्तव में उन पंडितों की तलाश कर रहा हूं, जिनके बाद के परिणामों पर न्यूनतम प्रभाव पड़ता है, और फिर मैंने α = 0 , β = 0 से पहले अनुचित का उपयोग करने के बारे में सोचा । यहां समस्या यह है कि मेरा पोस्टीरियर वितरण केवल तभी काम करता है जब मेरे पास कम से कम एक हिट और एक मिस हो। इसे दूर करने के लिए मैंने तब बहुत छोटे स्थिरांक का उपयोग करने के बारे में सोचा, जैसेα=1,β=1α=0.5,β=0.5α=0,β=0, बस उस पिछड़े α औरआश्वस्त करने के लिएα=0.0001,β=0.0001α होगा > 0β>0

क्या किसी को पता है कि क्या यह दृष्टिकोण स्वीकार्य है? मुझे इन पूर्व को बदलने के संख्यात्मक प्रभाव दिखाई देते हैं, लेकिन कोई मुझे इस तरह के पुंज के रूप में छोटे स्थिरांक लगाने की व्याख्या दे सकता है?


1
बहुत सारे हिट और मिस के साथ बड़े नमूनों के लिए, इससे बहुत कम फर्क पड़ता है। छोटे नमूनों के लिए, खासकर अगर कम से कम एक हिट और एक मिस नहीं है, तो इससे बहुत फर्क पड़ता है; यहां तक ​​कि आपके "बहुत छोटे स्थिरांक" के आकार का पर्याप्त प्रभाव हो सकता है। मैं कुंजी सोचा प्रयोग सुझाव है कि आप हो सकता है के लिए पीछे की तरह क्या का एक नमूना आकार के बाद समझ में आता है : यह आप की तरह जेफरी है कि कुछ के लिए राजी हो सकता है रों पहले उचित है1
हेनरी

और एक पेपर करमान ने 1/3 और 1/3, बी
ब्योर्न

'पूर्ववर्ती परिणामों पर न्यूनतम प्रभाव' से आपका क्या अभिप्राय है? क्या तुलना?
विल

मैंने आपके प्रश्न के प्रारूपण और शीर्षक में सुधार किया है, संपादन को बदलने या बदलने के लिए स्वतंत्र महसूस कर रहा हूं।
टिम

जवाबों:


33

सबसे पहले, वहाँ कोई ऐसी चीज नहीं है जो पहले से बिना सूचना के हो । नीचे आप पांच अलग-अलग "अनइनफॉर्मेटिव" पुजारियों (प्लॉट के नीचे वर्णित) से अलग-अलग डेटा दिए गए परिणामी वितरण देख सकते हैं। जैसा कि आप स्पष्ट रूप से देख सकते हैं, "अनइनफॉर्मेटिव" पादरियों की पसंद ने पश्च वितरण को प्रभावित किया, खासकर उन मामलों में जहां डेटा ने खुद को अधिक जानकारी नहीं दी

Posteriors from uninformative priors

α=βα1,β1α=β=1α=β=1/2α=β=1/3α=β=0α=β=εε>0

αβyn

θyB(α+y,β+ny)

α,βα=β=1n

पहली नजर में, हल्डेन पूर्व, सबसे "अनइनफॉर्मेटिव" प्रतीत होता है, क्योंकि यह पीछे की ओर जाता है, जो कि अधिकतम संभावना अनुमान के बराबर है

α+yα+y+β+ny=y/n

हालांकि, यह होने पर अनुचित पश्च वितरण को जन्म देता हैy=0y=n बढ़ाता है, क्या कर्नल एट अल ने अपने स्वयं के सुझाव देने के लिए बनाया है कि पीछे के मंझले की पैदावार होती है जो अधिकतम संभावना अनुमान के जितना करीब हो, उसी समय हो सकता है उचित वितरण।

"अनइनफॉर्मेटिव" पुजारियों में से प्रत्येक के लिए और उनके खिलाफ कई तर्क हैं (देखें करमान, 2011; तुइल एट अल, 2008)। उदाहरण के लिए, जैसा कि तुइल एट अल द्वारा चर्चा की गई थी,

101 और मनाया डेटा के महत्व को दबा सकते हैं।

दूसरी ओर, छोटे डेटासेट के लिए समान पुजारियों का उपयोग करना बहुत प्रभावशाली हो सकता है (इसे छद्म गणना के संदर्भ में सोचें)। आप इस विषय पर अधिक जानकारी और चर्चा कई पत्रों और हैंडबुक में पा सकते हैं।

इसलिए क्षमा करें, लेकिन कोई भी "सर्वश्रेष्ठ", "सबसे अधिक असंवेदनशील", या "एक-आकार-फिट-सभी-पुजारी" नहीं है। उनमें से प्रत्येक मॉडल में कुछ जानकारी लाता है।

करमन, जे। (2011)। तटस्थ noninformative और जानकारीपूर्ण संयुग्म बीटा और गामा पूर्व वितरण। सांख्यिकी के इलेक्ट्रॉनिक जर्नल, 5, 1450-1470।

तुइल, एफ।, जेरलाच, आर। और मुसेरेन, के। (2008)। बेस-लाप्लास की एक तुलना, जेफ्रीज़ और अन्य प्रियर्स। द अमेरिकन स्टेटिस्टिशियन, 62 (1): 40-44।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.