पदानुक्रमित लॉजिस्टिक प्रतिगमन के लिए बर्नौली पैरामीटर पर बीटा वितरण का उपयोग क्यों करें?


13

मैं वर्तमान में क्रुश्के की उत्कृष्ट "डूइंग बायेसियन डेटा एनालिसिस" पुस्तक पढ़ रहा हूं। हालांकि, पदानुक्रमित लॉजिस्टिक रिग्रेशन (अध्याय 20) पर अध्याय कुछ भ्रामक है।

चित्र 20.2 एक पदानुक्रमित लॉजिस्टिक रिग्रेशन का वर्णन करता है जहां बर्नौली पैरामीटर को सिग्मॉइड फ़ंक्शन के माध्यम से रूपांतरित किए गए गुणांक पर रैखिक फ़ंक्शन के रूप में परिभाषित किया गया है। ऐसा लगता है कि पदानुक्रमित लॉजिस्टिक प्रतिगमन को उन अधिकांश उदाहरणों में प्रस्तुत किया गया है जिन्हें मैंने अन्य स्रोतों में भी ऑनलाइन देखा है। उदाहरण के लिए - http://polisci2.ucsd.edu/cfariss/code/SIMlogit02.bug

हालाँकि, जब भविष्यवक्ता नाममात्र के होते हैं, तो वह पदानुक्रम में एक परत जोड़ता है - बर्नौली पैरामीटर अब म्यू और कप्पा द्वारा निर्धारित मापदंडों के साथ एक बीटा वितरण (चित्र 20.5) से तैयार किया गया है, जहां म्यू गुणांक के रैखिक कार्य का परिवर्तन है। , और कप्पा एक गामा से पहले का उपयोग करता है।

यह अध्याय 9 से सिक्का-फ़्लिपिंग उदाहरण के लिए उचित और अनुरूप लगता है, लेकिन मुझे नहीं लगता कि नाममात्र भविष्यवाणियों का बीटा वितरण को जोड़ने के साथ क्या करना है। मीट्रिक भविष्यवक्ताओं के मामले में कोई ऐसा क्यों नहीं करेगा और नाममात्र भविष्यवक्ताओं के लिए बीटा वितरण क्यों जोड़ा गया?

संपादित करें: जिन मॉडलों का मैं उल्लेख कर रहा हूं, उन पर स्पष्टीकरण। सबसे पहले, मीट्रिक भविष्यवाणियों के साथ एक लॉजिस्टिक रिग्रेशन मॉडल (कोई बीटा पूर्व नहीं)। यह पदानुक्रमित लॉजिस्टिक प्रतिगमन के अन्य उदाहरणों के समान है, जैसे ऊपर दिए गए बग उदाहरण:

yiBernoulli(μi)μi=sig(β0+jβjxji)β0N(M0,T0)βjN(Mβ,Tβ)

फिर नाममात्र भविष्यवक्ताओं के साथ उदाहरण। यहां पर मैं पदानुक्रम के "निचले" स्तर की भूमिका को काफी नहीं समझता हूं (द्विपद से पहले एक बीटा में लॉजिस्टिक परिणाम शामिल करना) और यह मीट्रिक उदाहरण से अलग क्यों होना चाहिए।

ziBin(θi,N)θiBeta(aj,bj)aj=μjκbj=(1μj)κκΓ(Sκ,Rκ)μj=sig(β0+jβjxji)β0N(M0,T0)βjN(0,τβ)τβ=1/σβ2σβ2folded t(Tt,DF)

जवाबों:


9

आपके द्वारा तुलना किए गए दो मॉडल में कई बाहरी विशेषताएं हैं, और मुझे लगता है कि आप निम्नलिखित दो सरल मॉडल के संदर्भ में अपने प्रश्न को अधिक स्पष्ट रूप से आराम कर सकते हैं:

मॉडल 1:

yi|μiBern(μi)μiπ(μi)

मॉडल 2:

yi|θiBern(θi)θi|μi,κBeta(μiκ,(1μi)κ)μiπ(μi)

आपके प्रश्न हैं: (1) बीटा वितरण द्वारा क्या भूमिका निभाई जाती है; और संबंधित, (2) कैसे (यदि सब पर) मॉडल 2 मॉडल 1 से अलग है?

सतह पर इन सुंदर विभिन्न मॉडलों दिखाई देते हैं, लेकिन वास्तव में, के सीमांत वितरण दोनों मॉडल में समान हैं। मॉडल 1 में का पिछला वितरण जबकि मॉडल 2 में का सीमांत वितरण है:μiμi

p(μi|yi)μiyi(1μi)1yiπ(μi)
μi
p(μi|yi,κ)01θiyi+μiκ1(1θi)κ(1μi)yiB(κμi,κ(1μi))dθπ(μi)B(yi+μiκ,1yi+κ(1μi))π(μi)B(κμi,κ(1μi))μiyi(1μi)1yiπ(μi)

इस प्रकार मॉडल 2 का उपयोग करने से प्राप्त कोई भी लाभ कम्प्यूटेशनल है। पदानुक्रमित मॉडल को ओवररिमेट करना, जैसे कि मॉडल 2 में के अलावा , कभी-कभी नमूनाकरण प्रक्रिया की दक्षता में सुधार कर सकते हैं; उदाहरण के लिए, मापदंडों के समूहों के बीच सशर्त रूप से संयुग्मित संबंधों को पेश करके (जैक टान्नर का उत्तर देखें), या ब्याज के मापदंडों के बीच संबंध को तोड़कर (Google "पैरामीटर विस्तार")।θi


5

एक बीटा वितरण से बर्नौली पैरामीटर को खींचने का कारण यह है कि बीटा द्विपद का संयुग्म है। एक संयुग्मित पूर्व वितरण का उपयोग करने से पोस्टीरियर खोजने के लिए एक बंद-रूप समाधान सक्षम होता है।

संपादित करें: स्पष्ट करना। या तो मॉडल काम करेगा। MCMC के साथ भी, यह संयुग्म पुजारियों के लिए उपयोगी है क्योंकि यह विभिन्न प्रकार के वितरणों के लिए विशेष नमूनों के उपयोग की अनुमति देता है जो सामान्य नमूनों की तुलना में अधिक कुशल हैं। उदाहरण के लिए, JAGS उपयोगकर्ता पुस्तिका सेकंड देखें। 4.1.1 और सेकंड 4.2।


मेरे प्रश्न में पुस्तक से पर्याप्त संदर्भ नहीं हो सकता है, लेकिन ये विश्लेषण गिब्स नमूना के साथ किया जाता है, इसलिए पीछे के एक बंद रूप का प्रतिनिधित्व आवश्यक नहीं है। मेरे द्वारा जुड़े उदाहरण में, बर्नौली पैरामीटर को बीटा वितरण के रूप में तय नहीं किया गया है, लेकिन रैखिक भविष्यवाणियों के एक सिग्मोइड परिवर्तन से उत्पन्न होता है, जो सामान्य रूप से गुणांक वितरित करते हैं। यह भी है कि कैसे क्रुस्के ने अध्याय में एक पहले का उदाहरण (मीट्रिक भविष्यवक्ताओं के साथ) प्रस्तुत किया है (बर्नौली पैरामीटर सामान्य रूप से वितरित गुणांक के साथ रैखिक फ़ंक्शन का
सिग्मॉइड ट्रांसफॉर्मेशन है

@ user4733 जैक टान्नर बेर्नौली नमूनों से पहले बीटा के संयुग्म होने के बारे में सही है। यह एक संयोग से अधिक की तरह लगता है कि इसे चुना गया था। हाँ, आप गिब्स नमूना देने के लिए हो सकता है, लेकिन बाद के वितरण को प्राप्त करने के लिए लेकिन एक पदानुक्रमित मॉडल में एक से अधिक पूर्व शामिल है और यह हो सकता है कि आप एक हाइपरपरमीटर (पूर्व वितरण के एक परिवार के लिए एक पैरामीटर) पर एक पूर्व डाल रहे हैं। यदि आप चाहें तो पहले से पहले। उस संदर्भ में पहले एक संयुग्म का उपयोग करना सुविधाजनक हो सकता है। आपकी पुस्तक का कुछ वर्णन हमारे लिए भ्रमित करने वाला है।
माइकल आर। चेरिक

1
आप कुछ अंश ले रहे हैं जो समझने की हमारी क्षमता में अंतराल पैदा करते हैं कि क्या हो रहा है। आपको मॉडल और
पादरियों

मेरे द्वारा बताए गए पदानुक्रमित मॉडल में कुछ विवरण जोड़े गए हैं। उम्मीद है कि यह मदद करता है।
user4733
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.