सरल रैखिक प्रतिगमन मॉडल
yi=α+βxi+ε
इसके पीछे संभावित मॉडल के संदर्भ में लिखा जा सकता है
μi=α+βxiyi∼N(μi,σ)
यानी आश्रित चर सामान्य वितरण निम्न प्रकार से अर्थ है , जो कि , और मानक विचलन द्वारा का एक रैखिक कार्य है । यदि आप ऐसे मॉडल का अनुमान लगाते हैं, जो साधारण से कम वर्ग का उपयोग करते हैं , तो आपको संभाव्य सूत्रीकरण के बारे में परेशान होने की आवश्यकता नहीं है, क्योंकि आप पूर्वानुमानित मानों के लिए फिट किए गए मानों की चुकता त्रुटियों को कम करके मापदंडों के इष्टतम मूल्यों की खोज कर रहे हैं । दूसरी ओर, आप इस तरह के मॉडल का अधिकतम संभावना अनुमान का उपयोग कर अनुमान लगा सकते हैं , जहां आप संभावना फ़ंक्शन को अधिकतम करके मापदंडों के इष्टतम मूल्यों की तलाश करेंगे।YμiXα,βσα,β
argmaxα,β,σ∏i=1nN(yi;α+βxi,σ)
जहां बिंदुओं पर मूल्यांकन किए गए सामान्य वितरण का घनत्व फ़ंक्शन है , इसका मतलब है कि और मानक विचलन द्वारा पैरामीट्रिज्ड ।Nyiα+βxiσ
अकेले संभावना समारोह को अधिकतम करने के बजाय बायेसियन दृष्टिकोण में, हम मापदंडों के लिए पूर्व वितरण को मानेंगे और बेयस प्रमेय का उपयोग करेंगे।
posterior∝likelihood×prior
संभावना फ़ंक्शन उपरोक्त के समान है, लेकिन क्या परिवर्तन है कि आप अनुमानित पैरामीटर लिए कुछ पूर्व वितरण मान लेते हैं और उन्हें समीकरण में शामिल करते हैंα,β,σ
f(α,β,σ∣Y,X)posterior∝∏i=1nN(yi∣α+βxi,σ)likelihoodfα(α)fβ(β)fσ(σ)priors
"क्या वितरण?" एक अलग सवाल है, क्योंकि असीमित संख्या में विकल्प हैं। के लिए मापदंडों आप कर सकते थे, उदाहरण के लिए कुछ लोगों द्वारा parametrized सामान्य वितरण मान hyperparameters , या -distribution अगर आप भारी पूंछ, या समान वितरण को संभालने के लिए अगर आप ज्यादा मान्यताओं बनाने के लिए नहीं करना चाहते हैं, लेकिन आप यह मान करना चाहते हैं पैरामीटर एक प्राथमिकता "दी गई श्रेणी में कुछ भी" हो सकते हैं , आदि आपको कुछ पूर्व वितरण को मानने की आवश्यकता है जो कि तब अधिक शून्य होने के लिए बाध्य है, क्योंकि मानक विचलन को सकारात्मक होना चाहिए। यह जॉन के। क्रूसके द्वारा नीचे दिए गए मॉडल तैयार करने के लिए नेतृत्व कर सकता है।α,βtσ
(स्रोत: http://www.indiana.edu/~kruschke/BMLR/ )
अधिकतम संभावना में जबकि आप प्रत्येक पैरामीटर के लिए एक ही इष्टतम मूल्य की तलाश कर रहे थे, बेयस प्रमेय को लागू करके बायस प्रमेय में आप मापदंडों के पीछे वितरण को प्राप्त करते हैं । अंतिम अनुमान उस जानकारी पर निर्भर करेगा जो आपके डेटा और आपके पादरियों से आती है , लेकिन जितनी अधिक जानकारी आपके डेटा में निहित है, उतना ही प्रभावशाली पुजारी हैं ।
ध्यान दें कि जब समान का उपयोग किया जाता है, तो वे सामान्यीकरण स्थिरांक को छोड़ने के बाद फॉर्म । इससे बेयस प्रमेय अकेले संभावना कार्य के लिए आनुपातिक हो जाता है, इसलिए पश्च वितरण अधिक से अधिक संभावना अनुमान के समान बिंदु पर अधिकतम तक पहुंच जाएगा। इसके बाद, समान पुजारियों के तहत अनुमान सामान्य कम से कम वर्गों का उपयोग करके ही होगा क्योंकि चुकता त्रुटियों को कम करने से सामान्य संभावना को अधिकतम करने के लिए मेल खाती है ।f(θ)∝1
कुछ मामलों में बेयसियन दृष्टिकोण में एक मॉडल का अनुमान लगाने के लिए आप संयुग्मक पुजारियों का उपयोग कर सकते हैं , इसलिए पश्च वितरण सीधे उपलब्ध है ( उदाहरण यहां देखें )। हालाँकि अधिकांश मामलों में पश्च वितरण सीधे उपलब्ध नहीं होगा और आपको मॉडल का अनुमान लगाने के लिए मार्कोव चेन मोंटे कार्लो विधियों का उपयोग करना होगा ( रैखिक प्रतिगमन के मापदंडों का अनुमान लगाने के लिए मेट्रोपोलिस-हेस्टिंग्स एल्गोरिथम का उपयोग करने के इस उदाहरण की जांच करें )। अंत में, यदि आप केवल मापदंडों के बिंदु अनुमानों में रुचि रखते हैं, तो आप अधिकतम पश्च-अनुमान का उपयोग कर सकते हैं , अर्थात
argmaxα,β,σf(α,β,σ∣Y,X)
लॉजिस्टिक रिग्रेशन के अधिक विस्तृत विवरण के लिए आप बायेसियन लॉगिट मॉडल - सहज व्याख्या की जांच कर सकते हैं ? धागा।
अधिक सीखने के लिए आप निम्नलिखित पुस्तकों की जाँच कर सकते हैं:
क्रुस्के, जे (2014)। डूइंग बायेसियन डेटा एनालिसिस: ए ट्यूटोरियल विथ आर, जेएजीएस और स्टेन। अकादमिक प्रेस।
जेलमैन, ए।, कारलिन, जेबी, स्टर्न, एचएस, और रुबिन, डीबी (2004)।
बायेसियन डेटा विश्लेषण। चैपमैन एंड हॉल / सीआरसी।