बीटा वितरण के पीछे अंतर्ज्ञान क्या है?


438

डिस्क्लेमर: मैं कोई सांख्यिकीविद् नहीं, बल्कि एक सॉफ्टवेयर इंजीनियर हूं। आंकड़ों में मेरा अधिकांश ज्ञान स्व-शिक्षा से आता है, इस प्रकार मुझे अभी भी अवधारणाओं को समझने में कई अंतराल हैं जो यहां अन्य लोगों के लिए तुच्छ लग सकते हैं। यदि उत्तर कम विशिष्ट शब्द और अधिक स्पष्टीकरण शामिल हैं तो मैं बहुत आभारी हूं। कल्पना कीजिए कि आप अपनी दादी से बात कर रहे हैं :)

मैं समझ कोशिश कर रहा हूँ प्रकृति का बीटा वितरण कैसे प्रत्येक मामले में यह व्याख्या करने के लिए क्या इसके लिए इस्तेमाल किया जाना चाहिए और -। अगर हम सामान्य वितरण के बारे में बात कर रहे थे, तो कोई इसे ट्रेन के आगमन के समय के रूप में वर्णित कर सकता है: सबसे अधिक बार यह बस समय पर आता है, थोड़ा कम अक्सर यह 1 मिनट पहले या 1 मिनट देर से होता है और बहुत कम ही अंतर के साथ आता है। मतलब से 20 मिनट। वर्दी वितरण, विशेष रूप से, लॉटरी में प्रत्येक टिकट की संभावना का वर्णन करता है। द्विपद वितरण को सिक्कों की फ़्लिप आदि के साथ वर्णित किया जा सकता है। लेकिन क्या बीटा वितरण की ऐसी सहज व्याख्या है ?

मान लें, और । इस मामले में बीटा वितरण इस तरह दिखता है (आर में उत्पन्न):β = .5 बी ( α , β )α=.99β=.5B(α,β)

यहां छवि विवरण दर्ज करें

लेकिन वास्तव में इसका क्या मतलब है? Y- अक्ष स्पष्ट रूप से एक प्रायिकता घनत्व है, लेकिन X- अक्ष पर क्या है?

मैं इस उदाहरण या किसी अन्य के साथ किसी भी स्पष्टीकरण की अत्यधिक सराहना करूंगा।


13
Y- अक्ष एक प्रायिकता नहीं है (जो स्पष्ट है, क्योंकि परिभाषा के अनुसार एक सम्भावना अंतराल के बाहर नहीं हो सकती है , लेकिन यह कथानक और - सिद्धांत रूप में - to तक फैला हुआ है )। यह एक प्रायिकता घनत्व है : की प्रति यूनिट एक संभावना (और आपने को एक दर के रूप में वर्णित किया है)। [0,1]50xx
whuber

4
@whuber: हाँ, मैं समझता हूँ कि पीडीएफ क्या है - यह मेरे वर्णन में सिर्फ गलती थी। मान्य नोट के लिए धन्यवाद!
प्रातः

1
मैं कोशिश करूँगा और संदर्भ लेकिन मुझे पता है कि सामान्यीकृत बीटा वितरण के लिए कुछ अधिक विचित्र आकार फार्म में भौतिकी जैसे अनुप्रयोग हैं। इसके अलावा, आप इसे डेटा-खराब वातावरण में विशेषज्ञ डेटा (न्यूनतम, मोड, अधिकतम) के लिए फिट कर सकते हैं और यह अक्सर त्रिकोणीय वितरण (दुर्भाग्य से अक्सर IE द्वारा उपयोग किया जाता है) का उपयोग करने से बेहतर है। a+(ba)Beta(α1,α2)
सीक्रेटएजमैन

आपने स्पष्ट रूप से रेलवे कंपनी डॉयचे बान के साथ कभी यात्रा नहीं की है। आप कम आशावादी होंगे।
हेनिंग

जवाबों:


621

संक्षिप्त संस्करण यह है कि बीटा वितरण को संभावनाओं के वितरण का प्रतिनिधित्व करने के रूप में समझा जा सकता है - अर्थात, यह एक संभाव्यता के सभी संभावित मूल्यों का प्रतिनिधित्व करता है, जब हम यह नहीं जानते कि वह संभावना क्या है। यहाँ इस की मेरी पसंदीदा सहज व्याख्या है:

जो कोई भी बेसबॉल का अनुसरण करता है वह बल्लेबाजी औसत से परिचित है - बस एक खिलाड़ी की संख्या जितनी बार बल्ले पर जाती है उतनी बार एक बेस हिट हो जाती है (इसलिए यह सिर्फ एक प्रतिशत के बीच है 0और 1)। .266सामान्य तौर पर औसत बल्लेबाजी औसत .300माना जाता है , जबकि एक उत्कृष्ट माना जाता है।

कल्पना कीजिए कि हमारे पास एक बेसबॉल खिलाड़ी है, और हम भविष्यवाणी करना चाहते हैं कि उसकी सीज़न-बल्लेबाजी औसत क्या होगी। आप कह सकते हैं कि हम अभी तक उनकी बल्लेबाजी औसत का उपयोग कर सकते हैं- लेकिन सीजन की शुरुआत में यह बहुत ही खराब उपाय होगा! अगर कोई खिलाड़ी एक बार बल्लेबाजी करने के लिए जाता है और उसे सिंगल मिलता है, तो उसकी बल्लेबाजी का औसत संक्षिप्त होता है 1.000, जबकि अगर वह स्ट्राइक करता है, तो उसका बल्लेबाजी औसत होता है 0.000। अगर आप पांच या छह बार बल्लेबाजी करने जाते हैं तो यह ज्यादा बेहतर नहीं होता है - आप एक भाग्यशाली लकीर प्राप्त कर सकते हैं और औसत प्राप्त कर सकते हैं 1.000, या एक अशुभ लकीर प्राप्त कर सकते हैं और औसतन प्राप्त कर सकते हैं 0, जिनमें से कोई भी एक दूर का अच्छा भविष्यवक्ता नहीं है कि कैसे आप उस सीजन में बल्लेबाजी करेंगे।

पहले कुछ हिट में आपकी बल्लेबाजी का औसत आपके अंतिम बल्लेबाजी औसत का अच्छा भविष्यवक्ता क्यों नहीं है? जब किसी खिलाड़ी की पहली बल्लेबाजी स्ट्राइक होती है, तो कोई भी भविष्यवाणी क्यों नहीं करता है कि वह कभी भी पूरे सीजन में हिट नहीं होगा? क्योंकि हम पूर्व की अपेक्षाओं के साथ जा रहे हैं। हम जानते हैं कि इतिहास में, एक सीज़न में सबसे अधिक बल्लेबाजी औसत कुछ के बीच .215और .360कुछ बेहद दुर्लभ अपवादों के बीच मँडराती है । हम जानते हैं कि अगर किसी खिलाड़ी को शुरुआत में एक पंक्ति में कुछ स्ट्राइक मिलती है, तो यह संकेत दे सकता है कि वह औसत से थोड़ा खराब होगा, लेकिन हम जानते हैं कि वह शायद उस सीमा से विचलित नहीं होगा।

हमारी बल्लेबाजी औसत समस्या को देखते हुए, जिसे एक द्विपद वितरण (सफलताओं और असफलताओं की एक श्रृंखला) के साथ दर्शाया जा सकता है , इन पूर्व अपेक्षाओं का प्रतिनिधित्व करने का सबसे अच्छा तरीका (जिसे हम आंकड़ों में सिर्फ एक पूर्व कहते हैं ) बीटा वितरण के साथ है- यह कह रहा है, इससे पहले कि हम खिलाड़ी को अपना पहला स्विंग लेते देखते हैं, हम उसकी बल्लेबाजी औसत की उम्मीद करते हैं। बीटा वितरण का डोमेन (0, 1)एक संभावना की तरह है, इसलिए हम पहले से ही जानते हैं कि हम सही रास्ते पर हैं- लेकिन इस कार्य के लिए बीटा की उपयुक्तता इससे कहीं अधिक है।

हम उम्मीद करते हैं कि खिलाड़ी की सीज़न लंबे बल्लेबाजी औसत के आसपास सबसे अधिक संभावना होगी .27, लेकिन यह काफी हद तक हो सकता .21है .35। इसे पैरामीटर के साथ बीटा वितरण के साथ दर्शाया जा सकता है और :α=81β=219

curve(dbeta(x, 81, 219))

बीटा (81, 219)

मैं इन मापदंडों के साथ दो कारणों से आया हूं:

  • माध्यαα+β=8181+219=.270
  • जैसा कि आप भूखंड में देख सकते हैं, यह वितरण लगभग पूरी तरह से निहित है (.2, .35)- एक बल्लेबाजी औसत के लिए उचित सीमा।

आपने पूछा कि बीटा एक्सिस वितरण घनत्व प्लॉट में x अक्ष क्या दर्शाता है- यहाँ यह उसकी बल्लेबाजी औसत का प्रतिनिधित्व करता है। इस प्रकार ध्यान दें कि इस मामले में, न केवल y- अक्ष एक प्रायिकता (या अधिक सटीक रूप से एक प्रायिकता घनत्व) है, बल्कि x- अक्ष भी है (बल्लेबाजी औसत केवल हिट की संभावना है, आखिरकार)! बीटा वितरण संभावनाओं का एक संभावित वितरण का प्रतिनिधित्व कर रहा है

लेकिन यहाँ बीटा वितरण इतना उपयुक्त क्यों है। कल्पना कीजिए कि खिलाड़ी को एक हिट मिले। सीजन के लिए उनका रिकॉर्ड अब है 1 hit; 1 at bat। फिर हमें अपनी संभावनाओं को अपडेट करना होगा- हम अपनी नई जानकारी को प्रतिबिंबित करने के लिए इस पूरे वक्र को थोड़ा सा स्थानांतरित करना चाहते हैं। जबकि यह साबित करने के लिए गणित थोड़ा सा शामिल है ( यह यहाँ दिखाया गया है ), परिणाम बहुत सरल है । नया बीटा वितरण होगा:

Beta(α0+hits,β0+misses)

कहाँ और मानकों हम हूँ- कि, 81 और 219 इस प्रकार है, इस मामले में, शुरू कर दिया हैं , 1 (अपने एक हिट) की वृद्धि हुई है, जबकि बिल्कुल नहीं बढ़ाई है (कोई चूक अभी तक )। इसका अर्थ है कि हमारा नया वितरण , या है:α0β0αβBeta(81+1,219)

curve(dbeta(x, 82, 219))

यहां छवि विवरण दर्ज करें

ध्यान दें कि यह मुश्किल से बिल्कुल बदल गया है- परिवर्तन वास्तव में नग्न आंखों के लिए अदृश्य है! (ऐसा इसलिए है क्योंकि एक हिट वास्तव में कुछ भी मतलब नहीं है)।

हालांकि, खिलाड़ी सीजन के दौरान जितना अधिक हिट करेगा, नए सबूतों को समायोजित करने के लिए वक्र उतना ही अधिक स्थानांतरित होगा, और इसके अलावा यह इस तथ्य पर आधारित होगा कि हमारे पास अधिक प्रमाण है। मान लीजिए कि सीजन के आधे समय में वह 300 बार बल्लेबाजी करने के लिए उठे हैं, जिसमें से 100 बार हिट हुए हैं। नया वितरण , या होगा:Beta(81+100,219+200)

curve(dbeta(x, 81+100, 219+200))

यहां छवि विवरण दर्ज करें

ध्यान दें कि कर्व अब दोनों पतले हैं और सही (उच्च बल्लेबाजी औसत) में स्थानांतरित हो गए हैं, जैसा कि खिलाड़ी के बल्लेबाजी औसत का एक बेहतर अर्थ है।

इस सूत्र के सबसे दिलचस्प आउटपुट में से एक परिणामी बीटा वितरण का अपेक्षित मूल्य है, जो मूल रूप से आपका नया अनुमान है। याद रखें कि बीटा वितरण का अपेक्षित मूल्य । इस प्रकार, 300 वास्तविक एट-बैट के 100 हिट के बाद, नए बीटा वितरण का अपेक्षित मूल्य - ध्यान दें कि यह भोले अनुमान से कम है। of , लेकिन अनुमान से अधिक आपने सीजन शुरू किया (αα+β81+10081+100+219+200=.303100100+200=.3338181+219=.270)। आप देख सकते हैं कि यह फॉर्मूला किसी खिलाड़ी के हिट और नॉन-हिट्स में "हेड स्टार्ट" जोड़ने के बराबर है- आप कह रहे हैं "सीजन में उसे 81 हिट्स और 219 नॉन हिट्स उसके रिकॉर्ड के साथ शुरू करें" )।

इस प्रकार, संभावनाओं का एक संभावित वितरण का प्रतिनिधित्व करने के लिए बीटा वितरण सबसे अच्छा है - वह मामला जहां हमें पता नहीं है कि संभाव्यता अग्रिम में क्या है, लेकिन हमारे पास कुछ उचित अनुमान हैं।


5
@ लाभ: खुशी है कि यह मदद की है- मुझे आशा है कि आप बेसबॉल का पालन करेंगे (अन्यथा मुझे आश्चर्य है कि अगर यह समझ में आता है!)
डेविड रॉबिन्सन

11
यहां जॉन कुक से द्विआधारी अमेज़ॅन विक्रेता रैंकिंग के विभिन्न समीक्षाओं के साथ एक समान उदाहरण दिया गया है। टिप्पणियों में पहले से चुनने की चर्चा विशेष रूप से प्रकाशित हो रही है: johndcook.com/blog/2011/09/27/bayesian-amazon/#comments
दिमित्री वी। मास्टरोव

4
आपको यह इंगित करना चाहिए कि पूर्व की आवश्यकता को बीटा-वितरित नहीं किया जाना चाहिए (जब तक कि आप जेफ्रीज़ के पूर्व, - केवल संभावना को बीटा वितरित किया जाना चाहिए।α0=β0=1/2
नील जी

4
+ जब आपके पास अधिक डेटा हो तो आप वितरण को कैसे अपडेट करते हैं, इसका स्पष्टीकरण मुझे पसंद है।
माइक डनलैवी

2
@ user27997 ने .27 का वांछित मतलब दिया, और एक मानक विचलन जो बल्लेबाजी औसत (लगभग .025) के लिए बहुत ही यथार्थवादी है। संयोग से, मैं कैसे एक वांछित मतलब और विचरण से α और β गणना करने के लिए की एक विवरण देना यहाँ
डेविड रॉबिन्सन

48

एक बीटा वितरण बातें, एक सीमित रेंज है 0 की तरह 1 के लिए मॉडल करने के लिए प्रयोग किया जाता है।

उदाहरण एक प्रयोग में सफलता की संभावना है, जिसमें केवल दो परिणाम हैं, जैसे सफलता और विफलता। यदि आप सीमित संख्या में प्रयोग करते हैं, और कुछ सफल होते हैं, तो आप प्रतिनिधित्व कर सकते हैं कि बीटा वितरण द्वारा आपको क्या बताता है।

एक अन्य उदाहरण ऑर्डर के आंकड़े हैं । उदाहरण के लिए, यदि आप कई (4 कहते हैं) एक समान 0,1 यादृच्छिक संख्या उत्पन्न करते हैं, और उन्हें क्रमबद्ध करते हैं, तो 3 का वितरण क्या है?

मैं नमूने द्वारा सॉफ्टवेयर प्रदर्शन निदान को समझने के लिए उनका उपयोग करता हूं। आप आकस्मिक कार्यक्रम बंद कर देते हैं बार, और उस समय की आप इसे कुछ आप वास्तव में से छुटकारा पाने सकता है कर देखते हैं, और , तो समय के अंश ऐसा करके बचाया जा का प्रतिनिधित्व करती है , और स्पीडअप कारक का एक बीटाप्राइम वितरण है।nss>1Beta(s+1,(ns)+1)

इसके बारे में अधिक ...


41

बीटा वितरण भी पर स्वतंत्र वर्दी वितरण के यादृच्छिक नमूने के लिए एक आदेश सांख्यिकीय के रूप में प्रकट होता है ।(0,1)

संक्षेप में, जाने , , हो स्वतंत्र यादृच्छिक चर, पर समान वितरण हो रही प्रत्येक । U_ , , द्वारा यादृच्छिक क्रम के क्रम आँकड़े को परिभाषित करें , बढ़ते क्रम में , , के मूल्यों को क्रमबद्ध करके परिभाषित किया गया । विशेष रूप से और । फिर प्रत्येक लिए दिखा सकता है ।U1Unn(0,1)U(1)U(n)(U1,,Un)U1UnU(1)=min(Ui)U(n)=max(Ui)U(k)Beta(k,n+1k)k=1,,n

यह परिणाम दिखाता है कि बीटा वितरण स्वाभाविक रूप से गणित में दिखाई देते हैं, और इसमें गणित में कुछ दिलचस्प अनुप्रयोग हैं।


28

दो प्रमुख प्रेरणाएँ हैं:

सबसे पहले, बर्नौली वितरण से पहले बीटा वितरण संयुग्मित है। इसका मतलब है कि यदि आपके पास एक अनजान संभावना है जैसे कि सिक्के का पूर्वाग्रह है जिसे आप बार-बार सिक्के के फड़कने का अनुमान लगा रहे हैं, तो अनजान पूर्वाग्रह से सिक्के के क्रम से प्रेरित होने की संभावना बीटा-डिस्ट्रीब्यूटेड है।

दूसरा, बीटा वितरण के एक घातीय परिवार होने का एक परिणाम यह है कि यह पर्याप्त आँकड़ों के एक सेट के लिए अधिकतम एन्ट्रापी वितरण है। बीटा वितरण के मामले में ये आँकड़े में लिए और । इसका मतलब है कि यदि आप केवल नमूनों के सेट के लिए इन पर्याप्त आंकड़ों का औसत माप , तो आप नमूनों के वितरण के बारे में जो न्यूनतम अनुमान लगा सकते हैं, वह यह है कि यह बीटा-वितरित है।log(x)log(1x)x[0,1]x1,,xn

बीटा वितरण आम तौर पर [0,1] से अधिक चीजों को मॉडलिंग करने के लिए विशेष नहीं है क्योंकि कई वितरणों को उस समर्थन के लिए छोटा किया जा सकता है और कई मामलों में अधिक लागू होता है।


23

यहां छवि विवरण दर्ज करें

मान लें कि कुछ ई-कॉमर्स वेब-साइट पर एक विक्रेता को 500 रेटिंग प्राप्त होती हैं, जिनमें से 400 अच्छे हैं और 100 खराब हैं।

हम इसे 500 के बर्नौली प्रयोग के परिणाम के रूप में सोचते हैं, जिसके कारण 400 सफलताएं (1 = अच्छी) मिलीं, जबकि अंतर्निहित संभावना अज्ञात है।p

विक्रेता की रेटिंग के मामले में भोली गुणवत्ता 80% है क्योंकि 0.8 = 400 / 500. लेकिन रेटिंग के संदर्भ में "सही" गुणवत्ता हमें नहीं पता है।

सैद्धांतिक रूप से भी की "सही" गुणवत्ता वाला एक विक्रेता 400 रेटिंग के 400 अच्छे के साथ समाप्त हो सकता है।p=77%

तस्वीर में नुकीले बार प्लॉट की आवृत्ति का प्रतिनिधित्व करता है कि यह कितनी बार एक सिमुलेशन में खुश होता है कि किसी दिए गए "सच" के लिए 400 रेटिंग्स में से 400 अच्छे थे। बार प्लॉट सिमुलेशन के परिणाम के हिस्टोग्राम का घनत्व है।p

और जैसा कि आप देख सकते हैं - और (नारंगी) के लिए बीटा वितरण का घनत्व वक्र कसकर बार चार्ट (सिमुलेशन के लिए हिस्टोग्राम का घनत्व) को घेरता है।α=400+1β=100+1

तो बीटा वितरण अनिवार्य रूप से संभावना है कि एक Bernoulli प्रयोग की सफलता संभावना है परिभाषित करता है प्रयोग का परिणाम दिया।p

library(ggplot2)

# 90% positive of 10 ratings
o1 <- 9
o0 <- 1
M <- 100
N <- 100000

m <- sapply(0:M/M,function(prob)rbinom(N,o1+o0,prob))
v <- colSums(m==o1)
df_sim1 <- data.frame(p=rep(0:M/M,v))
df_beta1 <- data.frame(p=0:M/M, y=dbeta(0:M/M,o1+1,o0+1))

# 80% positive of 500 ratings
o1 <- 400
o0 <- 100
M <- 100
N <- 100000

m <- sapply(0:M/M,function(prob)rbinom(N,o1+o0,prob))
v <- colSums(m==o1)
df_sim2 <- data.frame(p=rep(0:M/M,v))
df_beta2 <- data.frame(p=0:M/M, y=dbeta(0:M/M,o1+1,o0+1))

ggplot(data=df_sim1,aes(p)) +
    scale_x_continuous(breaks=0:10/10) +

    geom_histogram(aes(y=..density..,fill=..density..),
        binwidth=0.01, origin=-.005, colour=I("gray")) +
    geom_line(data=df_beta1 ,aes(p,y),colour=I("red"),size=2,alpha=.5) +

    geom_histogram(data=df_sim2, aes(y=..density..,fill=..density..),
        binwidth=0.01, origin=-.005, colour=I("gray")) +
    geom_line(data=df_beta2,aes(p,y),colour=I("orange"),size=2,alpha=.5)

http://www.joyofdata.de/blog/an-intuitive-interpretation-of-the-beta-distribution/


3
आपके सहयोग के लिए धन्यवाद! मैं कुछ के बारे में हैरान हूं, हालांकि: हालांकि हिस्टोग्राम किंवदंती में कहा गया है कि वे बीटा घनत्व दिखाते हैं , आप यह दावा करते हैं कि ये द्विपद सिमुलेशन के परिणामों का वर्णन करते हैं ("एक सिमुलेशन में कितनी बार खुशी होती है ")। लेकिन दोनों अलग-अलग चीजें हैं, भले ही वे चित्रण में काफी करीब दिखाई देते हैं। (यही कारण है कि बड़े मापदंडों और द्विपद वितरण के लिए केंद्रीय सीमा प्रमेय के साथ बीटा की लगभग सामान्य का एक परिणाम है।)
whuber

यह एक अच्छी बात है! लेकिन मुझे यकीन नहीं है कि यह कैसे स्पष्ट रूप से प्रकट करना है। अगर मैं सिर्फ हिस्टोग्राम की साजिश रचूंगा, तो निश्चित रूप से, आप इसका घनत्व देखते हुए बहुत अधिक घनत्व नहीं देखेंगे। तो हां, हिस्टोग्राम वास्तव में मुझे लगता है कि मूल हिस्टोग्राम के घनत्व को कम नहीं बल्कि वास्तव में (अनुमानित) घनत्व है। रनों की संख्या को देखते हुए मैं एक कारक का भी पता लगा सकता हूं और इसे रैखिक रूप से घटा सकता हूं, लेकिन यह लगभग उसी तरह दिखेगा जैसे मैं (वास्तव में) तुलना करना चाहता हूं कि सिमुलेशन के परिणाम के घनत्व के साथ बीटा का घनत्व क्या है ( मूल हिस्टोग्राम का घनत्व)।
राफेल

8

अब तक उत्तरों के पूर्वनिर्धारण ने बीटा आरवी के लिए औचित्य को कवर किया है जो नमूना अनुपात के लिए पूर्व के रूप में उत्पन्न हो रहा है, और एक चतुर उत्तर में आंकड़ों को ऑर्डर करने के लिए बीटा आरवी संबंधित है।

दो गामा (k_i, 1) RVs के बीच एक साधारण संबंध से बीटा वितरण भी उत्पन्न होता है, i = 1,2 उन्हें X कहते हैं और Y. X / (X + Y) का बीटा वितरण है।

गामा आरवी पहले से ही स्वतंत्र घटनाओं के लिए मॉडलिंग के आगमन के समय में अपना औचित्य रखते हैं, इसलिए मैं यह नहीं कहूंगा कि चूंकि यह आपका सवाल नहीं है। लेकिन अनुक्रम में किए गए दो कार्यों में से एक को पूरा करने में बिताए "समय का अंश" स्वाभाविक रूप से एक बीटा वितरण के लिए उधार देता है।


1
एक बीटा वितरण बनाने के लिए गामा का उपयोग करने के बारे में इंगित करने के लिए +1 धन्यवाद। मैंने सुना है कि यदि आप बीटा को एक डिरिचलेट में सामान्यीकृत करना चाहते हैं, तो आप बस हर गेम में अधिक गामा डालते हैं। हो सकता है कि एक सांख्यिकीविद् सिर्फ इतना जानता हो, लेकिन एक स्पष्ट अवलोकन के आत्मविश्वास अंतराल को देखते हुए मेरे लिए यह वास्तव में उपयोगी था।
माइक डनलैवी

4

मेरा अंतर्ज्ञान कहता है कि यह सफलता का वर्तमान अनुपात " " और "असफलता का वर्तमान अनुपात" ": दोनों का" वजन "करता है । जहाँ स्थिरांक । सफलता के योगदान के लिए एक "वजन" की तरह है। विफलता के योगदान के लिए एक "वजन" की तरह है। आपके पास दो आयामी पैरामीटर स्थान है (सफलताओं के योगदान के लिए एक और विफलताओं के योगदान के लिए एक) जिसके बारे में सोचना और समझना मुश्किल है।( 1 - x ) f ( x ; α ,x(1x) 1 / बी ( अल्फा , बीटा ) अल्फा बीटाf(x;α,β)=constantxα1(1x)β11/B(α,β)αβ


3

उद्धृत उदाहरण में पैरामीटर पूर्व वर्ष से अल्फा = 81 और बीटा = 219 हैं [चमगादड़ पर 300 में 81 हिट या (81 और 300 - 81 = 219)]

मुझे नहीं पता कि वे 81 हिट और 219 आउटफिट की पूर्व धारणा को क्या कहते हैं, लेकिन अंग्रेजी में, यह एक प्राथमिकता है।

ध्यान दें कि कैसे मौसम वक्र वक्रता को बाएं या दाएं आगे बढ़ाता है और मोडल प्रायिकता शिफ्ट बाएं या दाएं चलती है, लेकिन फिर भी वक्र है।

मुझे आश्चर्य है कि अगर बड़ी संख्या का ला आखिरकार पकड़ लेता है और बल्लेबाजी औसत को वापस चला जाता है ।270।

सामान्य रूप से अल्फ़ा और बीटा का अनुमान लगाने के लिए, पहले वाली घटनाओं (चमगादड़ों में) की पूरी संख्या, बल्लेबाजी औसत के रूप में जाना जाता है, कुल हिट (अल्फा), बीटा या भव्य कुल माइनस फ़ेल्योर) और वॉयला प्राप्त करते हैं - आपके पास अपना सूत्र है। फिर, दिखाए गए अनुसार अतिरिक्त डेटा काम करें।


2

जब आप कण आकार वितरण के साथ काम कर रहे हैं तो बीटा वितरण बहुत उपयोगी है। यह वह स्थिति नहीं है जब आप अनाज वितरण का मॉडल बनाना चाहते हैं; यह मामला तनह वितरण का उपयोग करने के लिए बेहतर है जो दाईं ओर बंधी नहीं है। F(X)=tanh((x/p)n)

वैसे, अगर आप सूक्ष्म अवलोकन से आकार वितरण का उत्पादन करते हैं और आपके पास संख्या में एक कण वितरण है, और आपका उद्देश्य वॉल्यूम वितरण के साथ काम करना है तो क्या होगा? मूल वितरण को दाईं ओर बंधी संख्या में लाना लगभग अनिवार्य है। इसलिए, परिवर्तन अधिक सुसंगत है क्योंकि आप सुनिश्चित हैं कि नई मात्रा में वितरण में कोई भी मोड नहीं दिखाई देता है, न ही मध्ययुगीन और न ही मध्यम आकार के अंतराल जो आप काम कर रहे हैं। इसके अलावा, आप ग्रीनलैंड अफ्रीका प्रभाव से बचते हैं।

यदि आपके पास नियमित आकार है, अर्थात, एक क्षेत्र या एक प्रिज्म, तो परिवर्तन बहुत आसान है। आपको संख्या बीटा वितरण के अल्फा पैरामीटर में तीन इकाइयों को जोड़ना चाहिए और वॉल्यूम वितरण प्राप्त करना चाहिए।


1
साइट पर आपका स्वागत है। क्या यह ओपी के सवाल के जवाब के रूप में किया गया था? क्या आप स्पष्ट कर सकते हैं कि यह बीटा वितरण के पीछे अंतर्ज्ञान से कैसे संबंधित है?
गंग

कृपया बीटा वितरण के बारे में अंतर्ज्ञान को स्पष्ट करने के लिए संपादित करें।
Glen_b

1

मुझे लगता है कि बीटा वितरण के पीछे कोई अंतर्ज्ञान नहीं है! बीटा वितरण FIX रेंज के साथ एक बहुत ही लचीला वितरण है! और पूर्णांक a और b के लिए इससे निपटना और भी आसान है। साथ ही बीटा के कई विशेष मामलों का मूल अर्थ है, समान वितरण। तो अगर डेटा को इस तरह से मॉडल करने की आवश्यकता है, या थोड़ा अधिक लचीलेपन के साथ, तो बीटा एक बहुत अच्छा विकल्प है।


0

में एक और सवाल बीटा वितरण बीटा पीछे निम्नलिखित अंतर्ज्ञान प्रदान की जाती है के विषय में:

दूसरे शब्दों में बीटा वितरण को घबराने वाले वितरण के केंद्र में संभावनाओं के वितरण के रूप में देखा जा सकता है।

जानकारी के लिए कृपया https://stats.stackexchange.com/a/429754/142758 पर पूरा उत्तर देखें।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.