Scipy में बीटा वितरण फिटिंग


14

विकिपीडिया के अनुसार बीटा संभावना वितरण में दो आकार पैरामीटर हैं: और ।αβ

जब मैं scipy.stats.beta.fit(x)पायथन में कॉल करता हूं , जहांx रेंज में संख्याओं का एक गुच्छा होता है , 4 मान वापस आ जाते हैं। यह मुझे अजीब लगता है।[0,1]

गुग्लिंग के बाद मैंने पाया कि वापसी मूल्यों में से एक को 'स्थान' होना चाहिए, क्योंकि अगर मैं कॉल करता हूं तो तीसरा चर 0 है scipy.stats.beta.fit(x, floc=0)

क्या किसी को पता है कि चौथा चर क्या है, और यदि पहले दो और ?βαβ


1
प्रलेखन पिछले दो "स्थान" और "पैमाने" पैरामीटर कहता है। इस प्रकार चौथा पैमाना पैरामीटर है। स्थान और पैमाने के मानक सांख्यिकीय अर्थ हैं। इस संदर्भ में एक व्याख्या NIST हैंडबुक में स्पष्ट रूप से दी गई है ।
whuber

मैं यह एक ही मुद्दा रहा हूँ, लेकिन किसी कारण के लिए मेरे सभी बीटा मॉडल "पानी पकड़" करते हैं। उदाहरण के लिए stats.beta.fit([60,61,62,72])मुझे मिलता है (0.7313395126217731, 0.7153715263378897, 58.999999999999993, 3.3500998441036982)। किसी भी विचार मैं इस बारे में क्या कर सकते हैं?
TheChymera

जेनेरिक निरंतर रैंडम वेरिएबल फिट विधि के लिए बस इस दस्तावेज को जोड़ना, जिसमें कुछ उदाहरण शामिल हैं जिनमें beta.fit (): docs.scipy.org/doc/scipy/reference/generated/…
मैथ्यूसिपन 13/19 शामिल है।

जवाबों:


13

के उत्पादन पर प्रलेखन की स्पष्ट कमी के बावजूद beta.fit, यह निम्न क्रम में आउटपुट करता है:

αβ


क्या यह केवल डेटा की सीमा के आधार पर निचली और ऊपरी सीमाओं को थूकना है, या कुछ और करना है?
छायाकार

सीमाएं संभाव्यता वितरण पर आधारित होती हैं। अर्थात। सामान्य वितरण की कोई सीमा नहीं है, लेकिन नमूना डेटा शायद ही कभी ~ से अधिक हो +/-3। उन सीमाओं के बाहर 0 की संभावना के साथ बीटा वितरण में कठिन सीमाएँ हैं। यह संभावना है कि आपका डेटा जो आप मॉडलिंग कर रहे हैं, उसके आधार पर सीमाएं नहीं पहुंचेंगी। वास्तव में, डेटा की सीमा से मेल खाने के लिए उन सीमाओं को बाध्य करने की कोशिश करना समस्याग्रस्त हो सकता है, क्योंकि कई बीटा वितरण सीमा पर शून्य संभावना को देखते हैं। उस मुद्दे पर अधिक जानकारी के लिए यह पोस्ट देखें ।
jdj081 16

1
हां, मैं जागरूक हूं। वे सीमाएं हमेशा 0 और 1. होती हैं: इसलिए इस फ़ंक्शन द्वारा ऊपरी और निचली सीमाएं क्या हैं, और वे "स्थान" और "स्केल" के समान कैसे हैं? मुझे लगता है कि मैं अभी इस उत्तर को नहीं समझता।
छायाकार

2
जिस तरह से बीटा डिस्ट्रीब्यूशन को परिभाषित किया गया है, वे सीमाएं हमेशा 0 और 1. होती हैं, लेकिन सामान्यीकृत बीटा डिस्ट्रीब्यूशन में इन दो स्केलिंग कारक शामिल होते हैं। I मॉडल का डेटा 0 और 1 के बीच नहीं आता है, इसलिए मुझे उन नंबरों का उपयोग करना होगा। यदि आपका डेटा 0 और 1 के बीच है, तो उन आउटपुट को 0 और 1 के बहुत पास होना चाहिए। अगर आपको पता है कि आपकी सीमाएं 0 और 1 हैं, तो आप उन लोगों के साथ floc=0और fscale=1kwargs के लिए बाध्य कर सकते हैं । आप अभी भी उन आउटपुट प्राप्त करेंगे, लेकिन वे उसी तरह होंगे जो आप उन्हें होने के लिए मजबूर करते हैं। और यह संभवतः आपके अल्फा और बीटा मान को बदल देगा।
jdj081
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.