बीटा प्रतिगमन (यानी बीटा वितरण के साथ GLM और आमतौर पर लॉगिट लिंक फ़ंक्शन) को अक्सर 0 और 1 के बीच मान लेने वाले प्रतिक्रिया उर्फ आश्रित चर से निपटने के लिए अनुशंसित किया जाता है, जैसे अंश, अनुपात, या संभावनाएं: परिणाम के लिए प्रतिगमन (अनुपात या अंश) 0 और 1 के बीच ।
हालाँकि, यह हमेशा दावा किया जाता है कि बीटा प्रतिगमन का उपयोग नहीं किया जा सकता है क्योंकि प्रतिक्रिया चर बराबर 0 या 1 कम से कम एक बार होता है। यदि ऐसा होता है, तो किसी को शून्य / एक-फुलाया हुआ बीटा मॉडल का उपयोग करने की आवश्यकता होती है, या प्रतिक्रिया के कुछ परिवर्तन करते हैं, आदि । 1 और 0 सहित अनुपात डेटा के बीटा प्रतिगमन ।
मेरा सवाल है: बीटा वितरण की कौन सी संपत्ति बीटा प्रतिगमन को सटीक 0s और 1s से निपटने से रोकती है, और क्यों?
मैं अनुमान लगा रहा हूं कि यह और 1 बीटा वितरण के समर्थन में नहीं है। लेकिन सभी आकार मापदंडों के लिए α > 1 और β > 1 , दोनों शून्य और एक कर रहे हैं बीटा वितरण के समर्थन में, यह केवल छोटे आकार मापदंडों के लिए वितरण अनंत को एक या दोनों पक्षों में चला जाता है कि। और शायद नमूना डेटा ऐसी है कि कर रहे हैं α और β प्रदान करने के लिए सबसे अच्छा फिट दोनों बाहर बारी से ऊपर हो जाएगा 1 ।
क्या इसका मतलब यह है कि कुछ मामलों में कोई वास्तव में शून्य प्रतिगमन का उपयोग शून्य / लोगों के साथ भी कर सकता है?
बेशक, जब भी 0 और 1 बीटा वितरण के समर्थन में हैं, ठीक 0 या 1 के अवलोकन की संभावना शून्य है। लेकिन मूल्यों की किसी भी अन्य गणना योग्य सेट को देखने की संभावना क्या है, इसलिए यह एक मुद्दा नहीं हो सकता है? (Cf. यह टिप्पणी @Glen_b द्वारा)।
बीटा रिग्रेशन के संदर्भ में, बीटा डिस्ट्रीब्यूशन को अलग तरीके से , लेकिन। = Α + β > 2 के साथ यह अभी भी सभी μ के लिए [ 0 , 1 ] पर अच्छी तरह से परिभाषित होना चाहिए ।