प्रतिक्रिया चर में 0s और 1s के साथ बीटा रिग्रेशन डील वास्तव में क्यों नहीं हो सकती है?


17

बीटा प्रतिगमन (यानी बीटा वितरण के साथ GLM और आमतौर पर लॉगिट लिंक फ़ंक्शन) को अक्सर 0 और 1 के बीच मान लेने वाले प्रतिक्रिया उर्फ ​​आश्रित चर से निपटने के लिए अनुशंसित किया जाता है, जैसे अंश, अनुपात, या संभावनाएं: परिणाम के लिए प्रतिगमन (अनुपात या अंश) 0 और 1 के बीच

हालाँकि, यह हमेशा दावा किया जाता है कि बीटा प्रतिगमन का उपयोग नहीं किया जा सकता है क्योंकि प्रतिक्रिया चर बराबर 0 या 1 कम से कम एक बार होता है। यदि ऐसा होता है, तो किसी को शून्य / एक-फुलाया हुआ बीटा मॉडल का उपयोग करने की आवश्यकता होती है, या प्रतिक्रिया के कुछ परिवर्तन करते हैं, आदि । 1 और 0 सहित अनुपात डेटा के बीटा प्रतिगमन

मेरा सवाल है: बीटा वितरण की कौन सी संपत्ति बीटा प्रतिगमन को सटीक 0s और 1s से निपटने से रोकती है, और क्यों?

मैं अनुमान लगा रहा हूं कि यह और 1 बीटा वितरण के समर्थन में नहीं है। लेकिन सभी आकार मापदंडों के लिए α > 1 और β > 1 , दोनों शून्य और एक कर रहे हैं बीटा वितरण के समर्थन में, यह केवल छोटे आकार मापदंडों के लिए वितरण अनंत को एक या दोनों पक्षों में चला जाता है कि। और शायद नमूना डेटा ऐसी है कि कर रहे हैं α और β प्रदान करने के लिए सबसे अच्छा फिट दोनों बाहर बारी से ऊपर हो जाएगा 101α>1β>1αβ1

क्या इसका मतलब यह है कि कुछ मामलों में कोई वास्तव में शून्य प्रतिगमन का उपयोग शून्य / लोगों के साथ भी कर सकता है?

बेशक, जब भी 0 और 1 बीटा वितरण के समर्थन में हैं, ठीक 0 या 1 के अवलोकन की संभावना शून्य है। लेकिन मूल्यों की किसी भी अन्य गणना योग्य सेट को देखने की संभावना क्या है, इसलिए यह एक मुद्दा नहीं हो सकता है? (Cf. यह टिप्पणी @Glen_b द्वारा)।

बीटा वितरण

बीटा रिग्रेशन के संदर्भ में, बीटा डिस्ट्रीब्यूशन को अलग तरीके से , लेकिन। = Α + β > 2 के साथ यह अभी भी सभी μ के लिए [ 0 , 1 ] पर अच्छी तरह से परिभाषित होना चाहिए ।ϕ=α+β>2[0,1]μ

यहाँ छवि विवरण दर्ज करें


2
दिलचस्प सवाल! मेरे पास केविन राइट द्वारा पहले से बनाए गए बिंदुओं के अलावा कोई जवाब नहीं है। मुझे लगता है कि सटीक शून्य और संभाव्यता वाले लोग पैथोलॉजिकल केस हैं (जैसे कि लॉजिस्टिक रिग्रेशन) इसलिए दिलचस्प नहीं हैं क्योंकि वे नहीं होने चाहिए।
टिम

1
@Tim ठीक है, मैं अगर वे ऐसा करना चाहिए या नहीं होना चाहिए पता नहीं है, लेकिन वे करते हैं अक्सर होता है, नहीं तो लोग कैसे 0s और बीटा प्रतिगमन में 1s से निपटने के लिए पर सवाल पूछने नहीं होगा, होगा 0- के बारे में नहीं लिख कागजात और -1 फुलाया बीटा मॉडल, आदि। वैसे भी, मैं अभी भी केविन की तुलना में अधिक विस्तृत जवाब की उम्मीद कर रहा हूं। कम से कम यह बताना चाहिए कि लॉग-लाइक में ये शब्द कैसे उत्पन्न होते हैं।
अमीबा का कहना है कि मोनिका

1
अद्यतन: यह शायद इसलिए है क्योंकि अगर 0 और 1 समर्थन में हैं तो इन बिंदुओं पर पीडीएफ शून्य के बराबर है, जिसका अर्थ है कि इन मूल्यों के अवलोकन की संभावना शून्य है। मैं अभी भी एक उत्तर को ध्यान से समझाते हुए देखना चाहूंगा।
अमीबा का कहना है कि मोनिका

[0,)

जवाबों:


16

log(x)log(1x)x=0x=1


3
yमैं=0yमैं=1

3
010+01

1
01

1
00.5α=β=20.500.50

3
@amoeba संभावना संभावना घनत्व पर निर्भर करती है , स्वयं संभावना नहीं। कभी कभी, एक-एक अवलोकन पर विचार एक छोटे लेकिन परिमित (नहीं अत्यल्प) अंतराल की संभावना (निर्धारित किया है, को शामिल करने के द्वारा या तो इस समस्या से बचने कर सकते हैं जैसे , माप परिशुद्धता द्वारा) या एक बहुत ही संकीर्ण गाऊसी साथ बीटा वितरण convolving द्वारा ( जो शून्य और अनंत घनत्व को समाप्त करता है)।
whuber

2

log(x)log(1x)

पीएन

नतीजतन, बीटा प्रतिगमन की मेरी समझ में, 0s और 1s सहज रूप से (अनंत) निश्चित परिणामों के अनुरूप होंगे।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.