0 और 1 के बीच एक परिणाम (अनुपात या अंश) के लिए प्रतिगमन


42

मैं भविष्यवाणी एक अनुपात एक मॉडल के निर्माण की सोच रहा हूँ है, जहां एक और एक > 0 और > 0 । तो, अनुपात 0 और 1 के बीच होगा ।a/baba>0b>001

मैं रैखिक प्रतिगमन का उपयोग कर सकता हूं, हालांकि यह स्वाभाविक रूप से 0..1 तक सीमित नहीं है। मेरे पास यह विश्वास करने का कोई कारण नहीं है कि संबंध रैखिक है, लेकिन निश्चित रूप से इसका उपयोग अक्सर वैसे भी किया जाता है, जैसा कि एक सरल पहले मॉडल के रूप में किया जाता है।

मैं एक लॉजिस्टिक रिग्रेशन का उपयोग कर सकता था, हालांकि इसका उपयोग आम तौर पर दो-राज्य के परिणाम की संभावना का अनुमान लगाने के लिए किया जाता है, न कि सीमा 0..1 से निरंतर मूल्य का अनुमान लगाने के लिए।

अधिक जानने के बाद, क्या आप रैखिक प्रतिगमन, लॉजिस्टिक प्रतिगमन या छिपे हुए विकल्प c का उपयोग करेंगे ?


4
क्या आपने बीटा प्रतिगमन पर विचार किया है?
पीटर Flom - को पुनः स्थापित मोनिका

सभी ने उत्तर देने के लिए बहुत धन्यवाद। मुझे अध्ययन करना और चुनना होगा। एक बीटा की तरह लगता है शुरू करने के लिए एक सभ्य जगह है, खासकर अगर मैं एक अच्छी फिट (शायद आंख से) देख सकता हूं।
dfrankow

मैंने इसे GLM (पॉइसन लिंक फंक्शन) का उपयोग करके देखा है। अंश एक होगा गिनती डेटा (परिणाम) और हर ऑफसेट चर होगा। फिर आप को अलग की आवश्यकता होगी एक और प्रत्येक विषय / अवलोकन के लिए मान। मुझे यकीन नहीं है कि यह सबसे वैध विकल्प है। मुझे बीटा वितरण एक दिलचस्प विकल्प लगता है - एक जो मैंने नहीं सुना था। हालाँकि, मुझे समझ में आना मुश्किल है, एक गैर-सांख्यिकीविद होने के नाते।
मेगप्रोफेल्ट

आपके गहन और उपयोगी विश्लेषण के लिए आप सभी का धन्यवाद, मैं वर्तमान में लगभग एक ही चुनौती का सामना कर रहा हूं, लेकिन 0-1 के बीच निरंतर अनुपात रेंज की भविष्यवाणी करने के बजाय, मैं -1 के बीच मरीजों की उपयोगिता सीमा का अनुमान लगाने के लिए प्रतिगमन मॉडल बनाना चाहता हूं। और 1. यह काफी मुश्किल है, मैं -1 और 1. के बीच एक निरंतर निर्भर सीमा के साथ एक प्रतिगमन मॉडल बनाने के लिए उपयुक्त किसी भी लिंक फ़ंक्शन को नहीं ढूंढ सका, इसलिए लोग बस इस बारे में सुराग चाहते हैं कि क्या किया जा सकता है। धन्यवाद,

1
y(y+1)/2[0,1]

जवाबों:


34

आपको "छिपा हुआ विकल्प सी" चुनना चाहिए, जहां सी बीटा प्रतिगमन है। यह एक प्रकार का प्रतिगमन मॉडल है जो उचित है जब प्रतिक्रिया चर को बीटा के रूप में वितरित किया जाता है । आप इसे सामान्यीकृत रैखिक मॉडल के अनुरूप मान सकते हैं । यह वही है जो आप ढूंढ रहे हैं। बेटारेगR नामक एक पैकेज है जो इससे संबंधित है। मुझे नहीं पता कि आप उपयोग करते हैं , लेकिन फिर भी अगर आप 'विगनेट्स' नहीं पढ़ सकते हैं, तो वे आपको इस विषय के बारे में सामान्य जानकारी देंगे कि इसे कैसे लागू किया जाए (जिसमें आपको इसकी आवश्यकता नहीं होगी उस मामले में)। RR


aba/b

एक और संभावना है कि रैखिक प्रतिगमन का उपयोग करें यदि अनुपात को एक मानक रैखिक मॉडल की मान्यताओं को पूरा करने के लिए रूपांतरित किया जा सकता है, हालांकि मैं वास्तव में काम करने के बारे में आशावादी नहीं हूं।


1
क्या आप इस बात पर विस्तार से विचार करेंगे कि इस मामले में बीटा प्रतिगमन क्यों बेहतर होगा? यह एक सिफारिश है जिसे मैं अक्सर यहां देखता हूं, लेकिन मैं वास्तव में किसी को भी तर्क पर विस्तार से नहीं देखता हूं - यह अच्छा होगा!
मैट पार्कर

4
p

3
मुझे यह कहते हुए सावधान किया जाएगा कि एक बीटा उपयोग करने के लिए उचित वितरण है। यह काफी लचीला है और यह उचित हो सकता है लेकिन यह सभी मामलों को कवर नहीं करता है। इसलिए जब यह एक अच्छा सुझाव है और बहुत अच्छी तरह से हो सकता है कि वे क्या चाहते हैं - आप वास्तव में यह नहीं कह सकते कि यह पूरी तरह से इस तथ्य पर उचित वितरण है कि यह 0 और 1. के बीच एक निरंतर प्रतिक्रिया है
दासोन

1
[0,1] पर एक त्रिकोणीय वितरण उन अनुपातों पर एक निरंतर वितरण का प्रतिनिधित्व करता है जो एक बीटा नहीं है। कई अन्य हो सकते हैं। बीटा एक अच्छा लचीला परिवार है, लेकिन इसके बारे में कुछ भी जादू नहीं है। आप लॉजिस्टिक रिग्रेशन के बारे में एक अच्छी बात करते हैं क्योंकि यह द्विआधारी डेटा पर लागू होता है।
माइकल चेरिक

2
शायद मुझे कम हठधर्मी दिखने की कोशिश करनी चाहिए। मेरा मतलब है कि आप अपने DV की जांच करें और उसके वितरण का उपयोग करें। सच है, निरंतर अनुपात के अन्य वितरण हैं। तकनीकी रूप से, बीटा एक गामा के अनुपात में + एक और गामा से अधिक है। दी गई स्थिति में, एक अलग वितरण बेहतर हो सकता है; उदाहरण के लिए बीटा 0 या 1, केवल (0, 1) मान नहीं ले सकता। बहरहाल, बीटा अच्छी तरह से समझा जाता है और फिट होने के लिए सिर्फ 2 मापदंडों के साथ बहुत लचीला है। मैं तर्क देता हूं कि जब w / DV निपटता है तो यह एक निरंतर अनुपात होता है जो आमतौर पर शुरू करने के लिए सबसे अच्छी जगह है।
गूँग - मोनिका

2

क्या ये युग्मित नमूने या दो स्वतंत्र आबादी हैं?

XiXiMiXiMi

इस प्रतिगमन का आपका अवरोधन लॉग (B) होगा और आपका ढलान लॉग (अनुपात) होगा।

यहाँ और देखें:

Beyene J, Moineddin R। स्थान क्वॉटर के लिए आवेदन के साथ अनुपात पैरामीटर के आत्मविश्वास अंतराल अनुमान के लिए तरीके। बीएमसी चिकित्सा अनुसंधान पद्धति। 2005; 5 (1): 32।

EDIT: मैंने ऐसा करने के लिए SPSS एडऑन लिखा है। यदि आप रुचि रखते हैं तो मैं इसे साझा कर सकता हूं।


1
जिज्ञासा से बाहर आपने किस विधि का उपयोग किया (डेल्टा, फेलर या जीएलएम)? यह मुझे थोड़ा धीमा कर देता है कि बीएमसी लेख ने विभिन्न अनुमानकों के कवरेज के कुछ सिमुलेशन नहीं किए (हालांकि एक यथार्थवादी सिमुलेशन का सपना देखना कष्टप्रद होगा)। मुझे याद दिलाया गया क्योंकि मैं हाल ही में एक कागज पर आया था जो डेल्टा विधि (कोई वास्तविक औचित्य के साथ) करता है, हालांकि यह बीएमसी लेख का हवाला देता है।
एंडी डब्ल्यू

1
वापस जब मैंने यह टिप्पणी लिखी, तो मैंने REGRESSIONडेटा को लॉग-ट्रांसफ़ॉर्म करने के बाद उपयोग किया । तब से मैंने एक अधिक परिष्कृत संस्करण लिखा है जो उपयोग करता है GLM। मैं प्रकाश उत्सर्जन मापों से निपटता हूं और मेरे परीक्षण से पता चलता है कि लॉग-लिंक के साथ गामा प्रतिगमन मापदंडों पर भगोड़ा अनिश्चितता का सबसे कम खतरा था। मेरे अधिकांश वास्तविक डेटा के लिए, लॉग-लिंक के साथ सामान्य, नकारात्मक-द्विपद और गामा का उपयोग करने के उत्तर सभी वास्तव में समान थे (कम से कम सटीक मेरी आवश्यकता थी)
DocBuckets

0

Xii=1,2,..,kkp1pp=exp(x)[1+exp(x)]x


p

2
-1। मैं @amoeba से सहमत हूं। मैं हैरान हूं कि यह कभी क्यों उखड़ गया। यह प्रश्न पर सहन नहीं करता है, जो बाइनरी डेटा 0 या 1 को बिल्कुल भी ग्रहण नहीं करता है, लेकिन मापा अनुपात पर केंद्रित है जो 0 और 1 के बीच है।
निक कॉक्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.