हाल ही में, मैं एक परिणाम के लिए एक बीटा प्रतिगमन मॉडल को लागू करने में रुचि रखता हूं, जो एक अनुपात है। ध्यान दें कि यह परिणाम एक द्विपद संदर्भ में फिट नहीं होगा, क्योंकि इस संदर्भ में असतत "सफलता" की कोई सार्थक अवधारणा नहीं है। वास्तव में, परिणाम वास्तव में अवधि का अनुपात है; अंश एक निश्चित स्थिति के दौरान सेकंड की संख्या में सक्रिय होता है, जिसके दौरान स्थिति सक्रिय होने के योग्य थी। मैं योनि के लिए माफी मांगता हूं, लेकिन मैं इस सटीक संदर्भ पर बहुत अधिक ध्यान केंद्रित नहीं करना चाहता हूं, क्योंकि मुझे एहसास है कि बीटा रिग्रेशन के अलावा इस तरह की एक प्रक्रिया को मॉडल किया जा सकता है, और अब मैं विशेष रूप से सैद्धांतिक रूप से अधिक दिलचस्पी लेता हूं ऐसे मॉडल को लागू करने के मेरे प्रयासों में जो सवाल उठे हैं (हालांकि मैं, ज़ाहिर है,
किसी भी स्थिति में, मेरे द्वारा खोजे गए सभी संसाधन इंगित करते हैं कि बीटा प्रतिगमन आमतौर पर एक लॉगिट (या प्रोबिट / क्लॉगल) लिंक का उपयोग करके फिट होता है, और पैरामीटर ने लॉग-ऑड में परिवर्तन के रूप में व्याख्या की है। हालाँकि, मुझे अभी तक ऐसा संदर्भ नहीं मिला है, जो वास्तव में इस लिंक का उपयोग करने के लिए कोई वास्तविक औचित्य प्रदान करता हो।
मूल फेरारी और क्रिबारी-नेटो (2004) का पेपर औचित्य प्रदान नहीं करता है; वे केवल इस बात पर ध्यान देते हैं कि घातांक मानदंड की व्याख्या के अनुपात अनुपात की व्याख्या के कारण "विशेष रूप से उपयोगी" है। अन्य स्रोत इंटरवल (0,1) से वास्तविक रेखा पर जाने की इच्छा के लिए संकेत देते हैं। हालांकि, क्या हमें आवश्यक रूप से इस तरह के मानचित्रण के लिए एक लिंक फ़ंक्शन की आवश्यकता है, जिसे देखते हुए हम पहले से ही एक बीटा वितरण मान रहे हैं? बीटा डिस्ट्रीब्यूशन को शुरू करने के लिए लगाए गए अवरोधों से ऊपर और उससे परे लिंक फ़ंक्शन क्या लाभ प्रदान करता है?मैंने त्वरित सिमुलेशन के एक जोड़े को चलाया है और किसी पहचान लिंक के साथ (0,1) अंतराल के बाहर भविष्यवाणियां नहीं देखी हैं, यहां तक कि जब बीटा वितरण से अनुकरण करते हैं, जिसकी संभावना बड़े पैमाने पर बड़े पैमाने पर 0 या 1 के करीब होती है, लेकिन शायद मेरे सिमुलेशन कुछ विकृति को पकड़ने के लिए सामान्य रूप से पर्याप्त नहीं है।
यह मुझे लगता है कि कैसे व्यक्तियों पर आधारित है, व्यवहार में, बीटा प्रतिगमन मॉडल (यानी बाधाओं के रूप में अनुपात) से पैरामीटर अनुमानों की व्याख्या करते हैं कि वे एक "सफलता" के बाधाओं के संबंध में अनुमान लगा रहे हैं; यही है, वे एक द्विपद मॉडल के विकल्प के रूप में बीटा प्रतिगमन का उपयोग कर रहे हैं। बीटा और द्विपद वितरण के बीच के संबंध को देखते हुए शायद कुछ संदर्भों में यह उचित है, लेकिन मुझे ऐसा लगता है कि यह सामान्य से अधिक विशेष मामला होना चाहिए। में इस सवाल का उत्तर नहीं बल्कि परिणाम की तुलना में निरंतर अनुपात के संबंध में बाधाओं अनुपात की व्याख्या के लिए प्रदान की जाती है, लेकिन यह के रूप में उपयोग करते हुए, कहते हैं, एक लॉग करने का विरोध कोशिश करते हैं और चीजों को इस तरह से व्याख्या करने के लिए, अनावश्यक रूप से बोझिल होने के लिए मुझे लगता है या पहचान लिंक और% परिवर्तन या यूनिट-शिफ्ट की व्याख्या करना।
तो, हम बीटा प्रतिगमन मॉडल के लिए लॉगिट लिंक का उपयोग क्यों करते हैं? क्या यह बस सुविधा के रूप में, द्विपद मॉडल से संबंधित है?