मेरे पास [0,1] में कुछ डेटा है जिसे मैं बीटा रिग्रेशन के साथ विश्लेषण करना चाहूंगा। बेशक 0,1 मूल्यों को समायोजित करने के लिए कुछ किया जाना चाहिए। मैं एक मॉडल को फिट करने के लिए डेटा को संशोधित करना पसंद करता हूं। मैं यह भी नहीं मानता कि शून्य और 1 मुद्रास्फीति एक अच्छा विचार है क्योंकि मेरा मानना है कि इस मामले में किसी को 0 के बहुत छोटे सकारात्मक मूल्यों पर विचार करना चाहिए (लेकिन मैं यह नहीं कहना चाहता कि क्या मूल्य उचित है। एक उचित विकल्प। मेरा मानना है कि .001 और .999 जैसे छोटे मूल्यों को चुनना होगा और बीटा के लिए संचयी डिस्ट्रक्ट का उपयोग करके मॉडल को फिट करना होगा। इसलिए टिप्पणियों के लिए y_i लॉग की संभावना LL_iwould होगी।
if y_i < .001 LL+=log(cumd_beta(.001))
else if y_i>.999 LL+=log(1.0-cum_beta(.999))
else LL+=log(beta_density(y_i))
इस मॉडल के बारे में मुझे जो पसंद है वह यह है कि यदि बीटा प्रतिगमन मॉडल वैध है तो यह मॉडल भी मान्य है, लेकिन यह चरम मूल्यों के प्रति संवेदनशीलता को थोड़ा हटा देता है। हालाँकि यह ऐसा स्वाभाविक दृष्टिकोण है कि मुझे आश्चर्य है कि मुझे साहित्य में कोई स्पष्ट संदर्भ क्यों नहीं मिला। इसलिए मेरा प्रश्न डेटा को संशोधित करने के बजाय, मॉडल को संशोधित करना क्यों नहीं है। डेटा को संशोधित करना परिणामों को पूर्वाग्रह करता है (इस धारणा के आधार पर कि मूल मॉडल मान्य है), जबकि चरम मूल्यों को बांधने से मॉडल को संशोधित करना परिणामों को पूर्वाग्रह नहीं करता है।
शायद वहाँ एक समस्या है जो मैं देख रहा हूँ?