यह ऊपर और नीचे बंधी संख्याओं की सहायता क्यों करता है?
पर परिभाषित एक वितरण वह है जो इसे पर डेटा के लिए एक मॉडल के रूप में उपयुक्त बनाता है । मुझे नहीं लगता कि पाठ का मतलब " पर डेटा के लिए एक मॉडल " (या आमतौर पर, ऑन ) से अधिक है।(0,1)(0,1)(0,1)(a,b)
यह वितरण क्या है ...?
शब्द 'लॉग-ऑड डिस्ट्रीब्यूशन' दुर्भाग्य से पूरी तरह से मानक नहीं है (और तब भी बहुत सामान्य शब्द नहीं है)।
मैं इसका क्या मतलब हो सकता है के लिए कुछ संभावनाओं पर चर्चा करेंगे। आइए यूनिट अंतराल में मूल्यों के लिए वितरण के निर्माण के तरीके पर विचार करके शुरू करें।
एक आम तरीका है एक सतत यादृच्छिक चर, मॉडल करने के लिए में है बीटा वितरण , और एक आम रास्ते में असतत अनुपात मॉडल करने के लिए एक छोटा द्विपद (है , कम से कम जब पर एक गिनती है)।P(0,1)[0,1]P=X/nX
बीटा वितरण का उपयोग करने का एक विकल्प कुछ निरंतर उलटा सीडीएफ ( ) लेने के लिए होगा और इसका उपयोग वास्तविक लाइन (या शायद ही कभी, वास्तविक आधा लाइन) में मूल्यों में बदलने के लिए होगा। और फिर किसी भी प्रासंगिक वितरण ( ) का उपयोग करके परिवर्तित सीमा पर मूल्यों को मॉडल करें। यह कई संभावनाओं को खोलता है, क्योंकि परिवर्तन और मॉडल के लिए वास्तविक लाइन ( ) पर निरंतर वितरण की कोई भी जोड़ी उपलब्ध है।F−1(0,1)GF,G
इसलिए, उदाहरण के लिए, लॉग-ऑड ट्रांसफ़ॉर्मेशन (जिसे लॉगिट भी कहा जाता है ) एक ऐसा प्रतिलोम-cdf परिवर्तन होगा (मानक लॉजिस्टिक का उलटा CDF होने के नाते ) , और फिर कई वितरण हैं जिन्हें हम लिए मॉडल के रूप में मान सकते हैं ।Y=log(P1−P)Y
फिर हम लिए एक लॉजिस्टिक मॉडल का उपयोग कर सकते हैं , जो वास्तविक लाइन पर एक साधारण दो-पैरामीटर परिवार है। उलटा लॉग-ऑड ट्रांसफॉर्मेशन (यानी माध्यम से पर वापस जाना , लिए दो पैरामीटर वितरण का पैदावार करता है , जो एक हो सकता है यूमोडल, या यू आकार, या जे आकार, सममित या तिरछा, कई मायनों में कुछ हद तक एक बीटा वितरण की तरह (व्यक्तिगत रूप से, मैं इस लॉग-लॉजिस्टिक को कॉल करूंगा, क्योंकि इसका लॉजिस्टिक लॉजिस्टिक है)। यहाँ विभिन्न मूल्यों के कुछ उदाहरण दिए गए हैं :वाई ( 0 , 1 ) पी = exp ( वाई )(μ,τ)Y(0,1) पीμ,τP=exp(Y)1+exp(Y)Pμ,τ
Witten एट अल द्वारा पाठ में संक्षिप्त उल्लेख को देखते हुए, यह "लॉग-ऑड्स वितरण" के उद्देश्य से हो सकता है - लेकिन वे आसानी से कुछ और मतलब हो सकते हैं।
एक और संभावना यह है कि लॉगिट-नॉर्म का इरादा था।
हालाँकि, शब्द का उपयोग वैन एरप और वैन गेल्डर (2008) , उदाहरण के लिए, बीटा वितरण पर लॉग-ऑड ट्रांसफ़ॉर्म को संदर्भित करने के लिए (इसलिए प्रभावी रूप से को एक लॉजिस्टिक और के रूप में लेना। एक बीटा-प्राइम यादृच्छिक चर के लॉग के वितरण के रूप में , या दो चि-वर्ग यादृच्छिक चर के लॉग के अंतर के समान वितरण)। हालांकि, वे इसका उपयोग मॉडल गणना अनुपात करने के लिए कर रहे हैं, जो असतत हैं। यह निश्चित रूप से, कुछ समस्याओं की ओर जाता है (0 और 1 पर परिमित संभावना वाले वितरण को मॉडल करने की कोशिश के कारण पर एक के साथ एफजी(०,१)[ १ ]एफजी( 0 , 1 )), जो तब वे बहुत प्रयास करते हैं। (यह अनुचित मॉडल से बचने के लिए आसान प्रतीत होता है, लेकिन शायद यह सिर्फ मेरे लिए है।)
कई अन्य दस्तावेज (मुझे कम से कम तीन मिले) लॉग-ऑड्स (यानी ऊपर के पैमाने पर) के नमूने वितरण को "लॉग-ऑड्स वितरण" के रूप में संदर्भित करते हैं (कुछ मामलों में जहां एक असतत अनुपात है * और कुछ में ऐसे मामले जहां यह एक सतत अनुपात है) - तो उस स्थिति में यह एक संभावना मॉडल नहीं है, लेकिन यह ऐसा कुछ है जिसके लिए आप वास्तविक लाइन पर कुछ वितरण मॉडल लागू कर सकते हैं।पYपी
* फिर से, यह समस्या है कि यदि ठीक 0 या 1 है, तो का मान क्रमशः होगा या ... जो बताता है कि हमें इस उद्देश्य के लिए इसका उपयोग करने के लिए वितरण को 0 और 1 से दूर करना होगा। ।वाई - ∞ ∞पीY- ∞∞
यान गुओ (2009) द्वारा निबंध शब्द का उपयोग लॉग-लॉजिस्टिक डिस्ट्रीब्यूशन, वास्तविक हाफ-लाइन पर राइट-स्क्यू डिस्ट्रीब्यूशन को संदर्भित करने के लिए करता है ।[ २ ]
इसलिए जैसा कि आप देख रहे हैं, यह एक अर्थ के साथ एक शब्द नहीं है। Witten से स्पष्ट संकेत के बिना या उस पुस्तक के अन्य लेखकों में से एक, हम अनुमान लगाने के लिए बचे हैं कि क्या इरादा है।
[१]: नोएल वैन एर्प एंड पीटर वैन जेलर, (२००)),
"ब्रेकडाउन के मामले में बीटा डिस्ट्रीब्यूशन की व्याख्या कैसे करें,"
६ वीं इंटरनेशनल प्रोबायलिस्टिक वर्कशॉप की कार्यवाही , डार्मस्टैड
पीडीएफ लिंक
[२]: यान गुओ, (२०० ९),
द न्यू मेथड्स ऑन एनडीई सिस्टम्स पॉड कैपेबिलिटी एसेस्मेंट एंड रोबस्टनेस,
शोध के लिए ग्रेजुएट स्कूल ऑफ वेन स्टेट यूनिवर्सिटी, डेट्रायट, मिशिगन