त्रिकोण वितरण के लिए MLE?


12

क्या त्रिकोण वितरण के लिए सामान्य MLE प्रक्रिया को लागू करना संभव है? - मैं कोशिश कर रहा हूं, लेकिन वितरण को परिभाषित करने के तरीके से मुझे गणित में एक कदम या दूसरे पर अवरुद्ध होना प्रतीत होता है। मैं इस तथ्य का उपयोग करने की कोशिश कर रहा हूं कि मुझे ग के ऊपर और नीचे के नमूनों की संख्या पता है (सी जानने के बिना): ये 2 नंबर cn हैं और (1-c) n, यदि n नमूनों की कुल संख्या है। हालाँकि, यह व्युत्पत्ति में मदद नहीं करता है। क्षणों का क्षण बिना किसी समस्या के ग के लिए एक अनुमानक देता है। MLE के लिए बाधा की सटीक प्रकृति क्या है (यदि वास्तव में वहाँ एक है)?

अधिक जानकारी:

आइए में विचार करें और वितरण को पर परिभाषित करें : [ 0 , 1 ] [ 0 , 1 ]c[0,1][0,1]

f(x;c)=2(1-x)f(x;c)=2xc अगर x <c यदि c <= x
f(x;c)=2(1x)(1c)

आइए इस वितरण से एक iid नमूने लें{ x i }n{xi}

l^(c|{xi})=i=1nln(f(xi|c))

मैं तब इस तथ्य का उपयोग करने की कोशिश कर रहा हूं कि के रूप को देखते हुए , हम जानते हैं कि नमूने (अज्ञात) नीचे गिरेंगे , और ऊपर गिर जाएगा । IMHO, यह लॉग-लाइबिलिटी की अभिव्यक्ति में इस प्रकार समन को विघटित करने की अनुमति देता है:c n c ( 1 - c ) n cfcnc(1c)nc

l^(c|{xi})=i=1cnln2xic+i=1(1c)nln2(1xi)1c

यहां, मैं अनिश्चित हूं कि कैसे आगे बढ़ना है। MLE में लॉग- लाइबिलिटी के व्युत्पन्न wrt लेना शामिल होगा , लेकिन मेरे पास के ऊपरी बाउंड के रूप में , जो कि ब्लॉक करने के लिए लगता है। मैं संकेतक कार्यों का उपयोग करके लॉग-लाइकैलिटी के दूसरे रूप के साथ प्रयास कर सकता हूं:सीcc

l^(c|{xi})=i=1n{xi<c}ln2xic+i=1n{c<=xi}ln2(1xi)1c

लेकिन संकेतकों को प्राप्त करना आसान नहीं लगता है, हालांकि डायराक डेल्टास जारी रखने की अनुमति दे सकता है (जबकि अभी भी संकेतक हैं, क्योंकि हमें उत्पादों को प्राप्त करने की आवश्यकता है)।

इसलिए, यहाँ मैं MLE में अवरुद्ध हूँ। कोई उपाय?


यदि यह किसी विषय के लिए है तो कृपया स्व-अध्ययन टैग जोड़ें। यदि ऐसा नहीं है, तो कृपया बताएं कि समस्या कैसे उत्पन्न होती है।
Glen_b -Reinstate मोनिका

अद्यतन के लिए धन्यवाद; जवाब में समझदार बातें कहना बहुत आसान हो जाता है, क्योंकि इससे निपटने के लिए मामलों की गुंजाइश कम हो जाती है। क्या आप कृपया मेरी पूर्व टिप्पणी पर विचार कर सकते हैं। या तो यह स्व-अध्ययन टैग के तहत आता है या यह नहीं है, या तो मामले में मैंने पूछा है कि क्या आप कुछ करेंगे।
Glen_b -Reinstate Monica

यह एक होमवर्क या एक वर्ग के लिए नहीं है। यह मेरे काम पर उठता है। हमारे पास क्षणों की विधि से एक और अनुमानक है, लेकिन मैं यहां MLE के साथ क्या हो रहा है इसकी गहरी समझ प्राप्त करने की कोशिश कर रहा हूं।
फ्रैंक

ठीक है; यह मुझे और अधिक मार्ग देता है। देखिये मेरा अपडेटेड जवाब। मैं शायद जल्द ही इसके अतिरिक्त
जोड़ दूंगा

जोड़े गए संदर्भ / लिंक
Glen_b -Reinstate Monica

जवाबों:


10

क्या त्रिकोण वितरण के लिए सामान्य MLE प्रक्रिया को लागू करना संभव है?

निश्चित रूप से! हालाँकि इससे निपटने के लिए कुछ विषमताएँ हैं, लेकिन इस मामले में MLE की गणना करना संभव है।

हालाँकि, अगर 'सामान्य प्रक्रिया' से आपका मतलब 'लॉग-लाइक के व्युत्पत्ति को लेना और इसे शून्य के बराबर सेट करना है', तो शायद नहीं।

MLE के लिए बाधा की सटीक प्रकृति क्या है (यदि वास्तव में वहाँ एक है)?

क्या आपने संभावना खींचने की कोशिश की है?

-

प्रश्न के स्पष्टीकरण के बाद फॉलोअप:

संभावना को चित्रित करने के बारे में सवाल निष्क्रिय टिप्पणी नहीं थी, लेकिन इस मुद्दे पर केंद्रीय।

MLE में एक व्युत्पन्न लेना शामिल होगा

नहीं। MLE में किसी फ़ंक्शन का argmax खोजना शामिल है। इसमें केवल कुछ शर्तों के तहत व्युत्पन्न के शून्य को ढूंढना शामिल है ... जो यहां नहीं हैं। सबसे अच्छा, यदि आप ऐसा करने का प्रबंधन करते हैं तो आप कुछ स्थानीय मिनीमा की पहचान करेंगे ।

मेरे पहले प्रश्न सुझाव के रूप में, देखने के लिए संभावना पर।

यहां एक नमूना है, 10 टिप्पणियों के एक त्रिकोणीय वितरण से पर (0,1):y

0.5067705 0.2345473 0.4121822 0.3780912 0.3085981 0.3867052 0.4177924
0.5009028 0.8420312 0.2588613

उस डेटा पर के लिए संभावना और लॉग-लाइबिलिटी फ़ंक्शन यहां दिए गए हैं : cत्रिकोणीय के शिखर के लिए संभावना

त्रिकोणीय के शिखर के लिए लॉग-संभावना

ग्रे लाइनें डेटा मानों को चिह्नित करती हैं (मुझे मूल्यों के बेहतर पृथक्करण के लिए संभवतः नया नमूना तैयार करना चाहिए था)। काले डॉट्स उन मूल्यों की संभावना / लॉग-लाइक को चिह्नित करते हैं।

यहां अधिक विस्तार देखने के लिए, संभावना की अधिकतम सीमा के निकट यहां ज़ूम करें:

संभावना का विस्तार

जैसा कि आप देख सकते हैं कि संभावित आंकड़ों में से कई पर, ऑर्डर के आंकड़े में संभावना फ़ंक्शन में तेज 'कोने' हैं - ऐसे बिंदु जहां व्युत्पन्न मौजूद नहीं है (जो कोई आश्चर्य की बात नहीं है - मूल पीडीएफ में एक कोने है और हम एक ले रहे हैं pdfs का उत्पाद)। यह (कि आदेश आँकड़ों पर cusps हैं) त्रिकोणीय वितरण के साथ मामला है, और अधिकतम हमेशा आदेश आँकड़ों में से एक पर होता है। (यह कि क्रस आर्डर आर्डर के आँकड़े त्रिकोणीय वितरण के लिए अद्वितीय नहीं हैं; उदाहरण के लिए लाप्लास घनत्व में एक कोना है और परिणामस्वरूप इसके केंद्र की संभावना प्रत्येक आर्डर स्टैटिस्टिक्स में एक है।)

जैसा कि मेरे नमूने में होता है, अधिकतम चौथे क्रम के आंकड़े के रूप में होता है, 0.3780912

तो (0,1) पर के MLE को खोजने के लिए , बस प्रत्येक अवलोकन पर संभावना खोजें। सबसे बड़ी संभावना वाला व्यक्ति M का ।सीcc

एक उपयोगी संदर्भ जोहान वान डोर्प और सैमुअल कोटज़ द्वारा " बियॉन्ड बीटा " का अध्याय 1 है । जैसा कि होता है, अध्याय 1 पुस्तक के लिए एक नि: शुल्क 'नमूना' अध्याय है - आप इसे यहाँ डाउनलोड कर सकते हैं

त्रिकोणीय वितरण के साथ इस मुद्दे पर एडी ओलिवर द्वारा एक प्यारा सा कागज है, मुझे लगता है कि अमेरिकी सांख्यिकीविद् (जो मूल रूप से एक ही बिंदु बनाता है; मुझे लगता है कि यह एक शिक्षक के कोने में था)। अगर मैं इसका पता लगाने का प्रबंधन कर सकता हूं तो मैं इसे एक संदर्भ के रूप में दूंगा।

संपादित करें: यहाँ यह है:

ईएच ओलिवर (1972), ए मैक्सिमम लाइकैलिटी ओडिटी ,
द अमेरिकन स्टेटिस्टिशियन , वॉल्यूम 26, अंक 3, जून, पृष्ठ 43-44

(प्रकाशक लिंक )

यदि आप इसे आसानी से पकड़ सकते हैं, तो यह देखने लायक है, लेकिन यह Dorp और Kotz अध्याय अधिकांश प्रासंगिक मुद्दों को कवर करता है, इसलिए यह महत्वपूर्ण नहीं है।


टिप्पणियों में सवाल पर फॉलोअप के माध्यम से - भले ही आप कोनों को 'चौरसाई' करने का कोई तरीका पा सकें, फिर भी आपको इस तथ्य से निपटना होगा कि आप कई स्थानीय मैक्सीमा प्राप्त कर सकते हैं:

दो स्थानीय अधिकतम

हालाँकि, अनुमान लगाने वालों के लिए बहुत अच्छे गुण (क्षणों की विधि से बेहतर) प्राप्त करना संभव हो सकता है, जिसे आप आसानी से लिख सकते हैं। लेकिन त्रिकोणीय (0,1) पर एमएल कोड की कुछ पंक्तियाँ हैं।

अगर यह भारी मात्रा में डेटा की बात है, तो इससे भी निपटा जा सकता है, लेकिन एक और सवाल होगा, मुझे लगता है। उदाहरण के लिए, प्रत्येक डेटा बिंदु अधिकतम नहीं हो सकता है, जो काम को कम करता है, और कुछ अन्य बचतें हैं जिन्हें बनाया जा सकता है।


धन्यवाद - मैं अपने असफल प्रयास को पोस्ट करने की कोशिश करूंगा, यह दिखाते हुए कि मैं किस वितरण के बारे में बात कर रहा हूं और मुझे लगता है कि मैं अवरुद्ध हूं।
फ्रैंक

विस्तृत विवरण के लिए धन्यवाद! हालांकि मुझे एक और विचार था: मान लें कि मैं फ़ंक्शन का एक परिवार पा सकता हूं जो त्रिकोण वितरण में परिवर्तित होता है, लेकिन टुकड़ा नहीं होगा - क्या मैं उपयोग कर सकता हूं कि एक MLE को विश्लेषणात्मक रूप से प्राप्त करने के लिए, फिर सीमा लें और मान लें कि मेरे पास एक MLE होगा त्रिकोण वितरण ही?
फ्रैंक

संभवतः - मुझे लगता है कि आप जिस विशेष सीमा प्रक्रिया का उपयोग करते हैं उस पर निर्भर हो सकते हैं ... और संभवतः आप अभी भी कई स्थानीय मैक्सिमा के साथ समाप्त होंगे, इसलिए संभवतः यह आपको चरम क्रम के आंकड़ों के पास संभावना का मूल्यांकन करने से बचाता है - लेकिन भले ही यह काम किया है, तो आप भी इतना जटिल कुछ करने की कोशिश क्यों करेंगे? त्रिकोणीय वितरण पर एमएल के साथ क्या गलत है? यह वास्तव में अभ्यास करने के लिए काफी सरल है।
Glen_b -Reinstate Monica

2
मुझे कहना होगा, ऑर्डर आंकड़ों के आधार पर ग के लिए यह MLE बहुत अच्छा है, हालांकि ऊपर अध्याय में व्युत्पत्ति कुछ काम लेती है (हालांकि बहुत कठिन नहीं है) - अच्छा चित्रण कि MLE का सार argmax में है (बेशक!)। व्युत्पन्न के बजाय (जैसा कि आपने बताया, और मैं पूरी तरह से सहमत हूं, यह मेरे लिए "सामान्य" व्युत्पन्न कदम के ऊपर काम करने के लिए हुआ है (यानी जो कुछ भी मतलब है, अधिकतम करने के बारे में चिंता करें), लेकिन मैंने पीछा नहीं किया)।
फ्रैंक

1
@Frank: एक अतिरिक्त संदर्भ हुआंग और शेन (2007) अधिक से अधिक संभावना विषमताएं , जर्नल ऑफ़ स्टैटिस्टिकल प्लानिंग एंड इंट्रेंस, वॉल्यूम 137, अंक 7, जुलाई, पीपी 2151-2155 है। ग्लेन: ऑर्डर के आंकड़ों से , क्या आपका मतलब केवल ऑर्डर किए गए मानों ? xi
COOLSerdash
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.