अधिकतम अनुमानित वितरण का अधिकतम अनुमान कैसे लगाया जाता है?


9

मैं MLE के बारे में एक फिटेड डिस्ट्रिब्यूशन जेनरेट करने की विधि के रूप में पढ़ रहा हूं।

मुझे यह कहते हुए एक बयान आया कि अधिकतम संभावना का अनुमान है "सामान्य वितरण लगभग है।"

इसका मतलब यह है कि अगर मैं अपने डेटा और वितरण के परिवार पर MLE को बार-बार लागू करता हूं जिसे मैं फिट करने का प्रयास कर रहा हूं, तो मुझे जो मॉडल मिलते हैं वे सामान्य रूप से वितरित किए जाएंगे? वितरण के अनुक्रम का वास्तव में वितरण कैसे होता है?


3
जब आप तो अपने डेटा के लिए बार-बार MLE लागू होते हैं - किसी भी कम्प्यूटेशनल त्रुटियों को छोड़कर - आप मिल जाएगा कि वास्तव में एक ही परिणाम हर बार। इसके बजाय इस बारे में सोचने का तरीका उन तरीकों पर चिंतन करना है जिनसे आपका डेटा अलग हो सकता है। जब डेटा भिन्न होता है, तो एमएल उनके आधार पर अनुमान लगाते हैं और यह अनुमानों में परिणामी भिन्नता है जो बहुत रुचि का है।
whuber

आह हाँ ... मैं नमूना आकार पर विचार नहीं कर रहा था ...
मैट ओ'ब्रायन

यहाँ चर्चा पर एक नज़र है: andrewgelman.com/2012/07/05/…
kjetil b halvorsen

जवाबों:


17

अनुमानक आँकड़े हैं, और आँकड़ों का नमूना वितरण है (अर्थात, हम उस स्थिति के बारे में बात कर रहे हैं जहाँ आप एक ही आकार के नमूने खींचते रहते हैं और आपके द्वारा प्राप्त अनुमानों के वितरण को देखते हुए, प्रत्येक नमूने के लिए एक)।

उद्धरण MLEs के वितरण की बात कर रहा है क्योंकि नमूना आकार अनन्तता का दृष्टिकोण रखता है।

तो आइए एक स्पष्ट उदाहरण पर विचार करें, एक घातांक वितरण के पैरामीटर (स्केल पैरामीटराइजेशन का उपयोग कर, न कि रेट पैरामीटराइजेशन)।

f(x;μ)=1μexμ;x>0,μ>0

इस मामले में μ^=x¯। प्रमेय हमें नमूना आकार के रूप में देता हैnबड़ा और बड़ा हो जाता है, का वितरण (उचित रूप से मानकीकृत)X¯ (घातीय डेटा पर) और अधिक सामान्य हो जाएगा।

यहाँ छवि विवरण दर्ज करें

यदि हम बार-बार नमूने लेते हैं, तो आकार 1 में से प्रत्येक, नमूना के घनत्व का परिणाम शीर्ष बाएं प्लॉट में दिया गया है। यदि हम दोहराए गए नमूने लेते हैं, तो आकार 2 में से प्रत्येक, नमूना साधनों के परिणामस्वरूप घनत्व शीर्ष दाएं भूखंड में दिया गया है; नीचे n = 25 तक, दाईं ओर, नमूना साधनों का वितरण पहले से बहुत अधिक सामान्य दिखने लगा है।

(इस मामले में, हम पहले ही अनुमान लगा लेंगे कि CLT की वजह से ऐसा ही है। लेकिन वितरण 1/X¯ सामान्यता से भी संपर्क करना चाहिए क्योंकि यह दर पैरामीटर के लिए एमएल है λ=1/μ ... और आप इसे CLT से प्राप्त नहीं कर सकते - कम से कम सीधे * नहीं - क्योंकि हम मानकीकृत के बारे में बात नहीं कर रहे हैं और कोई मतलब नहीं है, जो कि CLT के बारे में है)

अब ज्ञात पैमाने माध्य के साथ एक गामा वितरण के आकार पैरामीटर पर विचार करें (यहाँ पैमाने और आकार के बजाय एक माध्य और आकार के पैरामीटर का उपयोग करते हुए)।

इस मामले में अनुमानक बंद फॉर्म नहीं है, और सीएलटी उस पर लागू नहीं होता है (फिर से, कम से कम सीधे * *) नहीं, लेकिन फिर भी संभावना फ़ंक्शन का argmax MLE है। जैसा कि आप बड़े और बड़े नमूने लेते हैं, आकार पैरामीटर अनुमान का नमूना वितरण अधिक सामान्य हो जाएगा।

यहाँ छवि विवरण दर्ज करें

गामा (2,2) के आकार पैरामीटर के अनुमानित अनुमानों के 10000 सेटों से ये कर्नेल घनत्व अनुमान हैं, संकेतित नमूना आकारों के लिए (परिणामों के पहले दो सेट बेहद भारी-पूंछ वाले थे; वे कुछ हद तक आप को काट दिया गया है; मोड के पास आकार देख सकते हैं)। इस मामले में मोड के पास आकार केवल धीरे-धीरे अब तक बदल रहा है - लेकिन चरम पूंछ काफी नाटकीय रूप से छोटा हो गया है। यह एक लग सकता हैn कई सौ सामान्य दिखने के लिए।

-

* जैसा कि उल्लेख किया गया है, सीएलटी सीधे लागू नहीं होता है (स्पष्ट रूप से, क्योंकि हम सामान्य तरीके से काम नहीं कर रहे हैं)। हालाँकि, आप एक अस्मितावादी तर्क दे सकते हैं जहाँ आप किसी चीज़ का विस्तार करते हैंθ^ एक श्रृंखला में, उच्च क्रम की शर्तों से संबंधित एक उपयुक्त तर्क दें और उस मानकीकृत संस्करण को प्राप्त करने के लिए CLT के एक रूप को लागू करें θ^ दृष्टिकोण सामान्यता (उपयुक्त परिस्थितियों में ...)।

यह भी ध्यान दें कि जब हम छोटे नमूनों (अनंत की तुलना में छोटे, कम से कम) को देख रहे हैं, तो यह प्रभाव होता है - कि विभिन्न स्थितियों में सामान्यता की ओर नियमित प्रगति, जैसा कि हम ऊपर दिए गए भूखंडों से प्रेरित देखते हैं - यह सुझाव देगा कि यदि हम एक मानकीकृत आँकड़ा के cdf पर विचार करते हैं, कुछ बेरी एसेन असमानता जैसी चीज का एक संस्करण हो सकता है जो MLE के साथ CLT तर्क का उपयोग करने के तरीके के आधार पर होता है जो नमूना वितरण सामान्यता तक कैसे पहुंच सकता है, इस पर सीमा प्रदान करता है। मैंने ऐसा कुछ नहीं देखा है, लेकिन यह मुझे आश्चर्यचकित नहीं करेगा कि यह किया गया था।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.