अधिकतम संभावना अनुमान को समझने के लिए कितना कलन आवश्यक है?


11

मैं MLE सीखने के लिए एक अध्ययन योजना बनाने की कोशिश कर रहा हूं। ऐसा करने के लिए मैं यह पता लगाने की कोशिश कर रहा हूं कि एमयूएल को समझने के लिए कैलकुलस का न्यूनतम स्तर क्या है।

क्या MLE को समझने के लिए कलन की मूल बातें (यानी न्यूनतम और अधिकतम कार्यों को खोजना) को समझना पर्याप्त है?


2
हमेशा की तरह, यह निर्भर करता है । यदि आप केवल आधारभूत बातों को समझने की कोशिश कर रहे हैं, तो कार्यों का विलुप्त होने का पता लगाने में सक्षम होने के नाते आपको एक उचित तरीका मिल जाता है (हालांकि MLE के कई व्यावहारिक मामलों में, L संख्यात्मक रूप से होता है, इस मामले में आपको कुछ अन्य कौशल की भी आवश्यकता है कुछ बुनियादी गणनाओं के रूप में)।
Glen_b -Reinstate मोनिका

धन्यवाद। क्या आप इस मामले का अधिक विस्तार से उल्लेख कर सकते हैं? यह दिलचस्प लगता है।
हिस्टेलिमे

ठीक है, लेकिन अब मुझे इसका जवाब देना है। डटे रहो।
Glen_b -Reinstate मोनिका

जवाबों:


20

मेरी टिप्पणी पर विस्तार करने के लिए - यह निर्भर करता है। यदि आप केवल आधारभूत बातों को समझने की कोशिश कर रहे हैं, तो फ़ंक्शंस का पता लगाने में सक्षम होने से आपको एक उचित रास्ता मिल जाता है (हालांकि MLE के कई व्यावहारिक मामलों में, संभावना को संख्यात्मक रूप से अधिकतम किया जाता है, इस मामले में आपको कुछ अन्य कौशल की भी आवश्यकता होती है। मूल पथरी)।

मैं उन अच्छे सरल मामलों को छोड़ दूँगा जहाँ आपको स्पष्ट बीजगणितीय समाधान मिलते हैं। फिर भी, पथरी अक्सर बहुत उपयोगी होती है।

मैं स्वतंत्रता भर मानूंगा। 1-पैरामीटर अनुकूलन के सबसे सरल संभव मामले को लेते हैं। पहले हम एक ऐसे मामले को देखेंगे जहां हम डेरिवेटिव ले जा सकते हैं और पैरामीटर और एक आंकड़े के एक फंक्शन को अलग कर सकते हैं।

पर विचार करें Gamma(α,1) घनत्व

एक्स(एक्स;α)=1Γ(α)एक्सα-1exp(-एक्स);एक्स>0;α>0

फिर आकार n नमूने के लिए , संभावना है

L(α;x)=i=1nfX(xi;α)

और इतने लॉग-संभावना है

l(α;x)=i=1nlnfX(xi;α)=i=1nln(1Γ(α)xiα1exp(xi))
=Σमैं=1n-lnΓ(α)+(α-1)lnएक्समैं-एक्समैं
=-nlnΓ(α)+(α-1)एसएक्स-nएक्स¯
जहांएसएक्स=Σमैं=1nlnएक्समैं । डेरिवेटिव लेना,

αएल(α;एक्स)=α(-nlnΓ(α)+(α-1)एसएक्स-nएक्स¯)
=-nΓ'(α)Γ(α)+एसएक्स
=-nψ(α)+एसएक्स

α^

ψ(α^)=lnजी(एक्स)

ψ()जी()

α^

ψ(α^)=जी

जी=lnजी(एक्स)

प्राथमिक कार्यों के संदर्भ में इसका कोई हल नहीं है, इसकी गणना संख्यात्मक रूप से की जानी चाहिए; कम से कम हम एक तरफ पैरामीटर का एक फ़ंक्शन और दूसरे पर डेटा का एक फ़ंक्शन प्राप्त करने में सक्षम थे। विभिन्न शून्य-खोज एल्गोरिदम हैं जिनका उपयोग किया जा सकता है यदि आपके पास समीकरण को हल करने का एक स्पष्ट तरीका नहीं है (भले ही आप डेरिवेटिव के बिना हों, उदाहरण के लिए बाइनरी सेक्शन है)।

(एक्स;μ)=14SECH2(एक्स-μ2)
μ

θ

एक्स(एक्स;θ)=1π(1+(एक्स-θ)2)

सामान्य तौर पर यहां संभावना एक अद्वितीय स्थानीय अधिकतम नहीं है, लेकिन कई स्थानीय मैक्सिमा हैं। यदि आप एक स्थानीय अधिकतम पाते हैं , तो कहीं और एक बड़ा हो सकता है। (कभी-कभी लोग माध्यिका के निकटतम स्थानीय अधिकतम या कुछ-कुछ की पहचान करने पर ध्यान केंद्रित करते हैं।)

(0,θ)

अन्य मामलों में, पैरामीटर स्थान असतत हो सकता है।

कभी-कभी अधिकतम ढूंढना काफी शामिल हो सकता है।

और यह सिर्फ एक पैरामीटर के साथ मुद्दों का एक नमूना है। जब आपके पास कई पैरामीटर होते हैं, तो चीजें फिर से जुड़ जाती हैं।


4

आरपीआर

लॉगरिदम के साथ कुछ सुविधा निश्चित रूप से सहायक होगी, क्योंकि संभावना के लॉगरिदम को अधिकतम करना आमतौर पर संभावना को अधिकतम करने की तुलना में बहुत आसान है।

आरपीआर

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.