अधिकतम संभावना अनुमान की मानक त्रुटि से क्या अभिप्राय है?


21

मैं एक गणितज्ञ स्व-अध्ययन के आँकड़े और विशेष रूप से भाषा के साथ संघर्ष कर रहा हूँ।

मैं जिस पुस्तक का उपयोग कर रहा हूं, उसमें निम्नलिखित समस्या है:

एक यादृच्छिक चर को रूप में दिया गया है, जिसे Alpha साथ वर्गीकृत किया गया है । (बेशक, आप इस प्रश्न के लिए एक पैरामीटर के आधार पर कोई भी वितरण ले सकते हैं।) फिर पांच मान , 21 , 6 , 32 , 2 का एक नमूना दिया गया है।पारेतो ( α , 60 ) α > 0 14XPareto(α,60)α>014216322

पहला भाग: "अधिकतम संभावना की विधि का उपयोग करना, एक अनुमान लगता है α की α [नमूना] पर आधारित है।" यह कोई समस्या नहीं थी। जवाब है अल्फा4.6931α^αα^4.6931

लेकिन फिर: " " के मानक त्रुटि के लिए एक अनुमान दें । "α^

इसका क्या मतलब है? चूंकि एक निश्चित वास्तविक संख्या है, मैं नहीं देखता कि किस तरह से यह एक मानक त्रुटि हो सकती है। क्या मैं के मानक विचलन का निर्धारण करने के लिए हूं ? परेटो( α ,60)α^Pareto(α^,60)

अगर आपको लगता है कि प्रश्न स्पष्ट नहीं है, तो यह जानकारी मेरी भी मदद करेगी।


क्या के लिए खड़ा है? 60
एलेकोस पापाडोपोलोस 20

क्या आपके पास कोई सूत्र है ? जो आपको इसकी मानक त्रुटि का अनुमान लगाने में मदद करेगा। α^
रात

1
@Glen_b लेकिन अगर यह निचली सीमा थी तो यह कैसे हो सकता है कि एहसास किए गए नमूने के सभी मूल्य छोटे हों?
एलेकोस पापाडोपोलस

1
@ एलेकोस यह एक उत्कृष्ट बिंदु है। मेरी टिप्पणी का कोई मतलब नहीं है; मैंने इसे मिटा दिया।
Glen_b -Reinstate Monica

1
@ एलेकोस: घनत्व साथ वितरण है । Pareto(α,λ)f(x)=αλα(λ+x)α+1
स्टीफन

जवाबों:


17

अन्य उत्तर ने मानक त्रुटि की व्युत्पत्ति को कवर किया है, मैं सिर्फ आपको अंकन के साथ मदद करना चाहता हूं:

आपका भ्रम इस तथ्य के कारण है कि सांख्यिकी में हम एस्टीमेटर (जो एक फ़ंक्शन है) को निरूपित करने के लिए बिल्कुल उसी प्रतीक का उपयोग करते हैं, और एक विशिष्ट अनुमान (जो कि अनुमानकर्ता को इनपुट के विशिष्ट नमूने के रूप में प्राप्त होने पर प्राप्त होता है)।

So और for । So यादृच्छिक चर का एक कार्य है और इसलिए एक यादृच्छिक चर है, जिसमें निश्चित रूप से एक भिन्नता है। α (एक्स=एक्स)=4.6931x={14,α^=h(X)α^(X=x)=4.6931α ( एक्स )x={14,21,6,32,2}α^(X)

एमएल आकलन में, कई मामलों में हम जो गणना कर सकते हैं वह एसिम्प्टोटिक मानक त्रुटि है, क्योंकि अनुमानक का परिमित-नमूना वितरण ज्ञात नहीं है (व्युत्पन्न नहीं किया जा सकता है)।

कड़ाई से बोलते हुए, में एक असममित वितरण नहीं होता है, क्योंकि यह एक वास्तविक संख्या (एमएल अनुमान के लगभग सभी मामलों में सही संख्या) में परिवर्तित हो जाता है। लेकिन मात्रा एक सामान्य यादृच्छिक चर (केंद्रीय सीमा प्रमेय के अनुप्रयोग द्वारा परिवर्तित होती है।α^n(α^α)

उल्लेखनीय भ्रम का एक दूसरा बिंदु : अधिकांश, यदि सभी पाठ नहीं हैं, तो ("Avar" = asymptotic प्रसरण ") लिखेंगे, जबकि उनका अर्थ है , अर्थात वे मात्रा के वर्गमूलक विचलन का उल्लेख करते हैं , ... मूल पेरेटो के मामले के लिए वितरण हमारे पास हैAvar ( Avar(α^)Avar(n(α^α)) αn(α^α)α^

Avar[n(α^α)]=α2

और so

Avar(α^)=α2/n

(लेकिन जो आपको लिखा मिलेगा वह है ) Avar(α^)=α2

अब, किस अर्थ में एस्टिमेटर का एक "एसिम्प्टोटिक विचरण" है, जैसा कि कहा गया है, एसिम्पोटिक रूप से यह एक स्थिर में परिवर्तित होता है? ठीक है, एक अनुमानित अर्थ में और बड़े लेकिन परिमित नमूने के लिए। यानी कहीं-कहीं "छोटे" नमूने के बीच, जहां एस्टीमेटर एक यादृच्छिक चर है (आमतौर पर) अज्ञात वितरण के साथ, और "अनंत" नमूना, जहां अनुमानक एक स्थिर है, यह "बड़ा लेकिन परिमित नमूना क्षेत्र" है जहां अनुमानक अभी तक स्थिर नहीं हुआ है और जहां इसका वितरण और विचरण एक गोल चक्कर रास्ते से होता है, पहले सेंट्रल लिमिट थ्योरम का उपयोग करके मात्रा का ठीक से विषम वितरण प्राप्त करेंα^Z=n(α^α)(जो सीएलटी के कारण सामान्य है), और फिर चीजों को घुमाकर लिख रहा है (एक कदम पीछे ले जाते हुए और को परिमित मानकर) जो दिखाता है सामान्य रैंडम वेरिएबल एफाइन फंक्शन के रूप में , और इसलिए सामान्य रूप से खुद को (हमेशा लगभग) वितरित किया जाता है।α^=1nZ+αnα^जेड


+1 को और बीच अंतर करने के लिए - निश्चित रूप से अंकन असंगत हो सकता है। α^n(α^-α)
नैट पोप

21

α^ - एक अधिकतम संभावना अनुमानक - एक यादृच्छिक नमूने का एक कार्य है, और इसलिए यादृच्छिक (निश्चित नहीं) भी है। फिशर सूचना से की मानक त्रुटि का एक अनुमान प्राप्त किया जा सकता है,α^

I(θ)=E[2L(θ|Y=y)θ2|θ]

जहाँ एक पैरामीटर है और यादृच्छिक नमूना पर का लॉग-लाइक फ़ंक्शन है । वास्तव में, फिशर जानकारी MLE के चारों ओर लॉग-लाइलेबिलिटी सतह की वक्रता की स्थिरता को इंगित करता है, और इसलिए ' ' के बारे में 'जानकारी' की मात्रा बारे में प्रदान करती है ।θL(θ|Y=y)θyyθ

एक एक साकार Y = y के साथ वितरण, लॉग-लाइबिलिटी जहां y 0 ज्ञात है:Pareto(α,y0)Y=yy0

फिशर जानकारी की परिभाषा में प्लगिंग, I(α)=1

एल(α|y,y0)=लॉगα+αलॉगy0-(α+1)लॉगyएल'(α|y,y0)=1α+लॉगy0-लॉगyएल"(α|y,y0)=-1α2
नमूने के लिए{y1,y2,,Yn}अधिकतम संभावना आकलनकर्ता α : asymptotically के रूप में वितरित किया जाता है α n ~ एन (α, 1
मैं(α)=1α2
{y1,y2,,yn}α^ जहांnनमूना आकार है। क्योंकिαअज्ञात है, हम में प्लग कर सकते हैंαएक अनुमान मानक त्रुटि प्राप्त करने के लिए: एस(α)
α^~nएन(α,1nमैं(α))=एन(α,α2n), 
nαα^
एस(α^)α^2/n4.69312/52.1

1
α^~nएन(α,1nमैं(α))nnα^˙एन(α,1nमैं(α))
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.