मैं सामान्य वितरण से नमूना मानक विचलन का मानक विचलन कैसे पा सकता हूं?


11

मुझे माफ कर दो अगर मैंने कुछ स्पष्ट याद किया है।

मैं एक भौतिक विज्ञानी हूं जो अनिवार्य रूप से एक (हिस्टोग्राम) वितरण एक औसत मूल्य के बारे में केंद्रित है जो एक सामान्य वितरण के लिए अनुमानित है। मेरे लिए महत्वपूर्ण मूल्य इस गाऊसी यादृच्छिक चर का मानक विचलन है। मैं नमूना मानक विचलन पर त्रुटि को खोजने की कोशिश कैसे करूंगा? मुझे मूल हिस्टोग्राम में प्रत्येक बिन पर त्रुटि के साथ कुछ करने की अपनी भावना है।


आँकड़े.स्टैकएक्सचेंज . com / questions / 26924 पर एक संकेत दिया गया है । सामान्य तौर पर, वितरण के पहले चार क्षणों के संदर्भ में एक विचरण की नमूना त्रुटि की गणना की जा सकती है और इसलिए एसडी के नमूने की त्रुटि का अनुमान कम से कम उन क्षणों से लगाया जा सकता है।
whuber

जवाबों:


12

ऐसा लगता है कि आप नमूना मानक विचलन के मानक विचलन की गणना के लिए पूछ रहे हैं। अर्थात, आप लिए पूछ रहे हैं , जहां:SD(s)=var(s)

s=1n1i=1n(XiX¯),

X1,...,XnN(μ,σ2) और नमूना माध्य है।X¯

सबसे पहले, हम विचरण के मूल गुणों से जानते हैं

var(s)=E(s2)E(s)2

चूँकि नमूना प्रसरण निष्पक्ष है, हम जानते हैं । में क्यों नमूना मानक विचलन का एक पक्षपाती आकलनकर्ता है ? , की गणना की जाती है, जिससे हम अनुमान लगा सकते हैंσE(s2)=σ2σE(s)

E(s)2=2σ2n1(Γ(n/2)Γ(n12))2

इसलिये

एसडी(रों)=(रों2)-(रों)2=σ1-2n-1(Γ(n/2)Γ(n-12))2

अच्छी बात। मुझे s ^ 2 के विचरण का अनुमान लग गया। वर्गमूल लेने से s ^ 2 के मानक विचलन का अनुमान होता है। लेकिन आपने वास्तविक प्रश्न का उत्तर दिया जो कि मानक विचलन प्राप्त करना था। मुझे लगता है कि व्यावहारिक कारणों से आप भी सूत्र का उपयोग करके अनुमान प्राप्त करने के लिए s की जगह लेंगे।
माइकल आर। चेरिक

हां, यह सही है, आप साथ को बदल सकते हैं और यह सन्निकटन मामूली नमूना आकारों के लिए भी अच्छा प्रदर्शन करता है - मैंने साथ कुछ परीक्षण किया । s n = 20σरोंn=20
मैक्रों

11

मात्रा में स्वतंत्रता के डिग्री के साथ ची-चुकता वितरण होता है जब नमूने स्वतंत्र होते हैं और समान सामान्य वितरण के साथ वितरित होते हैं, इस मात्रा का उपयोग आत्मविश्वास प्राप्त करने के लिए किया जा सकता है। सामान्य और इसके मानक विचलन के विचरण के लिए अंतराल। यदि आपके पास कच्चे मूल्य हैं और न केवल डिब्बे के केंद्रीय मूल्य से आप गणना कर सकते हैं । n - 1एक्स=(n-1)रों2/σ2n-1रों2

यह ज्ञात है कि अगर का ch-squared वितरण डिग्री स्वतंत्रता के साथ है तो इसका विचरण । इस और तथ्य को जानकर हम प्राप्त करते हैं कि में एक विचरण बराबर है यद्यपि अज्ञात है, आप इसे द्वारा अनुमानित कर सकते हैं और आपको इस बात का अंदाजा है कि का विचलन क्या है।एन - 1 2 ( एन - 1 ) वी एक आर ( एक्स ) = सी 2 वी एक आर ( एक्स ) रों 2 2 ( एन - 1 ) σ 4एक्सn-12(n-1)वीआर(सीएक्स)=सी2वीआर(एक्स)रों2σ 4 एस 4 एस 2

2(n-1)σ4(n-1)2=2σ4n-1
σ4रों4रों2

मैं इसे भीख माँगने के लिए पोस्ट करने जा रहा था, लेकिन जैसा कि मैं यहाँ देख रहा हूँ वह समस्या यह है कि अज्ञात है। उस तथ्य को देखते हुए, मुझे नहीं पता कि क्या यह लगभग लिए मान्य है, अगर हम नमूना आकार भी नहीं जानते हैं। मुझे याद है कि कोई यह दिखा सकता है कि चौथे क्षण आउटलेर्स के साथ गंभीर समस्याएं हो सकती हैं। रों 4σ 4σ2रों4σ4
नेस्टर

σ 4 σ 4रों4 का एक सुसंगत अनुमानक है (बशर्ते कि मौजूद है), सही @Nesp? मुझे लगता है कि यह आमतौर पर है जब लोगों ने "अनुमानित" या "मोटा विचार" कहा है। σ4σ4
मैक्रो

2
शायद नींद की कमी है, लेकिन क्या यह सर्कुलर तर्क की तरह नहीं है?
नेस्टर

हमने शुरू से ही यह मान लिया था कि डेटा एक सामान्य वितरण से आया है, इसलिए कोई बाहरी मुद्दा नहीं है। मैं जिस तरह से मैक्रों का सुझाव देता है, उसका मतलब है। मैं मानता हूं कि नमूना आकार प्रभावित करता है कि कैसे s ^ 4 4 ^ 4 के करीब है। लेकिन आउटलेयर के बारे में चिंता नेस्प्स नेस्प्स है। अगर आपने मुझे इसके लिए नीचा दिखाया तो मुझे लगता है कि यह बहुत अनुचित है। जब मैंने डेटा s के मानक मानक विचलन का आकलन करने का मानक तरीका प्रस्तुत किया था, जब डेटा सामान्य रूप से अस्वीकृत हैं।
माइकल आर। चेरिक

@ नेस्प, माइकल ने सामान्य रूप से वितरित नमूना से नमूना मानक विचलन के विचरण का एक सुसंगत अनुमान लगाया है - बड़े नमूनों के लिए यह अच्छा करेगा - इसका अनुकरण करें और पता करें। मुझे यकीन नहीं है कि आपको क्यों लगता है कि यह परिपत्र तर्क है।
मैक्रो

7

सामान्य मामले में मानक विचलन की त्रुटि की मात्रा निर्धारित करने के कई तरीके हैं। मैं के प्रोफाइल संभावना को प्रस्तुत करने जा रहा हूं जिसका उपयोग आत्मविश्वास अंतरालों को सन्निकटन के लिए किया जा सकता है।σ

चलो एक सामान्य से एक नमूना हो ( μ , σ ) । इसी संभावना समारोह द्वारा दिया जाता हैएक्स=(एक्स1,,एक्सn)(μ,σ)

एल(μ,σ)α1σnexp(-12σ2Σजे=1n(एक्सजे-μ)2)

फिर, अधिकतम संभावना आकलनकर्ता द्वारा दिया जाता है है, जहां रों = (μ^,σ^)=(एक्स¯,रों)। यह देखते हुए कि आप पर त्रुटि मात्र निर्धारण पर रुचि कर रहे हैंσ, तो आप इस प्रकार इस पैरामीटर के सामान्यीकृत प्रोफ़ाइल संभावना की गणना कर सकते हैं।रों=1nΣजे=1n(एक्सजे-एक्स¯)2σ

आरपी(σ)=सुड़कनाμएल(μ,σ)एल(μ^,σ^)=(σ^σ)nexp[n2(1-(σ^σ)2)]

आरपी:आर+(0,1]0.1470.95आर

data = rnorm(30)
n = length(data)
sg = sqrt(mean((data-mean(data))^2))
# Profile likelihood
rp = function(sigma) return( (sg/sigma)^n*exp(0.5*n*(1-(sg/sigma)^2))  )
vec = rvec = seq(0.5,1.5,0.01)
for(i in 1:length(rvec)) rvec[i] = rp(vec[i])
plot(vec,rvec,type="l")
rpc = function(sigma) return(rp(sigma)-0.147)
# Approximate 95% confidence interval
c(uniroot(rpc,c(0.7,0.8))$root,uniroot(rpc,c(1.1,1.3))$root)

σमैं=(एल,यू)σ2मैं'=(एल2,यू2)


मुझे लगता है कि वह वास्तव में सिर्फ मानक विचलन चाहता था।
माइकल आर। चेरिक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.