मानक विचलन का मानक विचलन


54

यदि डेटा की सामान्यता को मान लिया जा सकता है तो मानक विचलन के मानक विचलन का एक अनुमानक क्या है?


मुझे लगता है कि आप नमूना विचरण के वितरण के लिए देख रहे हैं । यह विकिपीडिया पृष्ठ पर खंड के बारे में 16:55, 21 अगस्त 2016 को विचरण करता है। क्योंकि यह विकिपीडिया की एक कड़ी है, भविष्य में लेख बदल सकता है। इसलिए, अनुभाग उन सामग्रियों को प्रतिबिंबित नहीं कर सकता है जो इस तरह के परिवर्तनों के बाद इस उत्तर का उल्लेख कर रहे हैं। इसलिए विकिपीडिया पृष्ठ के ऐतिहासिक संस्करण का लिंक यहां दिया गया है। विचरण के बारे में वर्तमान लेख [यहाँ] पाया गया है ( en.wikipedia.org/wik

जवाबों:


58

चलो । जैसा कि इस धागे में दिखाया गया है , नमूना मानक विचलन का मानक विचलन,X1,...,XnN(μ,σ2)

s=1n1i=1n(XiX¯),

है

SD(s)=E([E(s)s]2)=σ12n1(Γ(n/2)Γ(n12))2

जहां है गामा फ़ंक्शन , नमूने का आकार और है नमूना मतलब है। चूँकि का एक सुसंगत आकलनकर्ता है , इसलिए यह का सुसंगत अनुमानक प्राप्त करने के लिए उपरोक्त समीकरण में साथ को प्रतिस्थापित करने का सुझाव देता है ।Γ()nX¯=1ni=1nXisσσsSD(s)

यदि यह एक निष्पक्ष आकलनकर्ता है जो आप चाहते हैं, तो हम इस धागे में देखते हैं कि , जो अपेक्षा की रैखिकता से पता चलता है,E(s)=σ2n1Γ(n/2)Γ(n12)

sn12Γ(n12)Γ(n/2)

एक निष्पक्ष अनुमानक के रूप में । यह सब अपेक्षा की रैखिकता के साथ मिलकर का निष्पक्ष आकलन करता है : σSD(s)

sΓ(n12)Γ(n/2)n12(Γ(n/2)Γ(n12))2

12
+1 लगभग दो वर्षों के बाद न केवल एक बेहतर उत्तर के साथ आना अच्छा है, बल्कि एक उत्तर जो इस धागे में कहीं और संदर्भों की तुलना में अधिक उपयोगी विवरण प्रदान करता है।
whuber

2
क्या आप पहले फॉर्मूले में दूरियां बनाना भूल गए?
डनिजर

2
गामा फ़ंक्शन छोटे-छोटे मूल्यों के लिए गणना करना कठिन है । स्टर्लिंग के सन्निकटन को लागू करते हुए, मुझे , जो कि कम्प्यूटेशनल रूप से संभव है और साथ ही थोड़ा सा अधिक कॉम्पैक्ट अभिव्यक्ति-वार। nse(11n)n11
18

1
संभवतः यह इंगित करने के लायक है कि एस (@ मैक्रो के उत्तर में गणना की जाती है) को कभी-कभी नमूना मानक मानक विचलन की मानक त्रुटि के रूप में संदर्भित किया जाता है।
हार्वे मोटुलस्की

जो लोग सरल रूप चाहते हैं, उनके लिए कुछ प्रतिशत के स्तर पर एक अच्छा अनुमान है। s/2(n1)
सिरिटिस मेजर

5

मान लें कि आप सामान्य शून्य से iid का अर्थ शून्य और विचरण से । (अनुभवजन्य) मानक विचलन आकलनकर्ता की का वर्गमूल है of (निष्पक्ष या ऐसा नहीं है कि सवाल नहीं है)। एक अनुमानक के रूप में ( साथ प्राप्त ), में एक भिन्नता है जिसे सैद्धांतिक रूप से गणना की जा सकती है। हो सकता है जिसे आप मानक विचलन का मानक विचलन कहते हैं, वह वास्तव में मानक विचलन के वर्गमूल का वर्गमूल है, यानी ? यह एक अनुमानक नहीं है, यह एक सैद्धांतिक मात्रा है ( जैसी कोई चीज़X1,,Xnσ2σ^2σ2X1,,Xnσ^E[(σσ^)2]σ/n पुष्टि की जा सकती है) जिसे विस्फोटक रूप से गणना की जा सकती है!


क्या ऐसा नहीं है कि आकलनकर्ता का एक कार्य अभी भी एक अनुमानक है? मैं अभी भी \ _ सिग्मा को नहीं जानता, केवल X_i।

ठीक है, तो आप संभवतः वर्जन के वर्गमूल के अनुमानों के वर्गमूल के वर्गमूल का अनुमान लगाएंगे ... सही :) कुछ होना चाहिए जैसे ? σ^/n
रॉबिन जिरार्ड

श्रीकांत ने जो पाया (और जो PhysicsForums पर पुष्टि करता है) वहाँ होना चाहिए , इसलिए । 2σ^22n

1
Aww, उन टिप्पणियों ताले; । कम से कम यह बूटस्ट्रैप के साथ समझौते में परिणाम देता है। σ^2n

-3

@ मैक्रो ने गणना करने के लिए समीकरण के साथ एक महान गणितीय स्पष्टीकरण प्रदान किया। यहां कम गणितीय लोगों के लिए अधिक सामान्य अन्वेषण है।

मुझे लगता है कि शब्दावली "एसडी के एसडी" कई को भ्रमित कर रहा है। एसडी के विश्वास अंतराल के बारे में सोचना आसान है। एक नमूने से आपके द्वारा निर्धारित मानक विचलन कितना सही है? बस संयोग से आप डेटा को प्राप्त करने के लिए हो सकते हैं जो एक साथ बारीकी से सटा हुआ है, जिससे नमूना एसडी जनसंख्या की तुलना में बहुत कम है। या आपके पास बेतरतीब ढंग से प्राप्त मूल्य हो सकते हैं जो समग्र आबादी की तुलना में कहीं अधिक बिखरे हुए हैं, नमूना एसडी को जनसंख्या एसडी से अधिक बनाते हैं।

SD के CI की व्याख्या करना सीधा है। प्रथागत धारणा के साथ शुरू करें कि आपका डेटा यादृच्छिक रूप से और स्वतंत्र रूप से गॉसियन वितरण से नमूना था। अब इस नमूने को कई बार दोहराएं। आप उन 95% विश्वास अंतराल की उम्मीद करते हैं जिसमें सच्ची आबादी एसडी शामिल है।

एक एसडी के 95% विश्वास अंतराल कितना चौड़ा है? यह नमूना आकार (n) पर निर्भर करता है।

n: 95% CI का एसडी

2: 0.45 * एसडी से 31.9 * एसडी

3: 0.52 * एसडी से 6.29 * एसडी

5: 0.60 * एसडी से 2.87 * एसडी

10: 0.69 * एसडी से 1.83 * एसडी

25: 0.78 * एसडी से 1.39 * एसडी

50: 0.84 * एसडी से 1.25 * एसडी

100: 0.88 * एसडी से 1.16 * एसडी

500: 0.94 * एसडी से 1.07 * एसडी

मुफ्त वेब कैलकुलेटर


मैं मोंटे कार्लो कर सकता हूं, मैं सिर्फ और अधिक 'शालीनता' तरीके से करना चाहता था; अभी भी आप सही हैं कि वितरण सामान्य नहीं है, इसलिए यह एसडी परीक्षण के लिए बेकार हो जाएगा।

4
जो इसके लायक है, मैं "एक विश्वास अंतराल जो कि 95% है ..." कथन के साथ असहज महसूस कर रहा हूं ... सच एसडी होने की संभावना है (या, जुड़े हुए पृष्ठ में अधिक स्पष्ट रूप से कहा गया है: "आप 95% सुनिश्चित कर सकते हैं कि नमूना से गणना किए गए CI एसडी में सही जनसंख्या एसडी शामिल है))। मुझे लगता है कि ये कथन एक लोकप्रिय गलत धारणा को मज़बूत करने / मजबूत करने के लिए, सीवी पर संबंधित चर्चा के लिए, यहाँ देखें , जैसे।
गुंग - फिर से बहाल करें मोनिका

5
क्या है "मुझे लगता है कि अवधारणा और" एसडी के एसडी "की शब्दावली से निपटने के लिए बहुत फिसलन है" मतलब? " नमूना मानक विचलन एक यादृच्छिक चर है जिसमें एक मानक विचलन होता है।
मैक्रो

@Macro। आपकी टिप्पणियों के लिए आभार। मैंने काफी लिखा।
हार्वे मोटुलस्की

1
@ गुंग। मैं विश्वास अंतराल को ठीक से समझाने के लिए फिर से लिखा।
हार्वे मोटुलस्की
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.