मैं मानक त्रुटि और मानक विचलन के बीच अंतर को समझने के लिए संघर्ष कर रहा हूं। वे कैसे भिन्न हैं और आपको मानक त्रुटि को मापने की आवश्यकता क्यों है?
मैं मानक त्रुटि और मानक विचलन के बीच अंतर को समझने के लिए संघर्ष कर रहा हूं। वे कैसे भिन्न हैं और आपको मानक त्रुटि को मापने की आवश्यकता क्यों है?
जवाबों:
प्रश्न के उत्तर को पूरा करने के लिए, ओकराम ने मानक त्रुटि को संबोधित किया, लेकिन इसे मानक विचलन के विपरीत नहीं किया और नमूना आकार पर निर्भरता का उल्लेख नहीं किया। अनुमानक के लिए एक विशेष मामले के रूप में नमूना माध्य पर विचार करें। माध्य के लिए मानक त्रुटि जहाँजनसंख्या मानक विचलन है। इसलिए इस उदाहरण में हम स्पष्ट रूप से देखते हैं कि नमूना आकार बढ़ने के साथ मानक त्रुटि कैसे घट जाती है। मानक विचलन का उपयोग अक्सर व्यक्तिगत टिप्पणियों को संदर्भित करने के लिए किया जाता है। इसलिए मानक विचलन व्यक्तिगत टिप्पणियों की परिवर्तनशीलता का वर्णन करता है जबकि मानक त्रुटि अनुमानक की परिवर्तनशीलता दिखाती है। अच्छे आकलनकर्ता सुसंगत हैं जिसका अर्थ है कि वे वास्तविक पैरामीटर मान में परिवर्तित होते हैं। जब उनकी मानक त्रुटि घटकर 0 हो जाती है क्योंकि नमूना आकार बढ़ जाता है तो अनुमानक सुसंगत हो जाते हैं जो ज्यादातर मामलों में होता है क्योंकि मानक त्रुटि 0 पर जाती है जैसा कि हम नमूना मतलब के साथ स्पष्ट रूप से देखते हैं।
यहाँ एक और अधिक व्यावहारिक (और गणितीय नहीं) उत्तर है:
ध्यान दें कि मानक त्रुटियां लगभग किसी भी पैरामीटर के लिए गणना की जा सकती हैं जो आप डेटा से गणना करते हैं, न कि केवल मतलब। वाक्यांश "मानक त्रुटि" थोड़ा अस्पष्ट है। ऊपर दिए गए बिंदु केवल माध्य की मानक त्रुटि को संदर्भित करते हैं।
( ग्राफपैड स्टेटिस्टिक्स गाइड से जो मैंने लिखा था।)
Let आपकी रुचि का पैरामीटर है, जिसके लिए आप अनुमान लगाना चाहते हैं। ऐसा करने के लिए, आपके पास , अनुमान प्राप्त करने के लिए कुछ तकनीक के साथ-साथ टिप्पणियों का एक नमूना उपलब्ध है । इस अंकन में, मैंने स्पष्ट किया है कि पर निर्भर करता है । वास्तव में, यदि आपके पास एक और नमूना था, , तो आप किसी अन्य अनुमान, साथ समाप्त हो जाते । यह एक यादृच्छिक चर का अहसास कराता है जिसे मैं दर्शाता हूं।। इस यादृच्छिक चर को एक अनुमानक कहा जाता है। मानक त्रुटि की (= अनुमान) है मानक विचलन की (= यादृच्छिक चर)। इसमें यह जानकारी होती है कि आप अपने अनुमान के बारे में कितने आश्वस्त हैं। यदि यह बड़ा है, तो इसका मतलब है कि अगर आप एक और नमूना तैयार कर चुके होते तो आप बिलकुल अलग अनुमान प्राप्त कर सकते थे। मानक अंतराल का उपयोग विश्वास अंतराल के निर्माण के लिए किया जाता है।
(ध्यान दें कि मैं माध्य की मानक त्रुटि पर ध्यान केंद्रित कर रहा हूं, जो मुझे विश्वास है कि प्रश्नकर्ता भी था, लेकिन आप किसी भी नमूने के लिए एक मानक त्रुटि उत्पन्न कर सकते हैं)
मानक त्रुटि मानक विचलन से संबंधित है लेकिन वे एक ही चीज नहीं हैं और नमूना आकार में वृद्धि उन्हें एक साथ करीब नहीं बनाती है। बल्कि, यह उन्हें अलग बनाता है। नमूना का मानक विचलन जनसंख्या मानक विचलन के करीब हो जाता है क्योंकि नमूना आकार बढ़ता है लेकिन मानक त्रुटि नहीं।
कभी-कभी आस-पास की शब्दावली थोड़ी मोटी हो जाती है।
जब आप एक नमूना इकट्ठा करते हैं और उस नमूने के मानक विचलन की गणना करते हैं, तो नमूना आकार में बढ़ता है मानक विचलन का अनुमान अधिक से अधिक सटीक होता है। यह आपके प्रश्न से लगता है कि आप क्या सोच रहे थे। लेकिन यह भी विचार करें कि नमूना का मतलब औसत पर आबादी के करीब होने का मतलब है। मानक त्रुटि को समझने के लिए यह महत्वपूर्ण है।
मानक त्रुटि इस बारे में है कि यदि आपको किसी दिए गए आकार के कई नमूने मिले तो क्या होगा। यदि आप 10 का नमूना लेते हैं तो आप माध्य का कुछ अनुमान लगा सकते हैं। फिर आप 10 और नए माध्य अनुमान का एक और नमूना लेते हैं, और इसी तरह। उन नमूनों के साधनों का मानक विचलन मानक त्रुटि है। यह देखते हुए कि आपने अपना प्रश्न प्रस्तुत किया है, अब आप शायद यह देख सकते हैं कि यदि N अधिक है, तो मानक त्रुटि छोटी है, क्योंकि नमूनों के साधनों का वास्तविक मूल्य से बहुत अधिक विचलन होने की संभावना कम होगी।
कुछ के लिए जो चमत्कारिक लगता है कि आपने एक नमूने से यह गणना की है। इसलिए, आप क्या कर सकते हैं रिश्ते को प्रदर्शित करने के लिए सिमुलेशन के माध्यम से एक मानक त्रुटि बूटस्ट्रैप है। R में ऐसा दिखेगा:
# the size of a sample
n <- 10
# set true mean and standard deviation values
m <- 50
s <- 100
# now generate lots and lots of samples with mean m and standard deviation s
# and get the means of those samples. Save them in y.
y <- replicate( 10000, mean( rnorm(n, m, s) ) )
# standard deviation of those means
sd(y)
# calcuation of theoretical standard error
s / sqrt(n)
आप पाएंगे कि पिछले दो कमांड एक ही नंबर (लगभग) उत्पन्न करते हैं। आप n, m और s मानों को अलग-अलग कर सकते हैं और वे हमेशा एक दूसरे के बहुत करीब आएंगे।