मानक विचलन सूत्र में नमूना गणना "एन" के लिए वर्गमूल क्यों लिया जाता है?


9

मैं मानक विचलन की एक बहुत ही मूल अवधारणा को समझने की कोशिश कर रहा हूं।

सूत्रσ=i=1n(xiμ)2N

मुझे समझ नहीं आ रहा है कि हमें "एन" की आबादी को आधा क्यों करना चाहिए, जब हम नहीं करते हैं तो हम क्यों लेना चाहते हैं ? क्या उस आबादी को तिरछा नहीं किया जा रहा है जिस पर हम विचार कर रहे हैं?NN2

सूत्र नहीं होना चाहिएσ=i=1n(xiμ)2N

जवाबों:


10

आप इस बीच से "विशिष्ट" विचलन खोजने की कोशिश कर रहे हैं।

विचरण "औसत माध्य दूरी से औसत" है।

मानक विचलन उसी का वर्गमूल है।

जो इसे माध्य से वर्ग-माध्य-वर्ग विचलन बनाता है।

  1. हम औसत वर्ग विचलन का उपयोग क्यों करेंगे? क्या विचरण दिलचस्प बनाता है? अन्य बातों के अलावा, भिन्नताओं के बारे में एक मूल तथ्य के कारण - कि असंबद्ध चर की राशि का भिन्नता अलग-अलग संस्करण का योग है। (यह कई प्रश्नों में शामिल है जैसे कि CrossValidated पर यहां। यह आसान सुविधा साझा नहीं की गई है, उदाहरण के लिए, पूर्ण निरपेक्ष मध्यस्थता द्वारा।
  2. उस का वर्गमूल क्यों लें? क्योंकि तब यह मूल टिप्पणियों के समान इकाइयों में है। यह माध्य से एक विशिष्ट प्रकार की 'विशिष्ट दूरी' को मापता है (जैसा कि उल्लेख किया गया है, आरएमएस की दूरी) - लेकिन उपर्युक्त गुण के कारण - एक जिसमें कुछ अच्छी विशेषताएं हैं।

7

मानक विचलन का वर्गमूल है विचरण

माध्य से औसतन डेटा की औसत वर्ग दूरी है। चूँकि एक औसत योगों की संख्या से विभाजित योग है, इसलिए विचरण का सूत्र है: चूंकि, फिर से, मानक विचलन केवल इसका वर्गमूल है, मानक विचलन का सूत्र है: कुछ भी नहीं जोड़ा या बदला गया है मान्यताओं या यहाँ विचरण, हमने बस विचरण का वर्गमूल लिया, क्योंकि यही मानक विचलन है

Var(X)=E[(Xμ)2]=i=1N(xiμ)2N

S.D.(X)=Var(X)=i=1N(xiμ)2N

शायद यह उल्लेख किया जाना चाहिए कि यह विचरण सूत्र असतत वर्दी के लिए ही सही है। अन्यथा यह नमूना और जनसंख्या भिन्नता के बीच अंतर को भ्रमित कर सकता है
टेलर

@ टेलर, मुझे नहीं पता कि आपका क्या मतलब है। प्रसरण का सूत्र वितरण के लिए असंबंधित है।
गुंग - को पुनः स्थापित मोनिका

(नमूना) संस्करण के लिए सूत्र वितरण के लिए असंबंधित है ( en.wikipedia.org/wiki/Expected_value#Definition )
टेलर 14

@ टेलर, मुझे अभी भी नहीं पता कि तुम्हारा क्या मतलब है। प्रसरण का सूत्र वितरण के लिए असंबंधित है। विकिपीडिया पृष्ठ से उद्धृत करने के लिए, "एक यादृच्छिक चर, X का विचरण, X ... से वर्ग विचलन का अपेक्षित मूल्य है। । यह परिभाषा उन यादृच्छिक चरों को शामिल करती है जो प्रक्रियाओं से उत्पन्न होती हैं जो असतत, निरंतर, न तो या मिश्रित होती हैं। " सूत्र केवल असतत वर्दी के लिए नहीं है। Var(X)=E[(Xμ)2]
गुंग - को पुनः स्थापित मोनिका

हां, यह सही है, यदि आप लेते हैं , लेकिन किसी भी यादृच्छिक चर , जरूरी नहीं है। । एक के लिए, पहला एक स्थिर है और दूसरा यादृच्छिक है। वास्तव में यह स्पष्ट नहीं है कि राशि के समर्थन पर चलती है या नमूनों की संख्या पर। यदि उत्तरार्द्ध, यह अजीब है कि आप जानते हैं , जो व्यवहार में दुर्लभ है। यदि पूर्व, हां, तो यह केवल असतत के लिए सच है (क्योंकि यह एक राशि है) वर्दी (क्योंकि वजन सभी समान हैं)। μ=EXE[(Xμ)2]X1Ni(xiμ)2Xμ
टेलर

1

पहली बात यह समझने की है कि मानक विचलन (एसटीडी) औसत निरपेक्ष विचलन से अलग है । ये दोनों डेटा के बारे में विभिन्न गणितीय गुणों को परिभाषित करते हैं।

औसत निरपेक्ष विचलन के विपरीत, मानक विचलन (एसटीडी) उन मानों से अधिक होता है जो औसत से दूर होते हैं, जो अंतर मूल्यों को चुकता करके किया जाता है।

जैसे, चार डेटा बिंदुओं का पालन करने के लिए:

Data(x)|xmean|(xmean)222422466366636x=0(|xmean|)=16(xmean)2=80

औसत निरपेक्ष विचलन (aad) , और=16/4=4.0

मानक विचलन (std) =80/4=20=4.47

डेटा में, दो बिंदु हैं जो कि औसत से 6 दूरी की दूरी पर हैं, और दो बिंदु जो मतलब से 2 दूरी की दूरी पर हैं। तो, ४.४ 4. का विचलन ४ से अधिक अर्थ रखता है।

चूंकि कुल अवलोकन हमेशा होते हैं , कंप्यूटिंग एसटीडी के लिए हम द्वारा डाइविंग नहीं कर रहे हैं , इसके बजाय हम द्वारा कुल विचरण को विभाजित करते हैं , और इसके वर्गमूल को मूल डेटा के समान इकाई में लाने के लिए लेते हैं।NNN


0

@ महेश सुब्रमण्य - यह सिर्फ गणितीय मोड़ है । जब हमारे पास मूल मूल्य जैसे । हम इन दो समीकरणों और का उपयोग करके समान मान प्राप्त कर सकते हैं ।a/b=()da2b=ccb=d

जैसे कि बस इसे = । लेकिन, हम चाहते हैं कि केवल माइनस न हो।522.5

अब, । और,522=12.512.52=2.5

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.