क्यों मानक विचलन को विचरण के वर्गर्ट के रूप में परिभाषित किया गया है और एन के ऊपर वर्गों के योग के वर्गर्ट के रूप में नहीं?


16

आज मैंने आँकड़ों का एक परिचयात्मक वर्ग पढ़ाया और एक छात्र मेरे पास एक प्रश्न लेकर आया, जिसे मैं यहाँ प्रस्तुत करता हूँ: "क्यों मानक विचलन को विचरण के वर्ग के रूप में परिभाषित किया गया है न कि वर्ग के योग के वर्ग के रूप में?

हम जनसंख्या विचरण निर्धारित करें: σ2=1N(xiμ)2

और मानक विचलन: σ=σ2=1N(xiμ)2

हम σ को जो व्याख्या दे सकते हैं , वह यह है कि जनसंख्या के औसत माध्य से इकाइयों में औसत विचलन होता है X

हालाँकि, sd की परिभाषा में हम वर्गों के योग के वर्गफल को से विभाजित करते हैंN । छात्र यह सवाल उठाता है कि हमद्वाराNइसके बजायवर्गों के योग के वर्ग को विभाजित क्यों नहीं करते हैं। : इस प्रकार हम प्रतिस्पर्धा सूत्र के लिए आते हैं

σnew=1N(xiμ)2.
छात्र ने तर्क दिया कि यह सूत्र√ केमाध्यम से विभाजित करते समय की तुलना में "औसत" विचलन की तरह दिखता हैN रूप मेंσ

मुझे लगा कि यह सवाल मूर्खतापूर्ण नहीं है। मैं उस छात्र को एक उत्तर देना चाहूंगा जो यह कहकर आगे बढ़ता है कि एसडी को विचरण के वर्गर्ट के रूप में परिभाषित किया गया है जो कि औसत स्क्वैयर डेविटॉन है। अलग तरीके से कहें, छात्र को सही फॉर्मूले का उपयोग क्यों करना चाहिए और उसके विचार का पालन नहीं करना चाहिए ?

यह प्रश्न एक पुराने धागे और यहां दिए गए उत्तरों से संबंधित है । उत्तर तीन दिशाओं में चलते हैं:

  1. σ रूट मतलब-चुकता (RMS) विचलन, नहीं मतलब (यानी, से "विशिष्ट" विचलन हैσnew )। इस प्रकार, इसे अलग तरह से परिभाषित किया गया है।
  2. इसमें अच्छे गणितीय गुण हैं।
  3. इसके अलावा, sqrt "इकाइयों" को उनके मूल पैमाने पर वापस लाएगा। बहरहाल, यह भी के लिए मामला होगा σnew , जो विभाजित द्वारा N बजाय।

1 और 2 अंक के दोनों आरएमएस के रूप में एसडी के पक्ष में तर्क हैं, लेकिन मैं के इस्तेमाल के खिलाफ एक तर्क नहीं दिख रहा है σnew । क्या औसत आरएमएस दूरी के उपयोग की परिचयात्मक स्तर के छात्रों को समझाने के लिए अच्छा तर्क होगा σ माध्य से?


2
मुझे लगता है कि बहुत ही सवाल "मानक विचलन क्यों परिभाषित किया गया है ..." जवाब देना मुश्किल है। परिभाषाएँ केवल मनमाने ढंग से लेबलिंग कन्वेंशन हैं। उन्हें इस बात से सहमत नहीं होना चाहिए कि ऐसा क्यों है
ttnphns

"Why is the standard deviation defined as sqrt of variance and not as average of [the root of] sum of squares?"यह हो सकता है कि कोष्ठक के अंदर क्या है किसी तरह सवाल में खो गया?
ttnphns

1
लेकिन एसडी उद्देश्यों की एक श्रृंखला प्रदान करता है; इससे बेहतर प्रेरणा होनी चाहिए कि इसे इस तरह परिभाषित किया जाए। यह उपयोगी होगा, विशेष रूप से स्नातक से नीचे के शिक्षण में। मैं चेबीशेव की असमानता (न्यूनतम +/- s का एक स्थिर कारक) के मामलों के अनुपात के अर्थ में एक प्रेरणा की कल्पना कर सकता हूं।
टमाटर

2
जवाब नहीं दे सकता क्योंकि आपका क्यू होल्ड पर है, लेकिन यह कोशिश करें: कल्पना करें कि आप मानों 1 और 3 को लगभग समान अनुपात में मानते हैं (एक सिक्का, H=3 , T=1 )। माध्य से टिप्पणियों का एक "ठेठ दूरी" अपने साथ 1. तरह कुछ होना चाहिए SSE/nसूत्र, विचार करें किnबहुत, बहुत बड़े केलिए विशिष्ट दूरी के इस उपाय के साथ क्या होता है। प्रत्येक मामले में|xix¯|1 के पास होगा, इसलिए उनके वर्गों का योगपास होगाn। अंश √ के करीब होगाn तो आपका सूत्र छोटा और छोटा होता जाएगा जैसेnबढ़ा, भले ही माध्य से विशिष्ट दूरी नहीं बदल रही थी।
Glen_b -Reinstate Monica

1
@ जब मैंने एक और अपडेट किया और मुझे उम्मीद है कि अब मैं जो बात करूंगा वह स्पष्ट है। नोट मैं आंकड़ों की फंडिंग पर एक प्रश्न पूछने के अलावा यहां शिक्षण सलाह के लिए कह रहा हूं। मैं एक वैकल्पिक सूत्र का सुझाव नहीं दे रहा हूं, लेकिन एक छात्र द्वारा एक अच्छे प्रश्न की कक्षा की स्थिति से एक उदाहरण दिया गया, जिसका मेरे पास तत्काल जवाब नहीं था। यदि आप सहमत हैं, तो कृपया मुझे प्रश्न को अभी जारी करने का अनुरोध करें।
टॉमका

जवाबों:


12

कम से कम तीन बुनियादी समस्याएं हैं जिन्हें शुरुआती लोगों को आसानी से समझाया जा सकता है:

  1. "नई" एसडी को अनंत आबादी के लिए भी परिभाषित नहीं किया गया है। (एक ऐसे मामलों में हमेशा इसे शून्य के बराबर घोषित कर सकता है, लेकिन यह इसे अधिक उपयोगी नहीं बनाएगा।)

  2. नए एसडी एक औसत यादृच्छिक नमूने के तहत क्या करना चाहिए व्यवहार नहीं करता है।

  3. यद्यपि नए एसडी का उपयोग सभी गणितीय कठोरता के साथ किया जा सकता है, जो किसी माध्य (नमूनों और परिमित आबादी में) से विचलन का आकलन करने के लिए है, इसकी व्याख्या अनावश्यक रूप से जटिल है।

1. नए एसडी की प्रयोज्यता सीमित है

प्वाइंट (1) को घर लाया जा सकता है, यहां तक ​​कि उन लोगों को भी एकीकरण में निपुण नहीं किया गया है, जो इंगित करते हैं कि क्योंकि विचरण स्पष्ट रूप से एक अंकगणितीय माध्य (वर्ग विचलन का) है, यह "अनंत" आबादी के मॉडल के लिए एक उपयोगी विस्तार है जिसके लिए एक अंकगणित माध्य के अस्तित्व का अंतर्ज्ञान अभी भी है। इसलिए इसकी वर्गमूल - सामान्य एसडी - ऐसे मामलों में भी पूरी तरह से अच्छी तरह से परिभाषित है, और एक विचरण के रूप में (nonlinear reexpression) के रूप में अपनी भूमिका में भी उतना ही उपयोगी है। हालाँकि, नया SD उस औसत को बड़े पैमाने पर divid से विभाजित करता है , परिमित आबादी और परिमित नमूने से परे अपने सामान्यीकरण समस्याग्रस्त प्रतिपादन: क्या चाहिए1/N ऐसे मामलों में बराबर लिया जाता है?1/N

2. नया एसडी एक औसत नहीं है

"औसत" नाम के योग्य किसी भी आंकड़े में वह संपत्ति होनी चाहिए जो जनसंख्या मूल्य में परिवर्तित हो जाती है क्योंकि जनसंख्या से यादृच्छिक नमूने का आकार बढ़ता है। एसडी के किसी भी निश्चित मल्टीपल में यह गुण होगा, क्योंकि गुणक नमूना एसडी और जनसंख्या एसडी दोनों को लागू करेगा। , (हालांकि नहीं सीधे तर्क Alecos पापाडोपौलोस द्वारा की पेशकश का खंडन, इस अवलोकन पता चलता है कि तर्क केवल वास्तविक मुद्दों के लिए स्पर्शरेखा है।) हालांकि 'नई' एसडी, के बराबर किया जा रहा है सामान्य रूप से एन बार, स्पष्ट रूपसे सभी परिस्थितियों में0मेंपरिवर्तित होजाता है क्योंकि नमूना आकारएनबड़ा हो जाता है। इसलिए,हालांकि किसी भी तय नमूना आकार के लिएएननया SD (उपयुक्त रूप में व्याख्या) मतलब चारों ओर बदलाव की एक पूरी तरह से पर्याप्त उपाय है,यह उचित एक माना नहीं जा सकता हैसार्वभौमिकउपाय लागू सभी नमूना आकार के लिए कर सकते हैं, एक ही व्याख्या के साथ, और न ही यह किसी भी उपयोगी अर्थ में सही ढंग से "औसत" कहा जा सकता है।1/N0NN

3. नई एसडी व्याख्या और उपयोग करने के लिए जटिल है

(कहना) आकार नमूने लेने पर विचार करें । इन मामलों में नया SD है 1 / N=4बार सामान्य एसडी। इसलिए यह तुलनीय व्याख्याओं का आनंद लेता है, जैसे कि 68-95-99 नियम का एक एनालॉग (लगभग 68% डेटामतलब केदोनए एसडी केभीतर झूठ होना चाहिए, मतलब केचारनए एसडी केभीतर उनमें से 95%,आदि;) और चेचीशेव के रूप में शास्त्रीय असमानताओं के संस्करण (डेटा के1/k2से अधिक नहीं2kएसडी को उनके मतलब से दूरझूठ बोल सकते हैं), और केंद्रीय सीमा प्रमेय नए एसडी के संदर्भ में अनुरूपित किया जा सकता है; (एक से विभाजित1/N=1/21/k22kचर को मानकीकृत करने के लिए नए एसडी को एन बार)। इस प्रकार, इस विशिष्ट और स्पष्ट रूप से विवश अर्थ में,छात्र के प्रस्ताव में कुछ भी गलत नहीं है। हालांकि, कठिनाई यह है कि इन बयानों में सभी शामिल हैं - काफी स्पष्ट रूप से - √ के कारकN। यद्यपि इसके साथ कोई अंतर्निहित गणितीय समस्या नहीं है, यह निश्चित रूप से आंकड़ों के सबसे मौलिक कानूनों के बयान और व्याख्या को जटिल करता है।N=2


यह ध्यान दें कि गॉस और अन्य लोगों ने मूल रूप से गौसियन वितरण को of द्वारा , प्रभावी ढंग से उपयोग2σएक सामान्य यादृच्छिक चर के प्रसार को निर्धारित करने के लिए 2 बार एसडी। यह ऐतिहासिक उपयोगएसडी केअन्यस्थिरगुणकों केउपयोग की औचित्य और प्रभावशीलता को दर्शाता है।2


धन्यवाद - एक सवाल वापस (अपनी बात से संबंधित 2): 1 करता है 0मेंनहीं बदलता हैक्योंकिNबड़ा होता है, जबकि11N0N जाहिर है? 1N
तोमका

2
हम नमूने के एसडी तुलना कर रहे हैं करने के लिए नमूने के एन बार एसडी ("नया एसडी")। जैसे-जैसेएनबड़ा होता है, नमूने काएसडी जनसंख्या के बराबरएक (आमतौर पर) नॉनजरोनिरंतरपहुंचता है। इसलिए1/1/NN बार नमूना SD शून्य में परिवर्तित हो जाता है। 1/N
whuber

यह मानक सामग्री है - गणितीय आंकड़ों में किसी भी कठोर पाठ्यपुस्तक से परामर्श करें (जो कि निष्पक्ष होने के लिए, अधिकांश शुरुआती के लिए सुलभ नहीं होगा)। हालांकि, मेरे जवाब के लिए महत्वपूर्ण परिणाम एक कमजोर और सहज ज्ञान युक्त कथन का पालन करते हैं। संख्या ठीक करें और σ जनसंख्या एसडी होने दें । संभावना है कि नमूना एसडी के बीच झूठ होगा पर विचार करें σ / एक और एक σ । यह पर्याप्त है कि नमूना आकार N के बढ़ने पर यह मौका शून्य हो जाता है । अकेले शो है कि 1 / A>1σσ/AAσN बार नमूना SD, उत्तर में बिंदु (2) को प्रदर्शित करते हुए लगभग निश्चित रूपसे0 मेंपरिवर्तित होजाता है। 1/N0
whuber

+1, इसके अलावा यह स्केल-इनवेरिएंट आदि नहीं है, (इस फॉर्म के एक पल के लिए आवश्यक शर्त)
निकोस एम।

@ निकोस धन्यवाद, लेकिन क्या पैमाने पर अपरिवर्तनीय नहीं है? दोनों औरSDतब परिवर्तित होते हैं जब डेटा को फिर से जोड़ा जाता है। SD/NSD
whuber

5

मान लें कि आपके नमूने में केवल दो अहसास हैं। मुझे लगता है कि फैलाव का सहज माप औसत निरपेक्ष विचलन (AAD) होगा

AAD=12(|x1x¯|+|x2x¯|)=...=|x1x2|2

इसलिए हम माप की इकाइयों के समान स्तर पर फैलाव के अन्य उपायों को ऊपर "बंद" करना चाहेंगे।

नमूना प्रसरण के रूप में परिभाषित किया गया है

σ2=12[(x1x¯)2+(x2x¯)2]=12[(x1x22)2+(x2x12)2]

=12[(x1x2)24+(x1x2)24]=12(x1x2)22

=12|x1x2|22

माप की मूल इकाइयों में लौटने के लिए, अगर हमने जैसा सोचा था वैसा ही किया / सुझाव दिया, हम माप प्राप्त करेंगे, इसे कहते हैंq

q12|x1x2|22=12|x1x2|2=12AAD<AAD

i.e. we would have "downplayed" the "intuitive" measure of dispersion, while if we have considered the standard deviation as defined,

SDσ2=|x1x2|2=AAD

Since we want to "stay as close as possible" to the intuitive measure, we should use SD.

ADDENDUM
Let's consider now a sample of size n We have

nAAD=i=1n|xix¯|

and

nVar(X)=i=1n(xix¯)2=i=1n|xix¯|2

we can write the right-hand side of the variance expression as

i=1n|xix¯|2=(i=1n|xix¯|)2ji|xix¯||xjx¯|

=(nAAD)2ji|xix¯||xjx¯|

Then the dispersion measure qn will be

qn1n[n2AAD2ji|xix¯||xjx¯|]1/2

=[AAD21n2ji|xix¯||xjx¯|]1/2

Now think informally: note that ji|xix¯||xjx¯| contains n2n terms, and so divided by n2 will left us with "one term in the second power". But also "one term in the 2nd power" is what we have in AAD2: this is a primitive way to "sense" why qn will tend to zero as n grows large. On the other hand the Standard Deviation as defined would be

SD1n[n2AAD2ji|xix¯||xjx¯|]1/2

=[nAAD21nji|xix¯||xjx¯|]1/2

Continuing are informal thinking, the first term gives us n "terms in the 2nd power", while the second term gives us n1 "terms in the second power" . So we will be left eventually with one such term, as n grows large, and then we will take its square root.
This does not mean that the Standard Deviation as defined will equal the Average Absolute Deviation in general (it doesn't), but it does show that it is suitably defined so as to be "on a par" with it for any n, as well as for the case when n.


1
Although this answer is interesting, I believe there are more important, convincing, and rigorous explanations (of which I have offered only a few in my own answer: much more could be said, especially concerning the role of the SD in the Central Limit theorem and algebraic rules for computing SDs of sums of independent random variables).
whuber

2
@whuber Certainly. I just opted for a "the bell has rung" approach to destroy the student's intermission!
Alecos Papadopoulos
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.