मान जो मानक विचलन को बढ़ाता है


12

मैं निम्नलिखित कथन से हैरान हूँ:

"संख्याओं के एक समूह के मानक विचलन को बढ़ाने के लिए, आपको एक मान जोड़ना होगा जो औसत से दूर एक मानक विचलन से अधिक है"

इसका क्या प्रमाण है? मुझे पता है कि हम मानक विचलन को कैसे परिभाषित करते हैं, लेकिन वह हिस्सा मुझे किसी भी तरह याद आ रहा है। कोई टिप्पणी?


1
क्या आपने बीजगणित को शामिल करने की कोशिश की है?
एलेकोस पापाडोपोलोस

हाँ मेरे पास है। मैंने n + 1 मानों के विचरण से n मानों के नमूने विचरण को घटा दिया है और मुझे अंतर शून्य से अधिक होना आवश्यक है। फिर भी मैं इसे काफी समझ नहीं सकता।
18

3
सरल तरीके से एक अलग करने के लिए है Welford एल्गोरिथ्म नया मान के संबंध में और फिर दिखाने के लिए एकीकृत है कि शुरू करता है, तो विचरण, तो बढ़ जाती है जहां का अर्थ है पहला मान और उनके विचरण का अनुमान है। एक्स एन ( एक्स एन - ˉ एक्स एन - 1 ) 2nxnxn ˉ एक्स एन-1एन-1वीएन-1(xnx¯n1)2nn1vn1x¯n1n1vn1
whuber

ठीक है, लेकिन क्या इसे सरल बीजगणित के साथ दिखाया जा सकता है? आंकड़ों के बारे में मेरी जानकारी इतनी उन्नत नहीं है।
जॉन

@ जॉन, क्या आप कृपया उद्धरण के स्रोत को साझा कर सकते हैं?
पे डरो

जवाबों:


20

के लिए किसी भी संख्या मतलब के साथ , विचरण द्वारा दिया जाता है लागू करना संख्याओं के दिए गए सेट के लिए जिसे हम में सुविधा के लिए लेते हैं, जिसका अर्थ है , हमारे पास है वाई 1 , y 2 , ... , y एन ˉ y = 1Ny1,y2,,yN σ 2y¯=1Ni=1Nyi

σ2=1N1i=1N(yiy¯)2=1N1i=1N(yi22yiy¯+y¯2)=1N1[(i=1Nyi2)2N(y¯)2+N(y¯)2](1)σ2=1N1i=1N(yi2(y¯)2)
(1)nx1,x2,xnx¯=0
σ2=1n1i=1n(xi2(x¯)2)=1n1i=1nxi2
यदि हम अब इस डेटा सेट में एक नया अवलोकन जोड़ते हैं , तो डेटा सेट का नया अर्थ जबकि नया विचरण है तोसे बड़ा होना चाहिएxn+1
1n+1i=1n+1xi=nx¯+xn+1n+1=xn+1n+1
σ^2=1ni=1n+1(xi2xn+12(n+1)2)=1n[((n1)σ2+xn+12)xn+12n+1]=1n[(n1)σ2+nn+1xn+12]>σ2 only if xn+12>n+1nσ2.
|xn+1|σ1+1n या, अधिक आम तौर पर, को मूल डेटा से अधिक डेटा द्वारा सेट किए गए मूल डेटा के से भिन्न होने की आवश्यकता होती मूल डेटा सेट की तुलना में बड़ा विचरण करने के लिए संवर्धित डेटा सेट के लिए । रे कोपमैन का उत्तर भी देखें जो बताता है कि नया विचरण अनुसार मूल विचरण से बड़ा, समान, या उससे छोटा है, मतलब से अधिक, बिल्कुल, या कम से कम ।xn+1x¯σ1+1nxn+1σ1+1n

5
+1 अंत में किसी को यह सही हो जाता है ... ;-) बयान साबित किया जाना है सही; यह सिर्फ तंग नहीं है। संयोग से, आप माप की अपनी इकाइयां भी बना सकते हैं बनाने के लिए , जो गणना को सरल करता है, इसे लगभग दो पंक्तियों तक कम कर देता है। σ2=1
whuber

मेरा सुझाव है कि आप समीकरण के पहले सेट में सिग्मा के बजाय एस का उपयोग करें और व्युत्पत्ति के लिए धन्यवाद। यह जानना अच्छा था :)
थियोडेन

3

Puzzling स्टेटमेंट मानक विचलन को बढ़ाने के लिए एक आवश्यक लेकिन अपर्याप्त स्थिति देता है। यदि पुराने नमूने का आकार , तो पुराना मतलब , पुराने मानक विचलन , और डेटा में एक नया बिंदु जोड़ा जाता है, तो नया मानक विचलन, अनुसार से कम या अधिक से अधिक होगा। asसे कम है, बराबर है, या ।nmsxs|xm|s1+1/n


1
क्या आपके पास सबूत है?
जॉन्स

2

बीजगणित को छोड़कर (जो काम भी करता है) इसके बारे में इस तरह से सोचें: मानक विचलन विचरण का वर्गमूल है। विचरण औसत से वर्ग दूरी का औसत है। यदि हम एक मान जोड़ते हैं जो इस से अधिक के करीब है, तो विचरण सिकुड़ जाएगा। यदि हम एक मूल्य जोड़ते हैं जो इस से अधिक दूर है, तो यह बढ़ेगा।

यह किसी भी प्रकार के मूल्यों के बारे में सही है जो गैर-नकारात्मक हैं। यदि आप किसी माध्य से अधिक मान जोड़ते हैं, तो माध्य बढ़ता है। यदि आप कोई ऐसा मान जोड़ते हैं जो कम है, तो यह घट जाता है।


मैं एक कठोर प्रमाण भी देखना पसंद करूंगा। जबकि मैं इस सिद्धांत को समझता हूं कि मैं इस तथ्य से हैरान हूं कि मूल्य का मतलब से कम से कम 1 विचलन होना चाहिए। ठीक 1 क्यों?
जॉन

मैं नहीं देखता कि क्या भ्रमित है। विचरण औसत है। यदि आप औसत से अधिक कुछ जोड़ते हैं (अर्थात 1 sd से अधिक) तो यह बढ़ जाता है। लेकिन मैं औपचारिक सबूत के लिए नहीं एक हूँ
पीटर Flom - को पुनः स्थापित मोनिका

यह 0.2 मानक विचलन द्वारा औसत से अधिक हो सकता है। यह तब क्यों नहीं बढ़ेगा?
जॉन

नहीं, डेटा के माध्य से अधिक नहीं, विचरण से अधिक, जो कि वर्ग दूरी का मतलब है।
पीटर Flom - को पुनः स्थापित मोनिका

4
यह भ्रामक है क्योंकि एक नए मूल्य सहित मतलब बदल जाता है, इसलिए सभी अवशिष्ट बदल जाते हैं। यह बोधगम्य है कि नया मूल्य पुराने साधनों से बहुत दूर होने पर भी, अन्य मूल्यों के अवशिष्टों के वर्गों के योग को कम करके एसडी को दिए गए योगदान को मुआवजा दिया जा सकता है। यह कई कारणों में से एक है कि कठोर प्रमाण क्यों उपयोगी हैं: वे न केवल किसी के ज्ञान में सुरक्षा प्रदान करते हैं, बल्कि अंतर्दृष्टि (और यहां तक ​​कि नई जानकारी) भी प्रदान करते हैं। उदाहरण के लिए, सबूत दिखाएगा कि आपको एक नया मान जोड़ना होगा जो कि एसडी को बढ़ाने के लिए बीच में एक एसडी से कड़ाई से आगे है।
whuber

2

Z=xμσ.
xZx
σ=i=1NZi2N1
σZN

एक ऐसी संख्या जिसका निरपेक्ष मान 1 से कम है, जब उसे चुकता किया गया है, तो वह एब्स में 1 से कम होने वाली है। मूल्य। फिर भी जो मुझे समझ नहीं आ रहा है वह यह है कि अगर Z_N उस श्रेणी में आता है, तो भी हम सकारात्मक मूल्य जोड़ रहे हैं understand, तो क्या यह नहीं बढ़ना चाहिए?
जॉन

ZN+1

1
NσZi2

बिल्कुल वही जो मैं व्यक्त करने की कोशिश कर रहा था!
wcampbell

ZiN1
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.