क्या इसका अर्थ प्लस एक मानक विचलन अधिकतम मूल्य से अधिक हो सकता है?


19

मेरे पास नमूने के लिए 74.10 और मानक विचलन 33.44 है, जिसमें न्यूनतम 0 और अधिकतम 94.33 है।

मेरे प्रोफेसर मुझसे पूछते हैं कि कैसे मतलब हो सकता है प्लस एक मानक विचलन अधिकतम से अधिक है।

मैंने उसे इस बारे में कई उदाहरण दिखाए, लेकिन वह समझ नहीं पाई। मुझे उसे दिखाने के लिए कुछ संदर्भ की आवश्यकता है। यह आंकड़े की किताब से कोई भी अध्याय या पैराग्राफ हो सकता है जो विशेष रूप से इस बारे में बात करता है।


आप माध्य से एक मानक विचलन क्यों जोड़ना (या घटाना) चाहते हैं? एसडी डेटा के प्रसार का एक उपाय है। क्या आप इसके बजाय माध्य की मानक त्रुटि चाहते हैं?
मोनिका को बहाल करें - जी। सिम्पसन

मैं जोड़ना या घटाना नहीं चाहता, जो यह चाहता है वह मेरा प्रोफेसर है। यही वह तरीका है जो वह
स्पष्टता से समझती है

5
एक दिलचस्प उदाहरण नमूना (0.01,0.02,0.98,0.99) है। माध्य प्लस विचलन और माध्य दोनों विचलन मानक विचलन शून्य से बाहर हैं [0,1]।
Glen_b -Reinstate मोनिका

शायद वह सिर्फ एक सामान्य वितरण के बारे में सोच रही है?
user765195

जवाबों:


28

निश्चित रूप से माध्य प्लस वन sd सबसे बड़े अवलोकन को पार कर सकता है।

नमूना 1, 5, 5, 5 पर विचार करें -

इसका मतलब 4 और मानक विचलन 2 है, इसलिए माध्य + sd 6, नमूना अधिकतम से एक अधिक है। यहाँ R में गणना है:

> x=c(1,5,5,5)
> mean(x)+sd(x)
[1] 6

यह एक सामान्य घटना है। यह तब होता है जब उच्च मूल्यों का एक गुच्छा होता है और बाईं ओर एक पूंछ होती है (यानी जब मजबूत बाएं तिरछा और अधिकतम के पास एक चोटी होती है)।

-

समान संभावना संभावना वितरण पर लागू होती है, न केवल नमूने - जनसंख्या का मतलब प्लस जनसंख्या एसडी आसानी से अधिकतम संभव मूल्य से अधिक हो सकता है।

यहाँ एक घनत्व का उदाहरण दिया गया है, जिसका अधिकतम संभव मान 1 है:बीटा(10,12)

यहाँ छवि विवरण दर्ज करें

इस मामले में, हम बीटा वितरण के लिए विकिपीडिया पृष्ठ को देख सकते हैं, जिसमें कहा गया है कि इसका मतलब है:

[एक्स]=αα+β

और विचरण है:

वर[एक्स]=αβ(α+β)2(α+β+1)

(हालांकि हमें विकिपीडिया पर भरोसा करने की ज़रूरत नहीं है, क्योंकि उन्हें प्राप्त करना बहुत आसान है।)

तो और हमारा मतलब है और sd , इसलिए 1 से अधिक अधिकतम की तुलना में + sd मतलब है ।β = 1α=100.95230.06281.0152β=120.95230.06281.0152

यही है, यह आसानी से संभव है कि माध्य + sd का मान है जिसे डेटा मान के रूप में नहीं देखा जा सकता है

-

किसी भी स्थिति के लिए जहां मोड अधिकतम था, पियर्सन मोड तिरछापन की आवश्यकता है केवल अधिकतम करने के लिए, मतलब + एसडी के लिए । यह सकारात्मक या नकारात्मक किसी भी मूल्य को ले सकता है, इसलिए हम देख सकते हैं कि यह आसानी से संभव है।<-1

-

एक द्विपदीय अनुपात के लिए आत्मविश्वास से संबंधित अंतराल को अक्सर देखा जाता है , जहां आमतौर पर इस्तेमाल किया जाने वाला अंतराल, सामान्य सन्निकटन अंतराल बाहर सीमा का उत्पादन कर सकता है ।[0,1]

उदाहरण के लिए, बर्नौली परीक्षणों में सफलताओं के जनसंख्या अनुपात के लिए 95.4% सामान्य सन्निकटन अंतराल पर विचार करें (परिणाम क्रमशः 1 या 0 सफलता और विफलता की घटनाओं का प्रतिनिधित्व करते हैं), जहां 4 में से 3 अवलोकन " " और एक अवलोकन " " है।10

फिर अंतराल के लिए ऊपरी सीमापी^+2×14पी^(1-पी^)=पी^+पी^(1-पी^)=0.75+0.433=1.183

यह सिर्फ नमूना मतलब है + द्विपद के लिए एसडी का सामान्य अनुमान ... और एक असंभव मूल्य पैदा करता है।

0,1,1,1 के लिए सामान्य नमूना एसडी 0.5 के बजाय 0.433 (है वे क्योंकि मानक विचलन का द्विपद एमएल अनुमान अलग मेल खाती से विचरण विभाजित करने के लिए के बजाय )। लेकिन इससे कोई फर्क नहीं पड़ता - या तो मामले में, माध्य + sd सबसे बड़ा संभव अनुपात से अधिक है।पी^(1-पी^)nn-1

यह तथ्य - कि द्विपद के लिए एक सामान्य सन्निकटन अंतराल "असंभव मूल्यों" का उत्पादन कर सकता है, अक्सर पुस्तकों और पत्रों में नोट किया जाता है। हालाँकि, आप द्विपद डेटा के साथ काम नहीं कर रहे हैं। फिर भी समस्या - इसका मतलब है कि + मानक विचलन की कुछ संख्या एक संभावित मूल्य नहीं है - अनुरूप है।

-

आपके मामले में, आपके नमूने में असामान्य "0" मूल्य एसडी को बड़ा बना रहा है, क्योंकि यह औसत को नीचे खींच रहा है, यही कारण है कि माध्य + एसडी अधिक है।

यहाँ छवि विवरण दर्ज करें

-

(प्रश्न इसके बजाय होगा - किस तर्क से यह असंभव होगा? - क्योंकि बिना यह जाने कि कोई यह क्यों सोचेगा कि वहाँ कोई समस्या है, हम क्या संबोधित करते हैं?)

तार्किक रूप से, कोई व्यक्ति यह दर्शाता है कि ऐसा कहां होता है। आपने वह पहले ही कर लिया है। एक स्पष्ट कारण की अनुपस्थिति में कि यह अन्यथा क्यों होना चाहिए, आप क्या करें?

यदि कोई उदाहरण पर्याप्त नहीं है, तो कौन सा प्रमाण स्वीकार्य होगा?

किसी पुस्तक में कथन को इंगित करने का वास्तव में कोई मतलब नहीं है, क्योंकि कोई भी पुस्तक गलती से बयान कर सकती है - मैं उन्हें हर समय देखता हूं। किसी को प्रत्यक्ष प्रदर्शन पर भरोसा करना चाहिए कि यह संभव है, या तो बीजगणित में एक प्रमाण (उदाहरण के लिए उपरोक्त बीटा उदाहरण से निर्माण किया जा सकता है)) या संख्यात्मक उदाहरण (जो आपने पहले ही दिया है), जो कोई भी स्वयं के लिए सत्य की जांच कर सकता है ।

* व्ह्यूबर टिप्पणियों में बीटा मामले के लिए सटीक स्थिति देता है।


5
+1 बीटा उदाहरण एक अच्छा विचार है। वास्तव में, प्रदान किया गया और , किसी भी बीटा वितरण का मतलब होगा + sd से अधिक । 0<β<1α>β(1+β)/(1-β)(α,β)1
whuber

मैं आगे समझाता हूं। मैं दांतों के सुधार के लिए उपयोग किए जाने वाले विशेष उपकरण की सटीकता प्रतिशत की तलाश कर रहा हूं। और इस उपकरण ने निम्नानुसार 7 दांतों के लिए सटीकता प्रतिशत का प्रदर्शन किया:% 76,19,% 77,41,% 94,33,% 91,06,% 0,% 87,77,% 91,96। मेरा प्रोफेसर मतलब के लिए एक standart विचलन जोड़ता है और कहता है कि परिणाम अधिकतम मान 100% से अधिक नहीं हो सकता है क्योंकि% 100 अधिकतम सटीकता प्रतिशत है जो कि उपकरणक प्रदर्शन कर सकता है।
बॉयून ओमुरु

2
वह कहती है कि आपकी स्थिति में प्रतिशत> 100% का कोई मतलब नहीं है। समस्या वास्तव में अस्थिर आधार है कि इस अर्थ में एक एसडी को जोड़ना इस संदर्भ में समझ में आना चाहिए, जब यह नहीं होता है । यहीं से मुझे विश्वास है कि आपकी कठिनाई की उत्पत्ति हुई। यदि हम समझ गए कि आधार कहाँ से आया है, तो इससे बेहतर समाधान हो सकता है। यह संभव है कि साधारण तथ्य को किसी पुस्तक में कहा गया है (यह एक तुच्छ अवलोकन है, हालांकि, इसलिए यह संभव नहीं है कि या तो), लेकिन मुझे संदेह है कि इसे कभी भी इस तरह से रखा जाएगा कि वह संतुष्ट हो जाए, क्योंकि उसकी झूठी आधार समस्या का स्रोत है।
Glen_b -Reinstate मोनिका

1
वास्तव में - मेरा मामूली बिंदु यह है कि यह जिज्ञासा एक मानक परिणाम है जो नमूना लेने के परिणामस्वरूप दृढ़ता से गैर-सममित वितरण के लिए प्रतिनिधित्व करता है। लेकिन सामान्य तौर पर, मुझे लगता है कि आपका उत्तर उत्कृष्ट है
हेनरी

2
@tomka मैंने एक ही स्थिति में कई छात्रों की मदद करने का प्रयास किया है। मैंने अंततः अंगूठे के नियम (संभवतः अस्वाभाविक) को सीखा कि अपने छात्र के माध्यम से पर्यवेक्षक को कुछ भी सिखाना प्रभावी रूप से असंभव है।
Glen_b -Reinstate मोनिका

4

प्रति Chebyshev की असमानता, k -2 से कम अंक k मानक विचलन से अधिक हो सकता है। तो, k = 1 के लिए जिसका मतलब है कि आपके 100% से कम नमूने एक मानक विचलन से अधिक हो सकते हैं।

कम बाउंड पर देखना ज्यादा दिलचस्प है। आपके प्रोफेसर को अधिक आश्चर्य होना चाहिए कि ऐसे बिंदु हैं जो औसत से लगभग 2.5 मानक विचलन हैं। लेकिन अब हम जानते हैं कि आपके नमूनों में से लगभग 1/6 केवल 0 हो सकते हैं।


3

σσ


5
यह एक अच्छा योगदान है। मुझे यकीन नहीं है कि SD वास्तव में "सामान्य वितरण" मानता है, हालांकि।
गूँग - मोनिका

3
"वितरण फिटिंग" और सामान्यता में परिवर्तन खोजना विभिन्न उद्देश्यों के साथ अलग-अलग प्रक्रियाएं हैं।
whuber

2

एक्स10<पी<101-पी

(एक्स)=पी,एस(एक्स)=पी(1-पी)

और हम चाहते हैं

(एक्स)+एस(एक्स)>1पी+पी(1-पी)>1

पी(1-पी)>(1-पी)

दोनों पक्षों को प्राप्त करने के लिए वर्ग

पी(1-पी)>(1-पी)2पी>1-पीपी>12

पी>1/2(एक्स)+एस(एक्स)>अधिकतमएक्स

पी=0.71

यू(,)(यू)+एस(यू)<अधिकतमयू=

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.