मानक विचलन को 'योग' कैसे करें?


68

मेरे पास मूल्य के लिए एक मासिक औसत है और उस औसत के अनुरूप एक मानक विचलन है। मैं अब मासिक औसत के योग के रूप में वार्षिक औसत की गणना कर रहा हूं, मैं सारांशित औसत के लिए मानक विचलन का प्रतिनिधित्व कैसे कर सकता हूं?

उदाहरण के लिए एक पवन खेत से उत्पादन पर विचार करना:

Month        MWh     StdDev
January      927     333 
February     1234    250
March        1032    301
April        876     204
May          865     165
June         750     263
July         780     280
August       690     98
September    730     76
October      821     240
November     803     178
December     850     250

हम कह सकते हैं कि औसत वर्ष में पवन खेत 10,358 मेगावाट का उत्पादन करता है, लेकिन इस आंकड़े के अनुरूप मानक विचलन क्या है?


3
एक अब नष्ट कर दिए गए उत्तर के बाद एक चर्चा इस प्रश्न में एक संभावित अस्पष्टता का उल्लेख करती है : क्या आप मासिक औसत के एसडी की तलाश करते हैं या क्या आप उन सभी मूल मूल्यों के एसडी को पुनर्प्राप्त करना चाहते हैं जिनसे उन औसत का निर्माण किया गया था? उस उत्तर ने यह भी सही ढंग से इंगित किया कि यदि आप उत्तरार्द्ध चाहते हैं, तो आपको मासिक औसत में से प्रत्येक में शामिल मूल्यों की संख्या की आवश्यकता होगी।
whuber

1
एक और नष्ट कर दिया जबाब करने के लिए एक टिप्पणी ने बताया कि यह एक के रूप में एक औसत की गणना करने के अजीब बात है योग : निश्चित रूप से आप का मतलब है कि आप कर रहे हैं औसत मासिक औसत। लेकिन अगर आप जो चाहते हैं वह सभी मूल डेटा के औसत का अनुमान लगाना है, तो ऐसी प्रक्रिया आमतौर पर एक अच्छी नहीं होती है: एक भारित औसत की आवश्यकता होती है। और निश्चित रूप से यह "मुमकिन औसत के लिए एसडी" के बारे में आपके सवाल का एक अच्छा जवाब देना संभव नहीं है जब तक कि यह स्पष्ट नहीं है कि "अभिव्यक्त औसत" क्या है और इसका प्रतिनिधित्व करने का इरादा क्या है। कृपया स्पष्ट करें कि हमारे लिए।
व्हिबर

@ जब मैंने स्पष्ट करने के लिए एक उदाहरण जोड़ा है। गणितीय रूप से मेरा मानना ​​है कि औसत का योग मासिक औसत समय 12.
klonq

2
हाँ, klonq, यह एक बहुत ही उचित अनुरोध है। हालाँकि, इन उत्तरों को उनके स्वामी द्वारा हटा दिया गया था, समुदाय द्वारा नहीं। उनके मूल्य को बनाए रखने के लिए, मैंने उन उत्तरों और उनकी टिप्पणियों में उत्पन्न होने वाले प्रमुख विचारों को रिले (मेरी ले) करने का प्रयास किया है। BTW, आपके हाल के संपादन काफी मददगार हैं: लोग उदाहरण डेटा देखना पसंद करते हैं।
whuber

1
साइट पर आपका स्वागत है, @ हाईडेन। यह ओपी के सवाल का जवाब नहीं है। कृपया उत्तर प्रदान करने के लिए केवल "आपका उत्तर" फ़ील्ड का उपयोग करें। यदि आपके पास एक अनुवर्ती प्रश्न है, [ASK QUESTION]तो शीर्ष पर क्लिक करें और वहां पूछें, तो हम आपकी उचित सहायता कर सकते हैं। चूंकि आप यहां नए हैं, इसलिए आप हमारे दौरे को ले सकते हैं , जिसमें नए उपयोगकर्ताओं के लिए जानकारी हो।
गुंग

जवाबों:


66

संक्षिप्त उत्तर: आप औसत रूप से भिन्न होते हैं ; तब आप औसत मानक विचलन प्राप्त करने के लिए वर्गमूल ले सकते हैं ।


उदाहरण

Month          MWh  StdDev  Variance
==========   =====  ======  ========
January        927    333     110889
February      1234    250      62500
March         1032    301      90601
April          876    204      41616
May            865    165      27225
June           750    263      69169
July           780    280      78400
August         690     98       9604
September      730     76       5776
October        821    240      57600
November       803    178      31684
December       850    250      62500
===========  =====  =======  =======
Total        10358            647564
÷12            863    232      53964

और फिर औसत मानक विचलन हैsqrt(53,964) = 232


से सामान्य रूप से वितरित यादृच्छिक चर का योग :

XY

... दो स्वतंत्र रूप से वितरित यादृच्छिक चर का योग सामान्य है, इसका मतलब दो साधनों का योग है, और इसका भिन्नता दो भिन्नताओं का योग है।

और वोल्फ्राम अल्फा के सामान्य योग वितरण से :

XY(μX,σX2)(μY,σY2)

PX+Y(u)=12π(σX2+σY2)e[u(μX+μY)]2/[2(σX2+σY2)]

जिसका मतलब है

μX+Y=μX+μY

और विचरण

σX+Y2=σX2+σY2

आपके डेटा के लिए:

  • योग: 10,358 MWh
  • विचरण: 647,564
  • मानक विचलन: 804.71 ( sqrt(647564) )

यहाँ छवि विवरण दर्ज करें

तो आपके प्रश्न का उत्तर देने के लिए:

  • मानक विचलन को 'योग' कैसे करें ?
  • आप उन्हें चतुर्भुज योग:

    s = sqrt(s1^2 + s2^2 + ... + s12^2)
    

वैचारिक रूप से आप भिन्नताओं को जोड़ते हैं, फिर मानक विचलन प्राप्त करने के लिए वर्गमूल लेते हैं।


क्योंकि मैं उत्सुक था, मैं औसत मासिक औसत शक्ति, और इसके मानक विचलन जानना चाहता था । प्रेरण के माध्यम से, हमें 12 सामान्य वितरण चाहिए जो:

  • के एक मतलब के लिए राशि 10,358
  • के विचरण का योग 647,564

यह 12 औसत मासिक वितरण होगा:

  • का मतलब 10,358/12 = 863.16
  • का विचरण 647,564/12 = 53,963.6
  • के मानक विचलन sqrt(53963.6) = 232.3

यहाँ छवि विवरण दर्ज करें

हम अपने मासिक औसत वितरण को 12 बार जोड़कर देख सकते हैं, यह देखने के लिए कि वे वार्षिक वितरण के बराबर हैं:

  • माध्य: 863.16*12 = 10358 = 10,358( सही )
  • भिन्न: 53963.6*12 = 647564 = 647,564( सही )

नोट : मैं इसे अपने सूत्र चित्रों को परिवर्तित करने के लिए गूढ़ लेटेक्स गणित के ज्ञान के साथ किसी को छोड़ दूंगा, और formula codeस्टैटेक्सचेंज फॉर्मेट किए गए फॉर्मूले में।

संपादित करें : मैंने लघु को बिंदु पर, शीर्ष पर उत्तर दिया। क्योंकि मैं आज फिर ऐसा करने के लिए जरूरत है, लेकिन करना चाहता था दोहरी जांच है कि मैं औसत प्रसरण


3
यह सब लगता है कि महीने असंबंधित हैं - क्या आपने उस धारणा को कहीं स्पष्ट किया है? इसके अलावा, हमें सामान्य वितरण में लाने की आवश्यकता क्यों है? यदि हम केवल विचरण के बारे में बात कर रहे हैं तो यह अनावश्यक लगता है - उदाहरण के लिए, मेरा उत्तर यहाँ
मैक्रो

1
@ मार्को क्योंकि मैं तस्वीरों में बेहतर समझता हूं और यह सब कुछ समझने में आसान बनाता है।
इयान बोयड

2
@Marco इसके अलावा, मेरा मानना ​​है कि यह सवाल अब (अब विचलित) आँकड़े.स्टैकएक्सचेंज साइट पर शुरू हुआ है। सूत्रों की एक दीवार सरल, चित्रमय, कम कठोर उपचार की तुलना में कम सुलभ है।
इयान बॉयड

2
मुझे संदेह है कि यह सही है। दो डेटा सेट की कल्पना करें, प्रत्येक के साथ एक ही माप प्रत्येक। प्रत्येक सेट का उनका विचरण 0 होता है, लेकिन यदि डेटा बिंदुओं में अंतर हो तो दोनों मापों के सेट में 0 से अधिक विचरण होता है।
नजोल

1
@ नोल, मुझे लगता है कि इसीलिए हम मानते हैं कि सभी चर का सामान्य वितरण होता है। और हम इसे यहां कर सकते हैं, क्योंकि हम फ़िज़िकल माप के बारे में बात करते हैं। आपके उदाहरण में दोनों चर सामान्य रूप से वितरित नहीं हैं।
ट्वोरेक

11

यह एक पुराना प्रश्न है लेकिन स्वीकृत उत्तर वास्तव में सही या पूर्ण नहीं है। उपयोगकर्ता 12-महीने के डेटा पर मानक विचलन की गणना करना चाहता है, जहां हर महीने औसत और मानक विचलन की गणना पहले से की जाती है। यह मानते हुए कि प्रत्येक महीने में नमूनों की संख्या समान है, फिर प्रत्येक महीने के डेटा से वर्ष में नमूना माध्य और विचरण की गणना करना संभव है। सादगी के लिए मान लें कि हमारे पास डेटा के दो सेट हैं:

X={x1,....xN}

Y={y1,....,yN}

μxμyσx2σy2

अब हम उसी अनुमान की गणना करना चाहते हैं

Z={x1,....,xN,y1,...,yN}

μxσx2

μx=i=1NxiN

σx2=i=1Nxi2Nμx2

हमारे द्वारा गणना किए जाने वाले कुल सेट पर माध्य और विचरण का अनुमान लगाने के लिए:

μz=i=1Nxi+i=1Nyi2N=(μx+μy)/2

σz2=i=1Nxi2+i=1Nyi22Nμz2

σz2=12(i=1Nxi2Nμx2+i=1Nyi2Nμy2)+12(μx2+μy2)(μx+μy2)2

σz2=12(σx2+σy2)+(μxμy2)2

इसलिए यदि आपके पास प्रत्येक उपसमूह पर विचरण है और आप पूरे सेट पर विचरण करना चाहते हैं तो आप प्रत्येक उपसमुच्चय के वैरिएंट को औसत कर सकते हैं यदि उन सभी का मतलब समान है। अन्यथा, आपको प्रत्येक सबसेट के माध्य के विचरण को जोड़ना होगा।

मान लीजिए कि वर्ष की पहली छमाही में हम प्रति दिन 1000 MWh का उत्पादन करते हैं और सेकंडों में हम प्रति दिन 2000 MWh का उत्पादन करते हैं। फिर पहले और सेकंड में ऊर्जा उत्पादन का माध्य और विचरण मतलब के लिए 1000 और 2000 हैं और दोनों हिस्सों के लिए विचरण 0 है। अब दो अलग-अलग चीजें हैं जिन्हें हम में रुचि हो सकती है:

1- हम पूरे वर्ष में ऊर्जा उत्पादन के विचरण की गणना करना चाहते हैं : फिर दो विचरणों के औसत से हम शून्य पर पहुंच जाते हैं, जो कि सही नहीं है क्योंकि पूरे वर्ष में प्रति दिन ऊर्जा स्थिर नहीं होती है। इस मामले में हमें प्रत्येक उपसमुच्चय से सभी साधनों के विचरण को जोड़ना होगा। गणितीय रूप से इस मामले में ब्याज का यादृच्छिक चर प्रति दिन ऊर्जा उत्पादन है। हमारे पास उप-आंकड़ों पर नमूना आँकड़े हैं और हम नमूना आँकड़ों की गणना अधिक समय तक करना चाहते हैं।

2- हम प्रति वर्ष ऊर्जा उत्पादन के विचरण की गणना करना चाहते हैं: दूसरे शब्दों में हम इस बात में रुचि रखते हैं कि एक वर्ष से दूसरे वर्ष में ऊर्जा उत्पादन में कितना परिवर्तन होता है। इस मामले में विचरण का औसत सही उत्तर है जो 0 है, क्योंकि प्रत्येक वर्ष हम औसतन 1500 एमएचडब्ल्यू का उत्पादन कर रहे हैं। गणितीय रूप से इस मामले में ब्याज का यादृच्छिक चर प्रति दिन ऊर्जा उत्पादन का औसत है जहां औसत पूरे वर्ष में किया जाता है।


1

मेरा मानना ​​है कि मानक विचलन के बजाय मानक त्रुटि होने पर आपको वास्तव में क्या दिलचस्पी हो सकती है ।

माध्य (SEM) की मानक त्रुटि जनसंख्या माध्य के नमूना-माध्य के अनुमान का मानक विचलन है, और यह आपको एक माप देगा कि आपका वार्षिक MWH अनुमान कितना अच्छा है।

n

s=s12+s22++s12212×n

1

मैं स्वीकार किए गए उत्तर के भाग में फिर से गलतियाँ करना चाहता हूँ। प्रश्न का शब्दांकन भ्रम पैदा करता है।

प्रश्न में हर महीने का औसत और StdDev है, लेकिन यह स्पष्ट नहीं है कि किस प्रकार के सबसेट का उपयोग किया जाता है। क्या यह पूरे खेत की औसतन 1 पवन टरबाइन है या पूरे खेत की दैनिक औसत है? यदि यह प्रत्येक माह के लिए दैनिक औसत है, तो आप वार्षिक औसत प्राप्त करने के लिए मासिक औसत को जोड़ नहीं सकते हैं क्योंकि उनके पास एक ही भाजक नहीं है। यदि यह इकाई औसत है, तो सवाल राज्य होना चाहिए

हम कह सकते हैं कि औसत वर्ष में पवन फार्म में प्रत्येक टरबाइन 10,358 MWh का उत्पादन करता है, ...

के बजाय

हम कह सकते हैं कि औसत वर्ष में पवन खेत 10,358 मेगावाट, का उत्पादन करता है ...

इसके अलावा, मानक विचलन या विचरण सेट के अपने औसत के मुकाबले तुलना है। इसमें पूरे सेट के औसत के संबंध में कोई जानकारी नहीं है ।

भिन्न उदाहरण

छवि बहुत सही नहीं है, लेकिन यह सामान्य विचार बताती है। आइए इमेज के अनुसार 1 विंड फार्म के आउटपुट की कल्पना करें। जैसा कि आप देख सकते हैं, "स्थानीय" संस्करण का "वैश्विक" संस्करण के साथ कोई लेना-देना नहीं है, चाहे आप कैसे भी जोड़ें या गुणा करें। आप 2 छमाही के संस्करण का उपयोग करके वर्ष के विचरण का अनुमान नहीं लगा सकते हैं। तो, स्वीकृत उत्तर में, जबकि योग गणना सही है, मासिक संख्या प्राप्त करने के लिए 12 से विभाजन का मतलब कुछ भी नहीं है। । तीन खंडों में से पहला और अंतिम खंड गलत है, दूसरा सही है।

फिर से, यह बहुत गलत एप्लिकेशन है, कृपया इसका पालन न करें या यह आपको परेशानी में डालेगा। प्रत्येक चीज़ के कुल वार्षिक / मासिक आउटपुट का उपयोग करके डेटा बिंदुओं के अनुसार कुल मिलाकर पूरी चीज़ के लिए गणना की जाती है, चाहे आप वार्षिक या मासिक संख्या चाहते हों, सही उत्तर होना चाहिए। आप शायद ऐसा ही कुछ चाहते हैं। यह मेरी बेतरतीब ढंग से उत्पन्न संख्या है। यदि आपके पास डेटा है, तो सेल O2 में परिणाम आपका उत्तर होना चाहिए।

यहाँ छवि विवरण दर्ज करें


उस छवि के लिए बहुत बहुत धन्यवाद जिसने मुझे यह समझने में बहुत मदद की कि स्वीकृत उत्तर अधूरा क्यों है और गलत भी हो सकता है। आपने इसे बहुत अच्छी तरह से समझाया, धन्यवाद!
काई

इससे मतदान के खतरे का पता चलता है। वोट देने वाले लोग ऐसे लोग होते हैं जिन्हें जवाब नहीं पता होता है। कोडिंग के विरोध के रूप में, जो लोग वोट देते हैं, वे लोग होते हैं जो कोड काम कर रहे हैं, अधिक वोट, बेहतर जवाब। आंकड़े / गणित के लिए, अधिक वोट का मतलब केवल यह अधिक आकर्षक है।
तम ले
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.