मैं एक भारित मानक विचलन की गणना कैसे करूं? एक्सेल में?


29

इसलिए, मेरे पास प्रतिशत का डेटा सेट है जैसे:

100   /   10000   = 1% (0.01)
2     /     5     = 40% (0.4)
4     /     3     = 133% (1.3) 
1000  /   2000    = 50% (0.5)

मैं प्रतिशत का मानक विचलन खोजना चाहता हूं, लेकिन उनके डेटा वॉल्यूम के लिए भारित हूं। यानी, पहले और आखिरी डेटा बिंदुओं को गणना पर हावी होना चाहिए।

मैं उसको कैसे करू? और एक्सेल में इसे करने का एक सरल तरीका है?


(M-1) / M के साथ सूत्र सही है। यदि आपको संदेह है, तो 1 के बराबर सभी भार सेट करके इसे जांचें, और आप हर में एन (एन -1) के साथ मानक विचलन के लिए निष्पक्ष अनुमान के लिए शास्त्रीय सूत्र प्राप्त करेंगे। फुसफुसाहट करने के लिए: असामान्य का मतलब गलत नहीं है।

1
(M-1) / M के साथ सूत्र सही नहीं है। कल्पना कीजिए कि आप एक खरब के वजन के साथ एक लाख अंक जोड़ते हैं। आप अपना जवाब बिल्कुल न बदलें, चाहे जो भी वजन हो, लेकिन आपका शब्द 1 हो गया? बिलकुल नहीं! आप पर ध्यान देते हैं कि ( एम - 1 ) / एम 1 है, तो आप भी परवाह कि यह सिर्फ गलत है। (M1)/M(M1)/M1
रेक्स केर

सबसे ज्यादा वोट सही है। जांच करें itl.nist.gov/div898/software/dataplot/refman2/ch2/weightsd.pdf
बो वांग

मुझे आश्चर्य है कि आप यहां मानक विचलन क्यों चाहते हैं? आपके पास केवल नंबर हैं! वह भी कितनी संख्या में? खासकर जब प्रतिशत अधिक आसानी से समझाया और समझा जाता है। 4
probabilityislogic

@probabilityislogic प्रश्न को छोटा रखने के लिए यह एक सरल उदाहरण था।
येल

जवाबों:


35

भारित मानक विचलन के लिए सूत्र है:

i=1Nwi(xix¯)2(M1)Mi=1Nwi,

कहा पे

टिप्पणियों की संख्या है।N

नॉनज़रो वेट की संख्या है।M

वजन कर रहे हैंwi

अवलोकन हैंxi

भारित माध्य है।x¯

याद रखें कि भारित माध्य का सूत्र है:

x¯=i=1Nwixii=1Nwi.

वांछित परिणाम प्राप्त करने के लिए उचित भार का उपयोग करें। आपके मामले में मैं खंड में मामलों की संख्या का उपयोग करने का सुझाव Number of cases in segmentTotal number of cases

एक्सेल में ऐसा करने के लिए, आपको पहले भारित माध्य की गणना करने की आवश्यकता है। फिर एक अलग कॉलम में गणना करें। बाकी बहुत आसान होना चाहिए।(xix¯)2


2
@ गिल्स, आप सही कह रहे हैं। deps_stats, SD में अंश असामान्य है। क्या आपके पास इस सूत्र के लिए एक उद्धरण है या आप कम से कम उस शब्द को शामिल करने का कारण बता सकते हैं? (M1)/M
whuber

4
@ एरॉन वेट को हमेशा एकता के योग के रूप में परिभाषित नहीं किया जाता है, जैसा कि इस प्रश्न में दिए गए वेट द्वारा किया गया है!
whuber

2
(-1) मैं इस उत्तर को अस्वीकार कर रहा हूं क्योंकि शब्द का कोई औचित्य या संदर्भ प्रदान नहीं किया गया है (और मुझे पूरा यकीन है कि यह निष्पक्षता के अनुमान को निष्पक्ष नहीं बनाता है, जो इसकी स्पष्टता होगी प्रेरणा)। (M1)/M
whuber

1
1(M1)/M

1
@ मिखाइल आप सही हैं कि "असामान्य" और "सही" का एक दूसरे के साथ बहुत कम संबंध है। हालांकि, असामान्य परिणाम स्पष्ट रूप से थोड़ा और औचित्य की मांग करते हैं क्योंकि असामान्य होना एक संकेतक है जो एक त्रुटि हो सकती है। आपका तर्क अमान्य है: हालाँकि सूत्र वास्तव में एक निष्पक्ष अनुमानक के लिए कम कर देता है जब सभी भार समान होते हैं, तो इसका मतलब यह नहीं है कि जब असमान वजन का उपयोग किया जाता है तो अनुमानकर्ता निष्पक्ष नहीं रहता है। मैं यह नहीं कह रहा हूं कि आपका निष्कर्ष गलत है, लेकिन केवल इतना ही कि अभी तक कोई वैध औचित्य पेश नहीं किया गया है।
whuber

18

सूत्र विभिन्न स्थानों पर उपलब्ध हैं, जिनमें विकिपीडिया भी शामिल है

यह ध्यान रखना महत्वपूर्ण है कि यह इस बात पर निर्भर करता है कि वजन का क्या अर्थ है । विशेष रूप से, आपको अलग-अलग उत्तर मिलेंगे यदि वज़न आवृत्तियाँ हैं (यानी आप केवल अपनी पूरी राशि जोड़ने से बचने की कोशिश कर रहे हैं), यदि वज़न वास्तव में प्रत्येक माप का विचरण है, या यदि वे आपके लिए केवल कुछ बाहरी मान हैं अपने डेटा पर थोपना।

आपके मामले में, यह सतही रूप से ऐसा लगता है कि वज़न आवृत्तियों हैं लेकिन वे नहीं हैं । आप अपने डेटा को फ़्रीक्वेंसी से उत्पन्न करते हैं, लेकिन आपके डेटा सेट में 4 के 3 और 15 रिकॉर्ड के 45 रिकॉर्ड होना कोई साधारण बात नहीं है। इसके बजाय, आपको अंतिम विधि का उपयोग करने की आवश्यकता है। (वास्तव में, यह सब बकवास है - आपको वास्तव में प्रक्रिया के अधिक परिष्कृत मॉडल का उपयोग करने की आवश्यकता है जो इन नंबरों को उत्पन्न कर रहे हैं! आपके पास स्पष्ट रूप से ऐसा कुछ नहीं है जो सामान्य रूप से वितरित संख्याओं को थूकता है, इसलिए मानक विचलन के साथ सिस्टम को चिह्नित करता है। सही काम नहीं है।)

किसी भी स्थिति में, "विश्वसनीयता" भार के साथ विचरण का सूत्र (जिससे आप सामान्य तरीके से मानक विचलन की गणना करते हैं) है

wi(xix)2wiwi2wi

x=wixi/wi

आपके पास वज़न के लिए एक अनुमान नहीं है, जो मैं मान रहा हूं कि आप विश्वसनीयता के लिए आनुपातिक होना चाहते हैं। प्रतिशत लेते हुए जिस तरह से आप विश्लेषण करने जा रहे हैं, भले ही वे बर्नौली प्रक्रिया द्वारा उत्पन्न किए गए हों, क्योंकि यदि आपको 20 और 0 का स्कोर मिलता है, तो आपके पास अनंत प्रतिशत है। एसईएम के व्युत्क्रम से वजन करना एक सामान्य और कभी-कभी इष्टतम चीज है। आपको शायद बायेसियन अनुमान या विल्सन स्कोर अंतराल का उपयोग करना चाहिए ।


2
+1। वज़न के अलग-अलग अर्थों की चर्चा मैं इस धागे में सभी की तलाश में था। भारित आँकड़ों के बारे में इस साइट के सभी सवालों में यह एक महत्वपूर्ण योगदान है। (मैं एक छोटे से सामान्य वितरण और मानक विचलन के विषय में निक्षिप्त टिप्पणी के बारे में चिंतित हूँ हालांकि, क्योंकि वे गलत है कि एसडीएस सुझाव है एक मॉडल सामान्य के आधार पर बाहर किसी काम का नहीं है।)
whuber

@whuber - खैर, बचाव के लिए केंद्रीय सीमा प्रमेय, निश्चित रूप से! लेकिन ओपी क्या कर रहा था, एक औसत और मानक विचलन के साथ संख्याओं के उस सेट को चिह्नित करने की कोशिश करना बहुत हद तक असंगत लगता है। और सामान्य तौर पर, कई उपयोगों के लिए मानक विचलन एक झूठ को समझने की झूठी भावना को समाप्त करता है। उदाहरण के लिए, यदि वितरण सामान्य लेकिन (या एक अच्छा सन्निकटन) है, तो मानक विचलन पर निर्भर होने से आपको पूंछों के आकार का बुरा अंदाजा होगा, जब यह बिल्कुल उन पूंछों का होता है, जिन्हें आप सांख्यिकीय रूप से सबसे अधिक ध्यान रखते हैं। परिक्षण।
रेक्स केर

@RexKerr हम शायद ही मानक विचलन को दोष दे सकते हैं यदि लोग उस पर व्याख्याएं रखते हैं जो अवांछनीय हैं। लेकिन हम सामान्यता से दूर चले जाते हैं और परिमित विचरण (उदाहरण के लिए) के साथ निरंतर, सममित असमान वितरण के बहुत व्यापक वर्ग पर विचार करते हैं। फिर वितरण के 89 से 100 प्रतिशत के बीच दो मानक विचलन हैं। यह जानने के लिए अक्सर बहुत उपयोगी होता है (और 95% बीच में बहुत झूठ होता है, इसलिए यह लगभग 7% से अधिक नहीं है); कई सामान्य वितरणों के साथ, ड्रॉपिंग समरूपता का पहलू बहुत अधिक नहीं बदलता है (उदाहरण के लिए घातीय को देखें), .... ctd
Glen_b -Reinstate Monica

ctd ... - या यदि हम उन धारणाओं में से कोई भी नहीं बनाते हैं, तो हमेशा सामान्य चेबीशेव सीमाएँ होती हैं जो कम से कम पूंछ और मानक विचलन के बारे में कुछ कहते हैं ..
Glen_b -Reinstate Monica

1
@ गैब्रिएल - हाँ, क्षमा करें, मैं मैला हो रहा था। (मुझे लगता है कि लोग बता सकते हैं कि कौन सी झलक है।) मैंने अपना विवरण सही कर लिया है।
रेक्स केर

5
=SQRT(SUM(G7:G16*(H7:H16-(SUMPRODUCT(G7:G16,H7:H16)/SUM(G7:G16)))^2)/
     ((COUNTIFS(G7:G16,"<>0")-1)/COUNTIFS(G7:G16,"<>0")*SUM(G7:G16)))

कॉलम Gवेट हैं, कॉलम Hवैल्यू हैं


Ctrl + Shift + Enter का उपयोग करना मेरे लिए एक गोच था, लेकिन यह अन्यथा काम करने लगता है।
फिलिप 4d16 '

1

pi=viivi,
vi

μ^=ipixi,
σ^2=ipi(xiμ^)2

0
Option Explicit

Function wsdv(vals As Range, wates As Range)
Dim i, xV, xW, y As Integer
Dim wi, xi, WgtAvg, N
Dim sumProd, SUMwi

    sumProd = 0
    SUMwi = 0
    N = vals.Count  ' number of values to determine W Standard Deviation
    xV = vals.Column  ' Column number of first value element
    xW = wates.Column  ' Column number of first weight element
    y = vals.Row - 1  ' Row number of the values and weights

    WgtAvg = WorksheetFunction.SumProduct(vals, wates) / WorksheetFunction.Sum(wates)

    For i = 1 To N  ' step through the elements, calculating the sum of values and the sumproduct
        wi = ActiveSheet.Cells(i + y, xW).Value  ' (i+y, xW) is the cell containing the weight element
        SUMwi = SUMwi + wi
        xi = ActiveSheet.Cells(i + y, xV).Value  ' (i+y, xV) is the cell containing the value element
        sumProd = sumProd + wi * (xi - WgtAvg) ^ 2
    Next i

    wsdv = (sumProd / SUMwi * N / (N - 1)) ^ (1 / 2)  ' output of weighted standard deviation

End Function

2
साइट पर आपका स्वागत है, @ uswer71015। यह केवल कोड प्रतीत होता है। क्या आप कुछ पाठ / स्पष्टीकरण जोड़ सकते हैं कि कोड कैसे काम करता है और यह प्रश्न का उत्तर कैसे देता है?
गूँज - मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.