भारित विचरण में पूर्वाग्रह सुधार


22

अनवीटेड विचरण में बायस मौजूद है, जब उसी डेटा से माध्य का अनुमान लगाया गया था: वार(एक्स):=1

वार(एक्स): =1nΣमैं(एक्समैं-μ)2
Var(X):=1n1i(xiE[X])2

मैं भारित माध्य और विचरण में देख रहा हूं, और सोच रहा हूं कि भारित विचरण के लिए उपयुक्त पूर्वाग्रह सुधार क्या है। उपयोग करना:

मतलब(एक्स): =1ΣमैंωमैंΣमैंωमैंएक्समैं

"भोली", गैर-सुधारा हुआ विचरण जो मैं उपयोग कर रहा हूं, वह यह है:

वार(एक्स): =1ΣमैंωमैंΣमैंωमैं(एक्समैं-मतलब(एक्स))2

इसलिए मैं सोच रहा हूं कि क्या पूर्वाग्रह को सही करने का सही तरीका है

A)

वार(एक्स): =1Σमैंωमैं-1Σमैंωमैं(एक्समैं-मतलब(एक्स))2

या B)

वार(एक्स): =nn-11ΣमैंωमैंΣमैंωमैं(एक्समैं-मतलब(एक्स))2

या C)

वार(एक्स): =Σमैंωमैं(Σमैंωमैं)2-Σमैंωमैं2Σमैंωमैं(एक्समैं-मतलब(एक्स))2

क) वजन कम होने पर मुझे इससे कोई मतलब नहीं है। सामान्यीकरण मूल्य 0 या नकारात्मक भी हो सकता है। लेकिन कैसे बी) ( टिप्पणियों की संख्या है) - क्या यह सही दृष्टिकोण है? क्या आपके पास कुछ संदर्भ हैं जो यह दर्शाता है? मैं "अपडेटिंग माध्य और विचरण अनुमान: एक बेहतर तरीका", डीएचडी वेस्ट, 1979 का उपयोग करता हूं। तीसरा, C) इस प्रश्न के उत्तर की मेरी व्याख्या है: /mathpro/22203/unbiased-estimate-of-the-variance-of-an-unnormalised-weighted-meann

सी के लिए) मुझे अभी पता चला है कि भाजक तरह दिखता है । क्या यहां कुछ सामान्य संबंध हैं? मुझे लगता है कि यह पूरी तरह से संरेखित नहीं करता है; और जाहिर है कि कनेक्शन है कि हम विचरण की गणना करने की कोशिश कर रहे हैं ...वार(Ω)

इन तीनों को सभी को सेट करने की पवित्रता जाँच "जीवित" लगती है । तो मुझे किस परिसर के तहत उपयोग करना चाहिए? '' अपडेट: '' व्हीबर ने सुझाव दिया है कि स्वच्छता जांच को भी और सभी शेष छोटे। ऐसा लगता है कि ए और बी को नियंत्रित करता है।ω 1 = ω 2 = .5 ω मैं = εωमैं=1ω1=ω2=.5ωमैं=ε


जब आप उन मामलों पर विचार करते हैं जहां दो सबसे बड़े वजन बराबर होते हैं और बाकी सभी गायब हो जाते हैं, तो दोनों (ए) और (बी) विवाद से गिर जाते हैं (क्योंकि वे लिए ज्ञात परिणामों से असहमत हैं )। (सी) एक सन्निकटन प्रतीत होता है; मुझे संदेह है कि सही कारक वज़न का अधिक जटिल कार्य है। n=2
whuber

@ नीचे दिए गए सुझाव से पता चलता है कि यह सी है। क्या आपके पास अधिक विस्तृत चिंताएं हैं?
ऐनी-मूस

1
समाधान (ए) काम करता है, मैंने इसे अतीत में लागू किया है और अनुभवजन्य परीक्षणों से पुष्टि कर सकता है कि यह सही परिणाम देता है। हालाँकि, आपको वेट के लिए पूर्णांक मान और> 0.
गैबरस

धन्यवाद! इसने मुझे सही रास्ते पर लाने में बहुत मदद की जब वजन एक घातीय चलती औसत के लिए होता है! यह पता चला है कि विचरण की गणना करने का भोलापन तरीका वास्तव में छोटे (1-1 / n) सुधार के अतिरिक्त 2 के एक स्थिर कारक द्वारा इसे हटा देता है, जो सरल चलती औसत गणना के अनुरूप है। यह एक विशेष रूप से पागल विशेष मामला है!
साओलोफ

जवाबों:


10

मैं गणित के माध्यम से चला गया और संस्करण C के साथ समाप्त हुआ:

वीआर(एक्स)=(Σमैंωमैं)2(Σमैंωमैं)2-Σमैंωमैं2वी¯
जहां गैर सही विचरण का अनुमान है। जब सभी समान होते हैं, तो सूत्र मामले से सहमत होता है । मैं नीचे दिए गए प्रमाण को विस्तार से बताता हूं:वी¯ωमैं

सेटिंग , हमारे पास हैλमैं=ωमैंΣमैंωमैं

वी¯=Σमैंλमैं(एक्समैं-Σjλjएक्सj)2

आंतरिक शब्द का विस्तार देता है:

(एक्समैं-Σjλjएक्सj)2=एक्समैं2+Σj,कश्मीरλjλकश्मीरएक्सjएक्सकश्मीर-2Σjλjएक्समैंएक्सj

यदि हम अपेक्षा लेते हैं, तो हमारे पास यह है कि , शब्द प्रत्येक शब्द में मौजूद है, यह रद्द कर देता है और हम प्राप्त:[एक्समैंएक्सj]=वीआर(एक्स)1मैं=j+[एक्स]2[एक्स]

[वी¯]=वीआर(एक्स)Σमैंλमैं(1+Σjλj2-2λमैं)
जो कि यह वेरिएंट C पाने के लिए संबंध में की अभिव्यक्ति में प्लग करने के लिए रहता है ।
[वी¯]=वीआर(एक्स)(1-Σjλj2)
λमैंωमैं

यह ऊपर वैरिएंट C है, है ना?
ऐनी-मूस

Oups, हाँ, यह वेरिएंट C. है
ThePawn

मैंने इस समाधान को आनुभविक रूप से जाँच लिया है और यह काम नहीं करता है ... केवल एक ही ऐसा समाधान है (A) जिसे मैंने पूर्व में भी अपने द्वारा कार्यान्वित किया है, लेकिन यह केवल पूर्णांक संख्याओं और> = 0
विस्तृत

2
यह समीकरण विकिपीडिया, मतलाब, आर, और अन्य जो इस समीकरण को लागू कर रहे हैं, के अनुसार गलत है। यहाँ अंश को चुकता किया गया है, लेकिन यह ऐसा नहीं होना चाहिए, यह ओपी द्वारा प्रस्तावित (सी) जैसा होना चाहिए। देखें en.wikipedia.org/wiki/...
gaborous

1
@rajatkhanduja मैं प्रमाण के बारे में बात नहीं कर रहा था लेकिन अंतिम व्युत्पन्न समीकरण (इस उत्तर में शीर्ष एक)। लेकिन वास्तव में यह सही है, अंश अभी चुकता है क्योंकि हम V से गुणा करते हैं, इस प्रकार अंश समाप्त हो जाता है। वैसे भी, यह अनुमानक पक्षपाती है क्योंकि मैं नीचे अपने उत्तर में समझाता हूं क्योंकि यह "विश्वसनीयता" -टाइट वेट पर निर्भर करता है।
जाबोर

7

A और C दोनों सही हैं, लेकिन जो आप उपयोग करेंगे वह इस बात पर निर्भर करता है कि आप किस तरह के वज़न का उपयोग करते हैं:

  • "रिपीट" -टाइप वेट (प्रत्येक अवलोकन के लिए आवृत्तियों की संख्या की गणना करते हुए) का उपयोग करने के लिए आपको एक की आवश्यकता होती है, और यह निष्पक्ष नहीं होता है
  • C को आपको "विश्वसनीयता" -टाइप वेट (या तो सामान्य वज़न या फिर प्रत्येक अवलोकन के लिए संस्करण) का उपयोग करने की आवश्यकता है , और पक्षपाती है । यह निष्पक्ष नहीं हो सकता।

C का आवश्यक रूप से पक्षपाती होने का कारण यह है क्योंकि यदि आप "रिपीट" -टाइप वेट का उपयोग नहीं करते हैं, तो आप टिप्पणियों (नमूना आकार) की कुल संख्या की गणना करने की क्षमता खो देते हैं, और इस प्रकार आप एक सुधार कारक का उपयोग नहीं कर सकते।

अधिक जानकारी के लिए, हाल ही में अपडेट किए गए विकिपीडिया लेख की जाँच करें: http://en.wikipedia.org/wiki/Weighted_arithmetic_mean#Weighted_sample_variance

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.