शोर टिप्पणियों से सही मतलब का निर्धारण


13

मेरे पास फॉर्म (मतलब, stdev) के डेटा बिंदुओं का एक बड़ा सेट है। मैं इसे एक एकल (बेहतर) माध्य और एक (उम्मीद) छोटे मानक विचलन को कम करना चाहता हूं।

स्पष्ट रूप से मैं केवल गणना कर सकता हूं , हालांकि यह इस तथ्य को ध्यान में नहीं रखता है कि कुछ डेटा बिंदु दूसरों की तुलना में काफी अधिक सटीक हैं।datameanN

इसे सरलता से कहने के लिए, मैं इन डेटा बिंदुओं के भारित औसत को पहले से निकालना चाहता हूं, लेकिन यह नहीं जानता कि मानक विचलन के संदर्भ में वजन का कार्य क्या होना चाहिए।

जवाबों:


24

आप फार्म के माध्य के लिए एक रैखिक अनुमानक की तलाश करते हैंμ

μ^=i=1nαixi

जहां वजन हैं और अवलोकन हैं। उद्देश्य वजन के लिए उचित मूल्यों को खोजना है। चलो हो सच का मानक विचलन , या के साथ मेल नहीं हो सकता है हो सकता है अनुमान मानक विचलन आप की संभावना है। मान लें कि अवलोकन निष्पक्ष हैं; यही कारण है कि, उनकी अपेक्षाएँ सभी मीन बराबर हैं । इन शब्दों में हम गणना कर सकते हैं कि हैαixiσixiμμ^

E[μ^]=i=1nαiE[xi]=μi=1nαi

और (प्रदान असंबंधित हैं) इस अनुमानक का विचरण हैxi

Var[μ^]=i=1nαi2σi2.

इस बिंदु पर कई लोगों की आवश्यकता है कि अनुमानक निष्पक्ष हो; यही है, हम चाहते हैं कि इसकी उम्मीद सही मायने में समान हो। इसका मतलब है कि वजन एकता के लिए योग होना चाहिए। इस प्रतिबंध के अधीन, अनुमानक की सटीकता (माध्य वर्ग त्रुटि के साथ मापी गई) को विचरण को कम करके अनुकूलित किया जाता है। अद्वितीय समाधान (आसानी से एक लैग्रेग गुणक के साथ प्राप्त किया जाता है या एक दूरी को कम करने की समस्या के रूप में ज्यामितीय रूप से स्थिति की फिर से व्याख्या करके) यह है कि वेट लिए आनुपातिक होना चाहिए । αi1/σi2 सम-टू-यूनिटी प्रतिबंध उनके मूल्यों को कम करता है, उपज देता है

μ^=i=1nxi/σi2i=1n1/σi2

तथा

Var[μ^]=1i=1n1/σi2=1n(1ni=1n1σi2)1.

शब्दों में,

माध्य का न्यूनतम-भिन्नता रहित अनुमानक वज़न के भिन्न रूपांतरों के विपरीत आनुपातिक बनाकर प्राप्त किया जाता है; उस अनुमानक का विचरण गुना भिन्न रूपांतरों का होता है।1/n

हम आम तौर पर असली variances नहीं जानते हैं । हम जो कुछ कर सकते हैं, उसके बारे में अनुमानों के विपरीत रूपांतरों (आपके मानक विचलन के वर्ग) के विपरीत आनुपातिक बनाना है और यह अच्छी तरह से काम करेगा।σi


1
और इस उत्तर से संबंधित है, व्हिबर से भी: आंकड़े
हेनरी

यदि हम "टिप्पणियों को निष्पक्ष नहीं मान लेते हैं" तो क्या होगा? उस कथन के साथ आप कह रहे हैं कि यदि अनंत यादृच्छिक व्यक्तिगत मापों को अवलोकन जोड़ा जाता है तो हमें इसका मतलब म्यू मिलता है? xi
user1420303
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.