यदि अवलोकनों की नक़ल की जाती है तो नमूने का विचलन क्यों बदल जाता है?


25

विचरण को प्रसार का एक उपाय कहा जाता है। इसलिए, मैंने सोचा था कि संख्याओं 3,5के विचरण 3,3,5,5समान हैं क्योंकि संख्याएँ समान रूप से फैली हुई हैं। लेकिन यह वैसा नहीं है 3,5, 2जबकि का विचरण 3,3,5,5है 1 1/3

इस पहेली ने मुझे यह समझा दिया कि विचरण को फैलने का मापक माना जाता है।

तो, उस संदर्भ में, क्या करता है प्रसार के उपाय मतलब?

जवाबों:


32

यदि आप भिन्नता को - जनसंख्या समान लेकिन नमूने के साथ , तो आपके दोनों नमूनों का एक ही रूप होगा।sn2=MSE=1ni=1n(xix¯)2μ

इसलिए अंतर विशुद्ध रूप से नमूना विचरण ( लिए सामान्य सूत्र में सुधार के कारण है। , जो इस तथ्य के लिए समायोजित करता है कि नमूना माध्य का मतलब जनसंख्या की तुलना में डेटा के करीब है, ताकि इसे निष्पक्ष (औसत मूल्य "औसत रूप से" लिया जा सके)।रोंn-12=nn-1एमएसई=nn-11nΣमैं=1n(एक्समैं-एक्स¯)2=1n-1Σमैं=1n(एक्समैं-एक्स¯)2

प्रभाव धीरे-धीरे बढ़ते हुए नमूने के आकार के साथ चला जाता है, जैसा कि 1 से n \ _ के लिए \ infty हो जाता हैn-1nn

कोई विशेष कारण नहीं है कि आपको विचरण के लिए निष्पक्ष अनुमानक का उपयोग करना है, वैसे - रोंn2 एक पूरी तरह से मान्य अनुमानक है, और कुछ मामलों में यकीनन अधिक सामान्य रूप से लाभ हो सकता है (निष्पक्षता जरूरी है कि बड़ा हो सौदा)।

Variance ही सीधे प्रसार का एक उपाय नहीं है। यदि मैं अपने डेटा सेट में सभी मानों को दोगुना करता हूं, तो मुझे लगता है कि वे "प्रसार" से दोगुना हैं। लेकिन विचरण 4. के एक कारक से बढ़ता है। इसलिए आमतौर पर, यह कहा जाता है कि विचलन के बजाय मानक विचलन प्रसार का एक उपाय है।

बेशक, एक ही मुद्दा मानक विचलन (सामान्य रोंn-1 संस्करण) के साथ होता है जैसा कि विचरण के साथ होता है - जब आप मानक विचलन के बिंदुओं को दोगुना करते हैं, तो उसी कारण जैसे विचरण होता है।

छोटे नमूनों में बेसेल सुधार मानक विचलन को उस प्रभाव के कारण प्रसार के एक उपाय के रूप में कुछ हद तक कम सहज बनाता है (जो कि नमूना को दोहराकर मूल्य बदलता है)। लेकिन प्रसार के कई उपाय नमूना को डुप्लिकेट करते समय समान मूल्य बनाए रखते हैं; मैं कुछ का उल्लेख करूंगा -

  • रोंn (बेशक)

  • माध्य (निरपेक्ष) माध्य से विचलन

  • माध्यिका से औसत (निरपेक्ष) विचलन

  • इंटरक्वेर्टाइल रेंज (कम से कम सैंपल क्वैर्टाइल्स की कुछ परिभाषाओं के लिए)


3
"निष्पक्ष अनुमान लगाने वाले का उपयोग करने के लिए कोई विशेष कारण नहीं है" - वास्तव में आपको आवश्यक रूप से कुछ भी अनुमान नहीं लगाना चाहिए । {3, 5}पहले सूत्र के अनुसार स्वयं का विचरण 1 है। जैसा कि आप बताते हैं, प्रश्नकर्ता ने उस जनसंख्या के विचरण का अनुमान लगाने का प्रयास किया है जिससे यह एक नमूना माना जाता है, लेकिन कौन जानता है कि यह है या नहीं।
स्टीव जेसप

1

किसी प्रकार की महामारी, _, _, _, । तो एक नमूना के विचरण का अपेक्षित मूल्य बहुत कम है, अंतर के साथ नमूने के माध्य का विचरण होता है।वीएक्स=वीएक्स+वीएक्स

सामान्य नमूना प्रसरण सूत्र उस के लिए क्षतिपूर्ति करता है, और नमूना के माध्य के भिन्नता नमूना आकार के साथ विपरीत होता है।

एक चरम उदाहरण के रूप में, एक एकल नमूना लेना हमेशा 0 का एक नमूना विचरण दिखाएगा, जाहिर है कि अंतर्निहित वितरण के लिए 0 के विचरण को इंगित नहीं करेगा।

अब 2 और 4 समान रूप से भारित नमूनों के लिए, सुधारात्मक कारक क्रमशः और हैं। तो आपकी गणना की गई अपेक्षित भिन्नताएं कारक से भिन्न होती हैं । नमूने का प्रसरण स्वयं किसी भी स्थिति में है। लेकिन पहला मामला के आधार वितरण के लिए एक कमजोर मामले को प्रस्तुत करता है , और हर दूसरे मूल्य का मतलब बड़ा विचरण होगा।4 / 3 2 / 3 1 42/14/32/314


2
आंकड़ों के साथ अनुमानकर्ताओं को भ्रमित करके , यह जवाब स्पष्ट करता है, बजाय प्रश्न को स्पष्ट करता है। कृपया इस धागे में Glen_b का मूल उत्तर पढ़ें। पहले दो पैराग्राफ में तर्क रहस्यमय है क्योंकि यह प्रश्न के लिए अप्रासंगिक लगता है।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.