यदि आप भिन्नता को - जनसंख्या समान लेकिन नमूने के साथ , तो आपके दोनों नमूनों का एक ही रूप होगा।रों2n=एमएसई= 1nΣnमैं = १( x)मैं- एक्स¯)2μ
इसलिए अंतर विशुद्ध रूप से नमूना विचरण ( लिए सामान्य सूत्र में सुधार के कारण है। , जो इस तथ्य के लिए समायोजित करता है कि नमूना माध्य का मतलब जनसंख्या की तुलना में डेटा के करीब है, ताकि इसे निष्पक्ष (औसत मूल्य "औसत रूप से" लिया जा सके)।रों2एन - 1= एनएन - 1⋅ एमएसई = nएन - 1⋅ १nΣnमैं = १( x)मैं- एक्स¯)2= 1एन - 1Σnमैं = १( x)मैं- एक्स¯)2
प्रभाव धीरे-धीरे बढ़ते हुए नमूने के आकार के साथ चला जाता है, जैसा कि 1 से n \ _ के लिए \ infty हो जाता है ।एन - 1nn → ∞
कोई विशेष कारण नहीं है कि आपको विचरण के लिए निष्पक्ष अनुमानक का उपयोग करना है, वैसे - रों2n एक पूरी तरह से मान्य अनुमानक है, और कुछ मामलों में यकीनन अधिक सामान्य रूप से लाभ हो सकता है (निष्पक्षता जरूरी है कि बड़ा हो सौदा)।
Variance ही सीधे प्रसार का एक उपाय नहीं है। यदि मैं अपने डेटा सेट में सभी मानों को दोगुना करता हूं, तो मुझे लगता है कि वे "प्रसार" से दोगुना हैं। लेकिन विचरण 4. के एक कारक से बढ़ता है। इसलिए आमतौर पर, यह कहा जाता है कि विचलन के बजाय मानक विचलन प्रसार का एक उपाय है।
बेशक, एक ही मुद्दा मानक विचलन (सामान्य रोंएन - 1 संस्करण) के साथ होता है जैसा कि विचरण के साथ होता है - जब आप मानक विचलन के बिंदुओं को दोगुना करते हैं, तो उसी कारण जैसे विचरण होता है।
छोटे नमूनों में बेसेल सुधार मानक विचलन को उस प्रभाव के कारण प्रसार के एक उपाय के रूप में कुछ हद तक कम सहज बनाता है (जो कि नमूना को दोहराकर मूल्य बदलता है)। लेकिन प्रसार के कई उपाय नमूना को डुप्लिकेट करते समय समान मूल्य बनाए रखते हैं; मैं कुछ का उल्लेख करूंगा -
रोंn (बेशक)
माध्य (निरपेक्ष) माध्य से विचलन
माध्यिका से औसत (निरपेक्ष) विचलन
इंटरक्वेर्टाइल रेंज (कम से कम सैंपल क्वैर्टाइल्स की कुछ परिभाषाओं के लिए)
{3, 5}
पहले सूत्र के अनुसार स्वयं का विचरण 1 है। जैसा कि आप बताते हैं, प्रश्नकर्ता ने उस जनसंख्या के विचरण का अनुमान लगाने का प्रयास किया है जिससे यह एक नमूना माना जाता है, लेकिन कौन जानता है कि यह है या नहीं।