आज मैंने आँकड़ों का एक परिचयात्मक वर्ग पढ़ाया और एक छात्र मेरे पास एक प्रश्न लेकर आया, जिसे मैं यहाँ प्रस्तुत करता हूँ: "क्यों मानक विचलन को विचरण के वर्ग के रूप में परिभाषित किया गया है न कि वर्ग के योग के वर्ग के रूप में?
हम जनसंख्या विचरण निर्धारित करें:
और मानक विचलन: ।
हम को जो व्याख्या दे सकते हैं , वह यह है कि जनसंख्या के औसत माध्य से इकाइयों में औसत विचलन होता है ।
हालाँकि, sd की परिभाषा में हम वर्गों के योग के वर्गफल को √ से विभाजित करते हैं । छात्र यह सवाल उठाता है कि हमद्वाराइसके बजायवर्गों के योग के वर्ग को विभाजित क्यों नहीं करते हैं। : इस प्रकार हम प्रतिस्पर्धा सूत्र के लिए आते हैं
मुझे लगा कि यह सवाल मूर्खतापूर्ण नहीं है। मैं उस छात्र को एक उत्तर देना चाहूंगा जो यह कहकर आगे बढ़ता है कि एसडी को विचरण के वर्गर्ट के रूप में परिभाषित किया गया है जो कि औसत स्क्वैयर डेविटॉन है। अलग तरीके से कहें, छात्र को सही फॉर्मूले का उपयोग क्यों करना चाहिए और उसके विचार का पालन नहीं करना चाहिए ?
यह प्रश्न एक पुराने धागे और यहां दिए गए उत्तरों से संबंधित है । उत्तर तीन दिशाओं में चलते हैं:
- रूट मतलब-चुकता (RMS) विचलन, नहीं मतलब (यानी, से "विशिष्ट" विचलन है )। इस प्रकार, इसे अलग तरह से परिभाषित किया गया है।
- इसमें अच्छे गणितीय गुण हैं।
- इसके अलावा, sqrt "इकाइयों" को उनके मूल पैमाने पर वापस लाएगा। बहरहाल, यह भी के लिए मामला होगा , जो विभाजित द्वारा बजाय।
1 और 2 अंक के दोनों आरएमएस के रूप में एसडी के पक्ष में तर्क हैं, लेकिन मैं के इस्तेमाल के खिलाफ एक तर्क नहीं दिख रहा है । क्या औसत आरएमएस दूरी के उपयोग की परिचयात्मक स्तर के छात्रों को समझाने के लिए अच्छा तर्क होगा माध्य से?
"Why is the standard deviation defined as sqrt of variance and not as average of [the root of] sum of squares?"
यह हो सकता है कि कोष्ठक के अंदर क्या है किसी तरह सवाल में खो गया?