विचरण और मानक विचलन के बीच अंतर क्या है?


127

मैं सोच रहा था कि विचलन और मानक विचलन के बीच अंतर क्या है।

यदि आप दो मानों की गणना करते हैं, तो यह स्पष्ट है कि आपको विचलन से मानक विचलन प्राप्त होता है, लेकिन वितरण के संदर्भ में इसका क्या अर्थ है?

इसके अलावा, आपको वास्तव में एक मानक विचलन की आवश्यकता क्यों है?



12
आपको शायद अब तक इसका जवाब मिल गया है। अभी भी इस लिंक में सबसे सरल और सबसे अच्छी व्याख्या है। mathsisfun.com/data/standard-deviation.html

2
मानक विचलन उपयोगी है क्योंकि मूल्य उसी पैमाने पर है जिस डेटा से इसकी गणना की गई थी। यदि मीटर को मापते हैं, तो मानक विचलन मीटर होगा। इसके विपरीत, वियरेन्स, मीटर वर्ग होगा।
व्लादिस्लाव्स डोवेल्केक्स

मानक भिन्नता निष्पक्ष हो सकती है लेकिन मानक विचलन इसलिए नहीं हो सकता क्योंकि स्क्वायर रूट फ़ंक्शन गैर रेखीय है।
दक्ष गर्ग

जवाबों:


84

मानक विचलन विचरण का वर्गमूल है।

मानक विचलन समान इकाइयों में माध्य के रूप में व्यक्त किया जाता है, जबकि विचरण वर्गों में व्यक्त किया जाता है, लेकिन एक वितरण को देखने के लिए, आप या तो बस तब तक उपयोग कर सकते हैं जब तक कि आप जो उपयोग कर रहे हैं उसके बारे में स्पष्ट हो। उदाहरण के लिए, माध्य = 10 और sd = 3 के साथ एक सामान्य वितरण बिलकुल वैसा ही है जैसा कि माध्य = 10 और चर = 9 के साथ एक सामान्य वितरण है।


58
हाँ गणितीय तरीका है कि इन दो मापदंडों की व्याख्या करने के लिए, लेकिन तार्किक विस्फोट क्या है? मैं वास्तव में एक ही चीज़ (अंकगणितीय माध्य के चारों ओर विचलन) को दिखाने के लिए दो मापदंडों को शून्य क्यों करता हूं ...
Le Max

5
तुम सच में दोनों की जरूरत नहीं है आप एक रिपोर्ट हैं, तो आप अन्य रिपोर्ट करने के लिए की जरूरत नहीं है
पीटर Flom

8
हमें दोनों की आवश्यकता है: मानक विचलन व्याख्या, रिपोर्टिंग के लिए अच्छा है। सिद्धांत विकसित करने के लिए विचरण बेहतर है।
kjetil b halvorsen

4
मानक विचलन की रिपोर्टिंग का लाभ यह है कि यह डेटा के पैमाने पर बना रहता है। कहें, वयस्क ऊंचाइयों का एक नमूना मीटर में है, तो मानक विचलन भी मीटर में होगा।
व्लादिस्लाव्स डोवेल्केक्स

5
@RushatRai यादृच्छिक चर की रकम के साथ काम करते समय, variances एक साथ जुड़ जाते हैं। स्वतंत्र यादृच्छिक चर के लिए, । स्वतंत्रता के बिना सामान्य मामले में एक समान अभिव्यक्ति मौजूद है (सहसंयोजक शर्तों का उपयोग करके सुधार के साथ)। सामान्य तौर पर, वर्गमूल परिवर्तन चीजों को जटिल बनाता है और विश्लेषणात्मक रूप से काम करने के लिए मानक विचलन को अधिक कठिन बनाता है। Var(Xi)=Var(Xi)
knrumsey

49

आप दोनों की जरूरत नहीं है। उनके प्रत्येक उद्देश्य अलग-अलग हैं। एसडी आमतौर पर डेटा की परिवर्तनशीलता का वर्णन करने के लिए अधिक उपयोगी होता है, जबकि विचरण आमतौर पर गणितीय रूप से अधिक उपयोगी होता है। उदाहरण के लिए, असंबद्ध वितरण (यादृच्छिक चर) के योग में भी एक भिन्नता होती है जो उन वितरणों के प्रकारों का योग होता है। यह सच नहीं होगा SD। दूसरी ओर, एसडी को मूल चर की इकाइयों में व्यक्त किए जाने की सुविधा है।


24

यदि जॉन स्वतंत्र यादृच्छिक चर को संदर्भित करता है जब वह कहता है कि "असंबंधित वितरण," तो उसकी प्रतिक्रिया सही है। हालाँकि, आपके प्रश्न का उत्तर देने के लिए, कई बिंदु हैं जिन्हें जोड़ा जा सकता है:

  1. माध्य और विचरण दो मापदंड हैं जो एक सामान्य वितरण निर्धारित करते हैं।

  2. चेबीशेव असमानता मतलब के मानक विचलन के भीतर देखे गए यादृच्छिक चर की संभावना को सीमित करता है।k

  3. मानक विचलन का उपयोग सांख्यिकीय परीक्षणों के लिए आँकड़ों को सामान्य करने के लिए किया जाता है (जैसे ज्ञात मानक विचलन का उपयोग परीक्षण के लिए एक नमूना माध्य को सामान्य करने के लिए किया जाता है कि माध्य से भिन्न होता है या नमूना मानक विचलन का उपयोग तब होता है जब सही मानक का मतलब होता है विचलन अज्ञात है, जिसके परिणामस्वरूप परीक्षण होता है)।z0t

  4. सामान्य वितरण के लिए वितरण का मानक विचलन के भीतर है । मानक विचलन के भीतर और मानक विचलन के भीतर से अधिक ।68%195.4%299%3

  5. त्रुटि के मार्जिन को अनुमान के मानक विचलन के कई के रूप में व्यक्त किया जाता है।

  6. बेतरतीब और पूर्वाग्रह यादृच्छिक मात्रा में अनिश्चितता के उपाय हैं। एक अनुमान के लिए माध्य वर्ग त्रुटि विचरण + वर्गित पूर्वाग्रह के बराबर है।


4
आपको शायद "प्राकृतिक पैरामीटर" नहीं कहना चाहिए, जिसका अर्थ विचरण से विभाजित है, और 1 विचरण से विभाजित है: en.wikipedia.org/wiki/Natural_parameter
नील G

विकिपीडिया लिंक के अनुसार प्राकृतिक पैरामीटर (रों) अपनी घातीय परिवार प्रपत्र के मामले में सामान्य वितरण के लिए किया जाए या नहीं पर निर्भर करता है या नाम से जाना अज्ञात माना जाता है। लेकिन मैं आपकी बात मान लेता हूं और अपने जवाब से "प्राकृतिक पैरामीटर" ले चुका होता हूं। σ
माइकल चेरिक

बिंदु 3 में, क्या यह "मानक विचलन का उपयोग आँकड़ों को मानकीकृत करने के लिए किया जाता है" नहीं होना चाहिए?
हैरी

15

एक डेटा सेट का विचरण माध्य के सापेक्ष डेटा के गणितीय फैलाव को मापता है। हालांकि, हालांकि यह मूल्य सैद्धांतिक रूप से सही है, लेकिन वास्तविक-दुनिया के अर्थों में इसे लागू करना मुश्किल है क्योंकि इसकी गणना करने के लिए उपयोग किए जाने वाले मूल्यों को चुकता किया गया था। मानक विचलन, जैसा कि विचरण के वर्गमूल एक मान देता है जो मूल मूल्यों के समान इकाइयों में है, जो सामान्य वक्र की अवधारणा के साथ संयोजन में व्याख्या करने में आसान और आसान काम करता है।


यह सरल शब्दों में क्यों समझा रहा है एक महान काम करता है ।
gwg

3
एक और अच्छा बिंदु यह होगा कि प्रत्येक मीट्रिक एसडी और संस्करण माध्य के बारे में चर के प्रसार को मापेंगे। मानक विचलन को प्राप्त करने के लिए विचरण के वर्गमूल को लेते हुए पैमाइश को इकाइयों के चर में वापस लाने के लिए लागू स्केलिंग कारक के रूप में देखा जा सकता है।
मैट एल।

6

वितरण के संदर्भ में वे समतुल्य हैं (अभी तक स्पष्ट रूप से विनिमेय नहीं हैं), लेकिन अनुमान लगाने वालों के संदर्भ में सावधान रहें कि वे नहीं हैं: विचरण के अनुमान का वर्गमूल मानक विचलन का एक (निष्पक्ष) अनुमानक नहीं है। केवल नमूनों की एक बड़ी संख्या के लिए (और अनुमान के आधार पर) दोनों एक दूसरे से संपर्क करते हैं। छोटे नमूने के आकार के लिए, आपको वितरण के पैरामीट्रिक रूप को दोनों के बीच बदलने की आवश्यकता है, जो थोड़ा गोलाकार हो सकता है।


4

विचरण की गणना करते समय, हमने विचलन को चुकता किया। इसका मतलब है कि यदि दिए गए डेटा (अवलोकन) मीटर में हैं, तो यह मीटर वर्ग हो जाएगा। आशा है कि यह विचलन के बारे में सही प्रतिनिधित्व नहीं है। इसलिए, हम फिर से (एसडी) को रूट करते हैं जो कि एसडी के अलावा कुछ भी नहीं है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.