पूर्ण विचलन बनाम मानक विचलन


35

ग्रीर (1983) द्वारा टेक्स्ट बुक "ओ कॉम्प्रिहेंसिव मैथेमैटिक्स फॉर ओ लेवल" में, मुझे इस तरह से औसतन विचलन देखा गया है:

एकल मूल्यों और माध्य के बीच के पूर्ण अंतरों को जोड़ो। फिर उसका औसत प्राप्त करें। अध्याय के माध्यम से शब्द का अर्थ विचलन होता है।

लेकिन मैंने हाल ही में कई संदर्भ देखे हैं जो मानक विचलन शब्द का उपयोग करते हैं और यही वे करते हैं:

एकल मान और माध्य के बीच अंतर के वर्गों की गणना करें। फिर उनका औसत और अंत में उत्तर की जड़ प्राप्त करें।

मैंने डेटा के एक सामान्य सेट पर दोनों तरीकों की कोशिश की और उनके उत्तर अलग-अलग हैं। मैं सांख्यिकीविद् नहीं हूं। मैं अपने बच्चों को विचलन सिखाने की कोशिश करते हुए भ्रमित हो गया।

तो संक्षेप में, क्या मानक मानक विचलन और मतलब विचलन समान हैं या मेरी पुरानी पाठ्य पुस्तक गलत है?


2
दो मात्राएँ भिन्न होती हैं। वे डेटा को अलग तरह से वजन करते हैं। मानक विचलन बड़ा होगा, और यह बड़े मूल्यों से अपेक्षाकृत अधिक प्रभावित होता है। मानक विचलन (सबसे विशेष रूप से, एन-डिनोमिनेटर संस्करण) को मूल-माध्य-वर्ग विचलन के रूप में माना जा सकता है। मानक विचलन अधिक सामान्यतः उपयोग किए जाते हैं।
Glen_b -Reinstate मोनिका

6
बहुत निकटता से संबंधित : आँकड़ें ।stackexchange.com / questions / 118/…
whuber


1
संयोग से, एक कारण यह है कि लोग मानक विचलन को प्राथमिकता देते हैं क्योंकि असंबंधित यादृच्छिक चर के योगों का परिवर्तन (और संबंधित लोगों का एक सरल सूत्र भी होता है)। मतलब विचलन के साथ ऐसा नहीं होता है।
Glen_b -Reinstate मोनिका

2
@ अलेक्सिस फस्ट्रेशन खराब था। स्वतंत्र यादृच्छिक चर के लिए, Var (X + Y) = Var (X) + Var (Y)। इस तथ्य को जगह (यह परिचित की ओर जाता है पर सभी प्रयोग किया जाता है nऐसे शब्द जब फॉर्मूला को मानकीकृत करते हैं, उदाहरण के लिए एक-नमूना टी-सांख्यिकी में)। मतलब विचलन के लिए कोई सामान्य सामान्य तथ्य नहीं है।
Glen_b -Reinstate मोनिका

जवाबों:


27

दोनों जवाब देते हैं कि टिप्पणियों के माध्यम से आपके मूल्य कितनी दूर तक फैले हैं।

एक अवलोकन जो कि माध्य के तहत 1 है, माध्य से समान रूप से "दूर" है जो कि माध्य से 1 है। इसलिए आपको विचलन के संकेत की उपेक्षा करनी चाहिए। इसे दो तरीकों से किया जा सकता है:

  • विचलन के पूर्ण मूल्य की गणना करें और इन्हें योग करें।

  • विचलन को स्क्वायर करें और इन वर्गों को योग करें। वर्ग के कारण, आप उच्च विचलन को अधिक भार देते हैं, और इसलिए इन वर्गों का योग साधनों के योग से अलग होगा।

"पूर्ण विचलन की राशि" या "वर्ग विचलन की राशि के वर्गमूल" की गणना करने के बाद, आप उन्हें क्रमशः "औसत विचलन" और "मानक विचलन" प्राप्त करने के लिए औसत करते हैं।

क्षुद्र विचलन का उपयोग शायद ही कभी किया जाता है।


इसलिए जब कोई बस 'विचलन' कहता है तो क्या उनका मतलब 'मानक विचलन' है?
इसकी अवधि

मैं मानता हूं कि 1 से ऊपर या नीचे एक आम-आदमी के दृष्टिकोण से एक सार्थक 'परिवर्तन' या 'फैलाव' का संकेत देगा। लेकिन इसे चुकाने से बड़ा मूल्य मिलेगा और यह मेरा 'वास्तविक परिवर्तन' नहीं हो सकता है। हो सकता है कि मैं गलत हूं, लेकिन मैं इसे कैसे देखता हूं: /
इसके बारे में

अधिकांश बार शब्द मानक विचलन (विचरण का वर्गमूल) का उपयोग किया जाता है। वर्गों की गणना आमतौर पर की जाती है, क्योंकि यह बहुत सारी अन्य गणनाओं की सुविधा देता है।
कास्पर

1
@itsols तकनीकी रूप से, आपको हमेशा यह निर्दिष्ट करना चाहिए कि आप डेटा सेट के लिए किस प्रकार का विचलन आँकड़ा निर्धारित कर रहे हैं - अपने आप से विचलन शब्द का अर्थ माध्य से एकल डेटापॉइंट के विचलन को संदर्भित करना चाहिए (जिस तरह से कास्पर उत्तर में इसका उपयोग करता है। )।
अमेलियाबीआर

@itsols, +1 से अमेलिया। वास्तव में, कोई भी डेटासेट आँकड़ा को केवल "विचलन" नहीं कहता है । एक आँकड़ा "औसत निरपेक्ष विचलन" या "मूल चुकता विचलन का मूल" या ऐसा है।
ttnphns

15

आज, सांख्यिकीय मान मुख्य रूप से कंप्यूटर प्रोग्राम (एक्सेल, ...) द्वारा गणना की जाती है, अब हाथ से पकड़े गए कैलकुलेटर द्वारा नहीं। इसलिए, मैं कहता हूं कि "मानक विचलन" की गणना "मानक विचलन" की तुलना में अधिक बोझिल नहीं है। यद्यपि मानक विचलन हो सकता है "... गणितीय गुण जो इसे आंकड़ों में अधिक उपयोगी बनाते हैं", यह वास्तव में, एक मतलब से विचरण की अवधारणा का विरूपण है, क्योंकि यह माध्य से दूर डेटा बिंदुओं को अतिरिक्त भार देता है। इसमें कुछ समय लग सकता है, लेकिन मैं, एक के लिए, आशा है कि सांख्यिकीविद् "मतलब विचलन" का उपयोग करते हुए अधिक बार वापस आते हैं जब डेटा बिंदुओं के बीच वितरण पर चर्चा करते हैं - यह अधिक सटीक रूप से प्रतिनिधित्व करता है कि हम वास्तव में वितरण के बारे में कैसे सोचते हैं।


आप इस बारे में एक असाधारण दावा करते हैं कि कैसे (सांख्यिकीय रूप से योग्य) लोग "वास्तव में सोचते हैं।" उस बारे में आपकी जानकारी का स्रोत क्या है?
whuber

7
स्रोत केवल ऐसे लोग हैं जिनसे मैंने इस विषय पर सवाल किया है, साथ ही साथ स्वयं भी। जब पूछा गया: आप इस डेटा सेट में भिन्नता कैसे दर्शाते हैं? प्रतिक्रिया हमेशा माध्य से रैखिक दूरी के संदर्भ में व्यक्त की गई थी - प्रतिक्रिया में कभी भी वर्ग या वर्गमूल शामिल नहीं थे। दी, मैं एक इंजीनियर हूं, "सांख्यिकीविद्" नहीं, लेकिन मैं किसी और से इस विषय पर खुद को चुनौती देने के लिए कहूंगा। हां, हम मानक विचलन के गणित से प्यार करते हैं - यह मज़ेदार है, लेकिन क्या यह वास्तव में है कि आप कैसे मतलब से विचलन को चित्रित करते हैं?
औराइल

2
यह उद्देश्य पर निर्भर करता है। डेटा की खोज के लिए, मैं फैलाव के मजबूत, रैंक-आधारित अनुमानों का उपयोग करता हूं, जैसे कि मध्यस्थों से मध्य विचलन, जो आत्मा में आपके प्रस्ताव के करीब हैं। लेकिन बहुत से अन्य कार्यों के लिए, विशेष रूप से जब आंकलन (मानसिक रूप से भी) सांख्यिकीय महत्व के लिए क्षमता, उपयुक्त नमूना आकारों का आकलन, जानकारी के मूल्य का पता लगाना, और प्रतिस्पर्धात्मक प्रक्रियाओं के बीच निर्णय लेना, variances (और इसलिए मानक विचलन) के बारे में सोचना है। आवश्यक। मतलब विचलन कोई विकल्प नहीं है, जैसा कि गणित स्पष्ट रूप से दिखाता है।
whuber

1
की जाँच करें इस पत्र
पीट

@ आप वहां कैसे पहुंचे?
विक्रोबोट

9

वे दोनों समान अवधारणा को मापते हैं, लेकिन समान नहीं हैं।

आप 1 तुलना कर रहे हैं√ केसाथ1nΣ|एक्समैं-एक्स¯|। वे दो कारणों से बराबर नहीं हैं:1nΣ(एक्समैं-एक्स¯)2

सबसे पहले वर्ग जड़ ऑपरेटर रैखिक नहीं है, या । इसलिए पूर्ण विचलन की राशि वर्ग विचलन के योग के वर्गमूल के बराबर नहीं है, भले ही निरपेक्ष कार्य को वर्गमूल के बाद वर्ग फ़ंक्शन के रूप में दर्शाया जा सकता है:| xi- i x | =Σ++
के बाद योग गणना की गई है के रूप में वर्गमूल लिया जाता है।Σ|एक्समैं-एक्स¯|=Σ(एक्समैं-एक्स¯)2Σ(एक्समैं-एक्स¯)2

दूसरे , अब मानक विचलन गणना में वर्गमूल के अंतर्गत भी है।n

1 की गणना करने का प्रयास करें1nΣ(एक्समैं-एक्स¯)2

मानक विचलन को प्राथमिकता दी जाती है, इसका कारण यह है कि गणितीय रूप से बाद में काम करना आसान हो जाता है, जब गणना अधिक जटिल हो जाती है।


3
किसी राशि का पूर्ण मान सामान्य रूप में नहीं है , पूर्ण मानों का योग! न तो वर्ग, वर्गमूल, और न ही पूर्ण कार्य रैखिक हैं, यही कारण है कि फ़ंक्शन को लागू करने के बाद योग राशि लेने के बाद फ़ंक्शन को लागू करने से अलग है।
अमीलियाबीआर

@ AmeliaBR आप बिल्कुल सही हैं!
लेट्रोनबर्ग

बाकी तर्क अच्छा था, हालांकि, यही कारण है कि मैंने समस्याग्रस्त बयान को संपादित करने का फैसला किया।
अमीलियाबीआर

8

@itsols, मैं Kasper की महत्वपूर्ण धारणा में जोड़ दूँगा The mean deviation is rarely used। मानक विचलन को आम तौर पर पूर्ण विचलन की तुलना में परिवर्तनशीलता का एक बेहतर उपाय क्यों माना जाता है? क्योंकि अंकगणित माध्य से कम से कम चुकता राशि का स्थान है (और निरपेक्ष नहीं) से विचलन।

मान लीजिए कि आप परोपकारिता की डिग्री का आकलन करना चाहते हैं। तब आप शायद किसी व्यक्ति से यह नहीं पूछेंगे कि वह जीवन की "सामान्य स्थिति" में पैसा देने के लिए कितना तैयार है। इसके बजाए, आप यह पूछना चाहेंगे कि वह कब्जे की स्थिति में ऐसा करने के लिए कितना तैयार है, जहां उसके पास अपने रहने के लिए न्यूनतम संभव संसाधन हैं। यानी उस स्थिति में व्यक्तिगत परोपकारिता की मात्रा क्या है जब वह राशि व्यक्ति की न्यूनतम है?

इसी तरह, इन आंकड़ों की परिवर्तनशीलता की डिग्री क्या है? सहज रूप से, इसके लिए सबसे अच्छा मापने वाला सूचकांक वह है जो इस संदर्भ में सीमा तक कम से कम (या अधिकतम) हो। संदर्भ "अंकगणित माध्य के आसपास" है। फिर सेंट। इस अर्थ में विचलन सबसे अच्छा विकल्प है। यदि संदर्भ "माध्य के आसपास" था, तो इसका मतलब है | विचलन | सबसे अच्छा विकल्प होगा, क्योंकि मंझला इससे पूर्ण विचलन का न्यूनतम योग का स्थान है।


4
एसडी के लिए आपका औचित्य Locus पर आधारित है। आप एसडी को अंकगणितीय माध्य पर विशेष महत्व देते हुए उचित ठहरा रहे हैं - यह सब दिखाता है कि उनका रिश्ता है, ऐसा नहीं है कि एसडी विशेष है। इसी तरह से माध्यिका पर महत्व दिया जा सकता है, जो कि अनुपस्थिति के नुकसान का न्यूनतम योग है । एसडी के अधिक बार उपयोग किए जाने के वास्तविक कारण क्योंकि गणित के साथ काम करना आसान है ... इसके अलावा, यह कम्प्यूटेशनल रूप से आसान है (क्योंकि दोनों मेडियंस को "सॉर्टिंग" की आवश्यकता होती है, और क्योंकि शाखा विवरण की तुलना में वर्ग तेजी से गणना करने के लिए तेज़ हैं)। दार्शनिक रूप से बेतुका विचलन का अधिक मूल्य है।
samthebest

7

जोड़ने लायक एक बात यह है कि आपके 30-वर्षीय पाठ्यपुस्तक का सबसे संभावित कारण मानक विचलन के विपरीत निरपेक्ष माध्य विचलन का उपयोग करता है, यह हाथ से गणना करना आसान है (कोई वर्ग / वर्ग जड़ों नहीं)। अब जब कैलकुलेटर हाई स्कूल के छात्रों के लिए आसानी से उपलब्ध हैं, तो उन्हें मानक विचलन की गणना करने के लिए पूछने का कोई कारण नहीं है।

अभी भी कुछ परिस्थितियां हैं जहां जटिल मॉडल फिटिंग में मानक विचलन के बजाय पूर्ण विचलन का उपयोग किया जाता है। मानक विचलन की तुलना में पूर्ण विचलन चरम बाह्य उपकरणों (माध्य / ट्रेंडलाइन से दूर मान) के प्रति कम संवेदनशील होते हैं क्योंकि वे इसे अन्य डेटा बिंदुओं से मानों में जोड़ने से पहले उस दूरी को वर्ग नहीं बनाते हैं। चूंकि मॉडल फिटिंग के तरीकों का उद्देश्य ट्रेंडलाइन से कुल विचलन को कम करना है (जो भी विधि विचलन गणना के अनुसार है), मानक विचलन का उपयोग करने वाले तरीके एक ट्रेंडलाइन बनाने का अंत कर सकते हैं जो एक आउटलाइन के करीब होने के लिए अधिकांश बिंदुओं से दूर हो जाता है। । पूर्ण विचलन का उपयोग करना इस विकृति को कम करता है, लेकिन ट्रेंडलाइन की गणना को और अधिक जटिल बनाने की कीमत पर।

ऐसा इसलिए है, क्योंकि जैसा कि अन्य ने उल्लेख किया है, मानक विचलन में गणितीय गुण और संबंध हैं जो आम तौर पर आंकड़ों में इसे अधिक उपयोगी बनाते हैं। लेकिन "उपयोगी" को कभी भी परिपूर्ण नहीं होना चाहिए।


1
बस जिज्ञासु, "गणित गुण" क्या हैं जो एसडी को पूर्ण निरपेक्षता से अधिक उपयोगी बनाता है? वैसे शानदार जवाब।
वीपेंग एल

@pongba मानक विचलन कई सांख्यिकीय मॉडल के लिए आंतरिक है जो कई प्रभावों से यादृच्छिक भिन्नता को मानते हैं जो एक दूसरे को रद्द कर सकते हैं (उर्फ, सामान्य रूप से वितरित डेटा)। इसमें बड़ी आबादी से सर्वेक्षण का उपयोग करते समय नमूना सटीकता (त्रुटि का मार्जिन) शामिल है। यदि आपका डेटा इस मॉडल से मिलता है, तो आप औसत से एसडी की संख्या से मूल्य प्राप्त करने की संभावना का अनुमान लगा सकते हैं। आप व्यक्तिगत घटकों के एसडी से कई स्वतंत्र प्रभावों के एसडी की गणना कर सकते हैं। इसे भी देखें: en.m.wikipedia.org/wiki/Standard_deviation
AmeliaBR

7

दोनों आपके डेटा के फैलाव को मापते हैं ताकि डेटा की दूरी उसके माध्य तक पहुंच जाए।

  1. मतलब निरपेक्ष विचलन के आदर्श एल 1 उपयोग कर रहा है (यह भी कहा जाता है मैनहट्टन दूरी या सीधा दूरी )
  2. मानक विचलन के आदर्श एल 2 उपयोग कर रहा है (भी बुलाया इयूक्लिडियन दूरी )

दो मानदंडों के बीच का अंतर यह है कि मानक विचलन अंतर के वर्ग की गणना कर रहा है जबकि औसत निरपेक्ष विचलन केवल पूर्ण अंतर को देख रहा है। इसलिए बड़े आउटलेर्स अन्य विधि के बजाय मानक विचलन का उपयोग करते समय एक उच्च फैलाव बनाएंगे। यूक्लिडियन दूरी वास्तव में अधिक बार उपयोग की जाती है। मुख्य कारण मानक विचलन हैजब डेटा सामान्य रूप से वितरित किया जाता है तो अच्छे गुण होते हैं। तो इस धारणा के तहत, इसका उपयोग करने की सिफारिश की जाती है। हालाँकि लोग अक्सर इस धारणा को डेटा के लिए करते हैं जो वास्तव में सामान्य रूप से वितरित नहीं किया जाता है जो मुद्दों को बनाता है। यदि आपका डेटा सामान्य रूप से वितरित नहीं किया गया है, तो आप अभी भी मानक विचलन का उपयोग कर सकते हैं, लेकिन आपको परिणामों की व्याख्या से सावधान रहना चाहिए।

अंत में आपको पता होना चाहिए कि फैलाव के दोनों उपाय Minkowski दूरी के विशेष मामले हैं , पी = 1 और पी = 2 के लिए। आप अपने डेटा के फैलाव के अन्य उपायों को प्राप्त करने के लिए p को बढ़ा सकते हैं।


इस विषय पर math.stackexchange पर एक पोस्ट भी है: math.stackexchange.com/questions/384003/l1-norm-and-l2-norm
RockScience

6

वे समान उपाय हैं जो समान धारणा को निर्धारित करने का प्रयास करते हैं। आमतौर पर आप सेंट का उपयोग करते हैं। विचलन के बाद से इसमें अच्छे गुण हैं, यदि आप अंतर्निहित वितरण के बारे में कुछ धारणा बनाते हैं।

दूसरी ओर, औसत विचलन का मतलब विचलन गणितीय दृष्टिकोण से कुछ मुद्दों का कारण बनता है क्योंकि आप इसे अलग नहीं कर सकते हैं और आप इसका आसानी से विश्लेषण नहीं कर सकते हैं। कुछ चर्चा यहाँ


1

नहीं आप गलत हैं। मजाक कर रहा हूं। हालाँकि, कई व्यवहार्य कारण हैं कि कोई व्यक्ति औपचारिक एसटीडी के बजाय विचलन की गणना क्यों करना चाहता है, और इस तरह मैं अपने इंजीनियरिंग ब्रेथ्रेन के दृष्टिकोण के साथ समझौता कर रहा हूं। निश्चित रूप से अगर मैं आँकड़ों की गणना कर रहा हूँ तो मौजूदा काम के शरीर की तुलना करना जो गुणात्मक और साथ ही मात्रात्मक निष्कर्ष व्यक्त कर रहा है, मैं स्टिक के साथ छड़ी करता हूं। लेकिन, उदाहरण के लिए, मान लें कि मैं कुछ तेजी से चलाने की कोशिश कर रहा हूंद्विआधारी, मशीन जनित डेटा पर विसंगति-पहचान एल्गोरिदम। मैं अपने अंतिम लक्ष्य के रूप में शैक्षणिक तुलना के बाद नहीं हूं। लेकिन मैं इसके मतलब के बारे में डेटा के एक विशेष प्रवाह के "प्रसार" के बारे में मौलिक निष्कर्ष में दिलचस्पी रखता हूं। मैं भी इस पुनरावृत्तियों की गणना में रुचि रखता हूं, और यथासंभव कुशलता से। डिजिटल इलेक्ट्रॉनिक हार्डवेयर में, हम हर समय गंदे चालें खेलते हैं - हम क्रमशः गुणा और विभाजनों को बाएं और दाएं पारियों में वितरित करते हैं, और "कंप्यूटिंग" पूर्ण मूल्यों के लिए, हम बस साइन बिट ड्रॉप करते हैं (और यदि आवश्यक हो तो एक या दो के पूरक की गणना करें। , दोनों आसान परिवर्तन)। इसलिए, मेरी पसंद यह है कि मैं सबसे अधिक पोर-खींचने वाले तरीके से गणना करूं, और वांछित समय खिड़कियों पर तेजी से विसंगति का पता लगाने के लिए मेरी गणनाओं में रैखिक थ्रेसहोल्ड लागू करूं।


1
मानक विचलन की गणना कुशलतापूर्वक और केवल ऑनलाइन एल्गोरिथ्म के साथ की जा सकती है, बस किसी भी क्षण (मतलब पूर्ण विचलन सहित) हो सकती है। इस प्रकार, तेज या सरल गणना की आवश्यकता इस पर शासन नहीं करेगी (और न ही यह प्रसार के किसी भी क्षण-आधारित अनुमानकर्ता को बाहर करेगी)।
whuber

0

दो उपाय वास्तव में भिन्न हैं। पहले को अक्सर औसत निरपेक्ष विचलन (एमएडी) के रूप में संदर्भित किया जाता है और दूसरा मानक विचलन (एसटीडी) है। गंभीर रूप से सीमित कंप्यूटिंग शक्ति और सीमित कार्यक्रम मेमोरी के साथ एम्बेडेड अनुप्रयोगों में, वर्गमूल गणना से बचना बहुत वांछनीय हो सकता है।

एक त्वरित रफ टेस्ट से ऐसा लगता है कि MAD = f * STD के साथ कहीं न कहीं 0.78 और 0.80 के बीच में गॉसियन के एक सेट के लिए यादृच्छिक नमूने वितरित किए गए हैं।


0

अमर सागू का एक बहुत अच्छा लेख है जिसमें यह बताया गया है: [ http://blog.amarsagoo.info/2007/09/making-sense-of-standard-deviation.html]

सहज ज्ञान युक्त समझ में अपना प्रयास जोड़ने के लिए:

माध्य विचलन यह पूछने का एक सभ्य तरीका है कि माध्य से "काल्पनिक" औसत बिंदु कितनी दूर है, लेकिन यह वास्तव में यह पूछने के लिए काम नहीं करता है कि सभी बिंदु एक दूसरे से कितने दूर हैं, या डेटा "कैसे फैलता है"।

मानक विचलन पूछ रहा है कि सभी बिंदुओं के अलावा कितनी दूर हैं, इसलिए केवल औसत विचलन की तुलना में अधिक उपयोगी जानकारी को सम्मिलित करता है (यही कारण है कि विचलन आमतौर पर केवल मानक विचलन को समझने की दिशा में एक कदम पत्थर के रूप में उपयोग किया जाता है)।

एक अच्छा सादृश्य पाइथागोरस प्रमेय है। पाइथोगोरियन प्रमेय हमें क्षैतिज दूरी और ऊर्ध्वाधर दूरी लेते हुए, दो वर्गों में बिंदुओं के बीच की दूरी, चौकों को जोड़ते हुए, और कुल के वर्गमूल को बताता है।

यदि आप इसे करीब से देखते हैं, तो (जनसंख्या) मानक विचलन का सूत्र मूल रूप से पाइथोगोरियन प्रमेय के समान है, लेकिन दो से अधिक आयामों के साथ (और प्रत्येक बिंदु से दूरी का मतलब प्रत्येक आयाम में दूरी के रूप में)। जैसे कि यह आपके डेटा सेट में सभी बिंदुओं के बीच "दूरी" की सबसे सटीक तस्वीर देता है।

उस सादृश्य को थोड़ा आगे बढ़ाने के लिए, औसत निरपेक्ष विचलन क्षैतिज और ऊर्ध्वाधर दूरी के औसत को लेने जैसा होगा, जो कुल दूरी से कम है, जबकि पूर्ण निरपेक्ष विचलन क्षैतिज और ऊर्ध्वाधर दूरी जोड़ देगा, जो लंबा है वास्तविक दूरी से।


मेरा मानना ​​है कि जब आप कहते हैं कि विचलन का मतलब है तो आपका मतलब बिल्कुल विचलन है जो ओपी के बारे में बात कर रहा था। पारिभाषिक शब्दावली महत्वपूर्ण है क्योंकि औसत विचलन हमेशा 0. होता है, मतलब पूर्ण विचलन और मानक विचलन के बीच अंतर के बारे में दोनों मतलब से सभी बिंदुओं के विचलन को शामिल करते हैं। एक से पूर्ण विचलन का योग शामिल है, जबकि वर्गमूल है अगर वर्ग विचलन का योग है ..
माइकल आर। चेरिक

0

मानक विचलन यादृच्छिक प्रक्रियाओं के कारण फैलाव का प्रतिनिधित्व करता है। विशेष रूप से, कई भौतिक माप जो कि कई स्वतंत्र प्रक्रियाओं के योग के कारण होने की उम्मीद है, सामान्य (घंटी वक्र) वितरण हैं।

Y=1σ2π-(एक्स-μ)22σ2

कहा पे Yएक्सμσ

दूसरे शब्दों में, मानक विचलन एक ऐसा शब्द है जो स्वतंत्र यादृच्छिक चर से एक साथ सम्‍मिलित होता है। इसलिए, मैं यहां दिए गए कुछ उत्तरों से असहमत हूं - मानक विचलन का मतलब केवल विचलन का विकल्प नहीं है, जो "बाद की गणना के लिए अधिक सुविधाजनक होता है"। मानक विचलन सामान्य रूप से वितरित घटना के लिए मॉडल फैलाव का सही तरीका है।

यदि आप समीकरण को देखते हैं, तो आप मानक विचलन को इस अर्थ से अधिक भारी विचलन को देख सकते हैं। Intuitively, आप को मापने के रूप में औसत विचलन के बारे में सोच सकते वास्तविक , माध्य से औसत विचलन जबकि एक घंटी के लिए मानक विचलन खातों आकार उर्फ "सामान्य" मतलब के आसपास वितरण। इसलिए यदि आपका डेटा सामान्य रूप से वितरित किया जाता है, तो मानक विचलन आपको बताता है कि यदि आप अधिक मूल्यों का नमूना लेते हैं, तो उनमें से ~ 68% माध्य के आसपास एक मानक विचलन के भीतर पाए जाएंगे।

दूसरी ओर, यदि आपके पास एक एकल यादृच्छिक चर है, तो वितरण आयत की तरह लग सकता है, जिसमें एक सीमा के भीतर कहीं भी दिखने वाले मूल्यों की समान संभावना होती है। इस मामले में, औसत विचलन अधिक उपयुक्त हो सकता है।

TL, DR यदि आपके पास ऐसे डेटा हैं जो कई अंतर्निहित यादृच्छिक प्रक्रियाओं के कारण हैं या जिन्हें आप बस सामान्य रूप से वितरित करना जानते हैं, तो मानक विचलन फ़ंक्शन का उपयोग करें।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.