मानक विचलन और विचरण के बारे में आम लोगों को सिखाने का बहुत अभ्यास है।
टी एल; डॉ; यह औसत से दूरी की तरह कुछ है। (जो इस तरह के संक्षिप्त संस्करण में थोड़ा भ्रमित और भ्रामक है। इसलिए पूरा लेख पढ़ें)
मुझे लगता है कि आम आदमी औसत के बारे में जानता है। मैं एसडी को जानने और त्रुटियों का आकलन करने के महत्व की बात करता हूं (नीचे पीएस देखें)। तब मैं वादा करता हूं कि कोई भी उच्च गणित या पवित्र सांख्यिकी ज्ञान का उपयोग नहीं किया जाएगा - सिर्फ एक तर्क और शुद्ध तर्क।
समस्या। आओ हम कहते हैं कि हमारे पास थर्मामीटर है (मैं माप उपकरण का चयन करता हूं जो श्रवण के करीब है)।
हमने एक ही तापमान का एन माप किया और थर्मामीटर ने हमें 36.5, 35.9, 37.0, 36.6, ... (चित्र देखें) जैसा कुछ दिखाया। हम जानते हैं कि वास्तविक तापमान समान था, लेकिन थर्मामीटर हमारे पास प्रत्येक माप से थोड़ा सा झूठ है।
हम कैसे अनुमान लगा सकते हैं कि यह छोटा मैल हमारे लिए कितना झूठ है?
हम औसत की गणना कर सकते हैं (नीचे दी गई तस्वीर पर लाल रेखा देखें)। क्या हम इस पर विश्वास कर सकते हैं? औसत होने के बाद भी, क्या हमारी जरूरतों के लिए पर्याप्त सटीकता है?
सबसे आसान तरीका । हम सबसे दूर के बिंदु को ले सकते हैं, इसके और औसत (लाल रेखा) के बीच की दूरी की गणना कर सकते हैं और कह सकते हैं, कि यह थर्मामीटर हमारे लिए कैसा है, क्योंकि यह अधिकतम त्रुटि है जिसे हम देखते हैं। एक अनुमान लगा सकता है, यह सबसे अच्छा अनुमान नहीं है। यदि हम चित्र को देखें, तो अधिकांश बिंदु औसत के आसपास हैं, हम केवल एक बिंदु से कैसे तय कर सकते हैं? वास्तव में नंबरिंग कारणों का अभ्यास कर सकते हैं कि इस तरह के अनुमान मोटे तौर पर और आमतौर पर खराब क्यों हैं।
विचरण करनेवाला । तब ... सभी दूरी लेने और औसत दूरी की गणना करने देता है !
(xi−x¯)x¯xi
तब कोई सोच सकता था कि औसत दूरी का सूत्र सब कुछ समेट कर N से विभाजित हो जाएगा:
∑(xi−x¯)N
लेकिन एक समस्या है। हम आसानी से देख सकते हैं, जैसे। 36.6 से 36.4 और 36.8 समान दूरी पर हैं। लेकिन अगर हम मूल्यों को ऊपर के सूत्र में रखते हैं, तो हमें -0.2 और +0.2 मिलते हैं, और उनका योग 0 के बराबर होता है, जो कि वह नहीं चाहता है।
संकेत से कैसे छुटकारा पाएं? (इस बिंदु पर आम तौर पर आम लोग "निरपेक्ष मान लेते हैं" कहते हैं, और सुझाव प्राप्त करते हैं कि "निरपेक्ष मूल्य लेना थोड़ा कृत्रिम है, दूसरा तरीका क्या है?")। हम मूल्यों को पार कर सकते हैं! फिर सूत्र बन जाता है:
∑(xi−x¯)2N
इस सूत्र को आँकड़ों में "वेरिएंस" कहा जाता है। और यह हमारे थर्मामीटर (या जो भी) मूल्यों के प्रसार का अनुमान लगाने के लिए बहुत बेहतर है, सिर्फ अधिकतम दूरी लेने से।
मानक विचलन । लेकिन फिर भी एक और समस्या है। विचरण सूत्र को देखें। वर्ग हमारी माप इकाइयाँ बनाते हैं ... चुकता। यदि थर्मामीटर ° C (या ° F) में तापमान को मापता है तो हमारा त्रुटि अनुमान (या ) में मापा जाता है । वर्गों को बेअसर कैसे करें? - वर्गमूल का उपयोग करें!°C2°F2
∑(xi−x¯)2N−−−−−−−−−−√
तो यहाँ हम मानक विचलन सूत्र पर आते हैं, जिसे आमतौर पर रूप में दर्शाया जाता है । और यह हमारे डिवाइस परिशुद्धता का अनुमान लगाने का बेहतर तरीका है।σ
इस बिंदु पर एक आम आदमी बहुत स्पष्ट समझता है कि हम यहां कैसे पहुंचे और मानक विचलन / विचरण कैसे काम करते हैं। इस बिंदु से मैं आमतौर पर 68-95-7.7 नियम पर जाता हूं, जिसमें नमूनाकरण और जनसंख्या के बारे में भी वर्णन किया गया है, मानक त्रुटि बनाम मानक विचलन शर्तें आदि।
एसडी बात उदाहरण जानने के पुनश्च महत्व:
कहते हैं कि आपके पास कुछ माप उपकरण है, जिसकी लागत 1 000 000 $ है । और यह आपको उत्तर देता है: 42. क्या आपको लगता है कि किसी ने 42 के लिए 1 000 000 डॉलर का भुगतान किया है ? Phooey! एक ने उस उत्तर की शुद्धता के लिए 1000 000 का भुगतान किया। क्योंकि मूल्य - इसकी त्रुटि को जाने बिना कुछ भी खर्च नहीं करता है। आप त्रुटि के लिए भुगतान करते हैं, मूल्य के लिए नहीं। यहाँ एक अच्छा जीवन उदाहरण है।
आम जीवन में, अधिकांश समय हम एक शासक का उपयोग दूरी को मापने के लिए करते हैं। शासक आपको एक मिलीमीटर के आसपास परिशुद्धता देता है (यदि आप यूएस में नहीं हैं)। क्या होगा यदि आपको मिलीमीटर से आगे जाना है और 0.1 मिमी परिशुद्धता के साथ कुछ मापना है? - आप शायद एक कैलीपर का उपयोग करेंगे। अब, यह जांचना आसान है, कि एक सस्ता शासक (लेकिन अभी भी मिलीमीटर परिशुद्धता के साथ) सेंट की लागत है, जबकि अच्छे कैलिपर की लागत दसवें डॉलर है। परिशुद्धता के 1 परिमाण के लिए एक मूल्य के 2 परिमाण। और यह बहुत सामान्य है कि आप एक त्रुटि के लिए कितना भुगतान करते हैं।