मैं मानक विचलन का मूल्यांकन कैसे करूं?


15

मैंने कुछ कार्यों को करने की क्षमता पर 85 लोगों से प्रतिक्रियाएं एकत्र की हैं।

प्रतिक्रियाएं पांच बिंदु पर हैं पैमाने:

5 = बहुत अच्छा, 4 = अच्छा, 3 = औसत, 2 = गरीब, 1 = बहुत गरीब,

औसत स्कोर 2.8 है और मानक विचलन 0.54 है।

मैं समझता हूं कि माध्य और मानक विचलन क्या है।

मेरा सवाल है: यह मानक विचलन कितना अच्छा (या बुरा) है?

दूसरे शब्दों में, क्या कोई दिशानिर्देश हैं जो मानक विचलन के मूल्यांकन में सहायता कर सकते हैं।


यहाँ एसडी अच्छा या बुरा होने का क्या मतलब होगा?
गूँग - मोनिका

7
यह इस तरह से डेटा के साथ इस तरह के एक छोटे से एसडी प्राप्त करने के लिए नहीं बल्कि मुश्किल है: 2.8 की एक मतलब के लिए, एसडी हो गया है कम से कम । (भले ही 2.8 एक गोल मूल्य का प्रतिनिधित्व करता है, एसडी को अभी भी 0.357 से अधिक होना चाहिए।) 0.54 का एक एसडी का अर्थ है कि दो से अधिक लोग 5 के साथ उत्तर नहीं दे सकते थे (21 2 के और 62 3 के साथ) और छह से अधिक का जवाब नहीं दिया जा सकता था। एक 1 (5 2 और 74 3 के साथ) के साथ। इससे पता चलता है कि प्रश्न असाधारण रूप से बहुत कम जानकारी प्रदान कर सकता है क्योंकि यह पैमाने प्रभावी रूप से भेदभाव नहीं करता है। 0.2×0.8=0.4
whuber

@ शुभ डाटा फोरेंसिक! लेकिन मैं यह भी सोच सकता था कि या तो वह अलग-अलग सवालों पर औसत था या उसने अपनी गणना में कुछ गलत किया था। यह कल्पना करना कठिन लगता है कि लोगों ने वास्तव में इतनी समान रूप से प्रतिक्रिया दी, खासकर जब उनकी अनुमानित क्षमताओं के बारे में बात कर रहे थे।
एरिक

जवाबों:


17

मानक विचलन "अच्छा" या "बुरा" नहीं हैं। वे इस बात के संकेतक हैं कि आपका डेटा कितना फैला हुआ है। कभी-कभी, रेटिंग पैमानों में, हम विस्तृत प्रसार चाहते हैं क्योंकि यह इंगित करता है कि हमारे प्रश्न / रेटिंग उस समूह की श्रेणी को कवर करते हैं जो हम रेटिंग हैं। दूसरी बार, हम एक छोटी एसडी चाहते हैं क्योंकि हम चाहते हैं कि हर कोई "उच्च" हो।

3+2

इसलिए। आपके परीक्षण का उद्देश्य क्या है? सैंपल में कौन-कौन हैं?


2
(+1) केवल टिप्पणी में थोड़ा सा जोड़ने के लिए "मानक विचलन 'अच्छे' या 'बुरे' नहीं हैं" - बड़े मानक विचलन के साथ एक भविष्यवक्ता होने के नाते "अच्छा" हो सकता है क्योंकि, प्रतिगमन में, यह मानक से विपरीत रूप से संबंधित है एक प्रतिगमन गुणांक अनुमान की त्रुटि। दूसरी ओर, यदि आप माप की सटीकता से चिंतित हैं, तो एक बड़ा मानक विचलन "खराब" है। मैं अनुमान लगा रहा हूं कि मूल पोस्टर की रुचि पूर्व के करीब है लेकिन यह स्पष्ट नहीं है।
मैक्रो

10

लघु उत्तर, यह ठीक है और सर्वेक्षण डेटा से उम्मीद से थोड़ा कम हो सकता है। लेकिन शायद आपकी व्यावसायिक कहानी मीन या टॉप -2 बॉक्स प्रतिशत में अधिक है।

सामाजिक विज्ञान अनुसंधान से असतत तराजू के लिए, व्यवहार में मानक विचलन मतलब का एक सीधा कार्य है। विशेष रूप से, मैंने ऐसे कई अध्ययनों के अनुभवजन्य विश्लेषण के माध्यम से पाया है कि 5-बिंदु तराजू पर सर्वेक्षणों में वास्तविक मानक विचलन अधिकतम संभव भिन्नता का 40% -60% है (यहाँ अलिखित नहीं है)।

सबसे सरल स्तर पर, चरम सीमाओं पर विचार करें, कल्पना करें कि इसका मतलब 5.0 था। मानक विचलन शून्य होना चाहिए, क्योंकि औसत 5 का एकमात्र तरीका सभी को जवाब देने के लिए है। इसके विपरीत, यदि मतलब 1.0 था, तो मानक त्रुटि 0 भी होनी चाहिए। तो मानक विचलन को ठीक-ठीक परिभाषित किया गया है जो माध्य दिया गया है।

अब इसके बीच में और अधिक ग्रे क्षेत्र है। कल्पना कीजिए कि लोग 5.0 या 1.0 का जवाब दे सकते हैं, लेकिन बीच में कुछ भी नहीं। तब मानक विचलन मतलब का एक सटीक कार्य है:

stdev = sqrt ((5-माध्य) * (माध्य -1))

किसी भी बंधे हुए पैमाने पर उत्तर के लिए अधिकतम मानक विचलन आधी स्केल चौड़ाई है। यहां यह sqrt ((5-3) (3-1)) = sqrt (2 * 2) = 2 है।

अब बेशक लोग बीच में मूल्यों का जवाब दे सकते हैं। हमारी फर्म में सर्वेक्षण डेटा की मेटास्टूडियों से, मुझे लगता है कि व्यवहार में संख्यात्मक तराजू के लिए मानक विचलन अधिकतम का 40% -60% है। विशेष रूप से

  • 100% बिंदु तराजू के लिए 40%,
  • 10-बिंदु तराजू के लिए 50% और
  • 5-बिंदु तराजू के लिए 60% और
  • बाइनरी स्केल के लिए 100%

इसलिए आपके डेटासेट के लिए, मुझे 60% x 2.0 = 1.2 के मानक विचलन की उम्मीद होगी। आपको 0.54 मिला, जो कि लगभग आधा है जो मुझे उम्मीद थी कि यदि परिणाम स्व-अन्वेषण रेटिंग हैं। क्या कौशल परीक्षण परीक्षणों की अधिक जटिल बैटरी के परिणाम हैं जो औसत हैं और इस प्रकार कम विचरण होगा?

वास्तविक कहानी, हालांकि, शायद यह क्षमता इतनी कम है या अन्य कार्यों के सापेक्ष इतनी अधिक है। कौशल के बीच साधनों या शीर्ष-2-प्रतिशत प्रतिशत की रिपोर्ट करें और उस पर अपना विश्लेषण केंद्रित करें।


-1

यदि डेटा सामान्य रूप से वितरित किया जाता है, तो आप देख सकते हैं कि जनसंख्या कैसे स्थित है।

  • सभी लोगों का 68% माध्य के 1 मानक विचलन के भीतर है ( 2.26 - 3.34):

यहाँ छवि विवरण दर्ज करें

  • सभी लोग 95% माध्य के 2 मानक विचलन के भीतर रहते हैं ( 1.72 - 3.88):

यहाँ छवि विवरण दर्ज करें

यह बताता है कि आपके नंबर कितने "फैले हुए हैं"।


1
यह उत्तर गलत नहीं है क्योंकि यह गलत है: यह अंगूठे के अनुमानित नियम का उपयोग करता है (जैसे कि यह सटीक था) उस मामले में जहां यह अनुचित है। यह जवाब सही होगा यदि चेबेशेव की असमानता के निष्कर्षों को प्रतिस्थापित किया जाए (जो बताता है कि कम से कम 75% अवलोकन मतलब अवलोकन के दो एसडी के भीतर हैं; अर्थात, कम से कम 75% प्रतिक्रियाएं 2 या 3 के हैं), लेकिन यह ज्यादा जानकारी नहीं देंगे।
whuber

इसके अलावा, यह वास्तव में सामान्य रूप से वितरित आबादी के लिए ही सही है। वहां से, आप सामान्य पीडीएफ़ पर अभिन्न का मूल्यांकन करके मनमाने ढंग से संख्याओं की गणना कर सकते हैं, मतलब के आसपास एसडी द्वारा दी गई सीमाओं के साथ। वास्तव में यहाँ उपयोगी नहीं है।
दोहा
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.