मानक त्रुटि का उपयोग किसके लिए किया जाता है?


9

मैं अपने डेटा को दिखाने के लिए मानक त्रुटियों के साथ-साथ मैंने पाया एक ट्यूटोरियल का उपयोग कर रहा हूं और औसत मूल्यों को प्लॉट कर रहा हूं। लेकिन मुझे परिणामों पर चर्चा करने में समस्या हो रही है। मेरा प्लॉट नीचे दिखाया गया है: कुछ मानक त्रुटियां (एक त्रुटि बार के रूप में दिखाई गई हैं) बहुत भिन्न होती हैं और उनमें से कुछ शून्य के बहुत करीब होती हैं।

यहाँ छवि विवरण दर्ज करें


2
यहां एक पक्ष-मुद्दा यह है कि सलाखों का उपयोग करना भ्रमित साबित करने की संभावना है। त्रिविम रूप से, नीचे की ओर की पट्टियाँ ऊपर की सलाखों की तुलना में थोड़ी कठिन होती हैं। अधिक मौलिक रूप से, 1e-3 पर शुरू होने वाली बार मनमानी है। अधिक सकारात्मक रूप से, बिंदु प्रतीकों द्वारा बिंदु अनुमान दिखाना और बार प्लस त्रुटि सलाखों को दिखाने की तुलना में त्रुटि सलाखों को जोड़ना बहुत सरल होगा। अधिक के लिए Google "डायनामाइट प्लॉट"।
निक कॉक्स

मुझे यकीन नहीं है कि सवाल क्या है। आपके द्वारा सही उत्तर दिए जाने और शीर्षक के आधार पर यह पता चल सकता है कि मानक त्रुटि क्या है। लेकिन आपके पास यहां क्या है, इसके आधार पर आपको डेटा का वर्णन करने में मदद की आवश्यकता है। क्या आप प्रश्न में स्पष्ट कर सकते हैं? इसके अलावा, यदि आप डेटा का वर्णन करने में सहायता चाहते हैं, तो कृपया केवल आंकड़ा नहीं, बल्कि डेटा के बारे में अधिक जानकारी दें। प्रत्येक समूह में N का क्या है और मूल्यों का क्या अर्थ है सहायक होगा। किया गया कोई भी परिवर्तन सहायक होगा।
जॉन

जवाबों:


10

सामान्य रूप से त्रुटि पट्टियाँ प्लॉट रीडर को यह समझाने के लिए होती हैं कि प्लॉट पर उसके द्वारा देखे गए अंतर सांख्यिकीय रूप से महत्वपूर्ण हैं। एक सन्निकटन में, आप एक छोटे से गौसियन की कल्पना कर सकते हैं जिसे श्रेणी में इस त्रुटि बार के रूप में दिखाया गया है - दो ऐसे गौसियों के उत्पाद का "दृश्य एकीकरण" कम-से-कम एक मौका है कि दो मान वास्तव में समान हैं।±1σ

इस विशेष मामले में, कोई यह देख सकता है कि लाल और बैंगनी बार के साथ-साथ ग्रे और हरे रंग के बीच का अंतर भी बहुत महत्वपूर्ण नहीं है।


इस मामले में मानक त्रुटि के बारे में क्या? प्लॉट किए गए त्रुटि सलाखों के रूप में।
बर्काय

यदि यह उद्देश्य है तो यह एक खराब त्रुटि बार है। सलाखों का गैर-ओवरलैप सांख्यिकीय महत्व के लिए पर्याप्त नहीं है और गैर-ओवरलैप की मात्रा वास्तव में 0.05 पर काफी भिन्न होने के लिए एन के साथ भिन्न होती है। और क्या बिल्ली "बहुत महत्वपूर्ण" नहीं है? उन दोनों सीमांत स्थितियों को आप इंगित करते हैं जो एक टी-टेस्ट में विफल हो जाती हैं।
जॉन

@ जॉन ने जैसा कि लिखा था, भूखंड की जांच करते समय तदर्थ आकलन करने में मदद करने के लिए त्रुटि पट्टी एक दृश्य सुराग है; वास्तविक परीक्षण के लिए कुछ परिकल्पना का परीक्षण करने की आवश्यकता है, इस प्रकार स्पष्ट रूप से पाठ में होना चाहिए।

11

सामान्य तौर पर, मानक त्रुटि आपको बताती है कि आप कितने अनिश्चित हैं बार के शीर्ष का सही मूल्य वह है जहां बार कहता है कि यह है। जब कई बार होते हैं, तो यह बार के बीच तुलना को एक सांख्यिकीय परीक्षण के अर्थ में भी सक्षम कर सकता है। हालांकि, उन्हें इस तरह से व्याख्या करने के लिए कुछ मान्यताओं की आवश्यकता होती है, जो कि रेखांकन नीचे दिखाए गए हैं। यदि आप वास्तव में सलाखों की तुलना करने में रुचि रखते हैं, तो देखें कि क्या अंतर सांख्यिकीय रूप से महत्वपूर्ण हैं, तो आपको डेटा पर परीक्षण चलाना चाहिए और प्रदर्शित करना चाहिए कि कौन से परीक्षण महत्वपूर्ण थे, जैसे।

महत्व तुलना

इसके अलावा, मैं मानक त्रुटियों के बजाय आत्मविश्वास अंतराल का उपयोग करने का सुझाव दूंगा।

यह पेपर पढ़ने लायक है:

कमिंग और फिंच। "नेत्र द्वारा अनुमान: आत्मविश्वास अंतराल और डेटा की तस्वीरें कैसे पढ़ें।" एम साइक वॉल्यूम। 60, नंबर 2, 170180।

उनका समग्र निष्कर्ष यह है: "उन बारों की तलाश करें जो ब्याज के प्रभावों से सीधे संबंधित हों, प्रयोगात्मक डिजाइन के प्रति संवेदनशील हों और अंतराल की व्याख्या करें।"

स्वतंत्र नमूनों के लिए, आत्मविश्वास अंतराल का उपयोग करते हुए, सीआई के आधे ओवरलैप का मतलब है कि अंतर सांख्यिकीय रूप से महत्वपूर्ण है।

अनिश्चित बार

इसके बजाय मानक त्रुटि सलाखों का उपयोग करके स्वतंत्र नमूनों के लिए, निम्नलिखित ग्राफ आपको दिखाता है कि सांख्यिकीय महत्व का पता कैसे लगाया जाए:

इंडीप बार, एसई


यह वास्तव में एक उत्तर (अभी तक) नहीं है। क्या आप इस प्रशस्ति पत्र डब्ल्यू / कुछ जानकारी को बढ़ाने के बारे में मन करेंगे कि यह ओपी के सवाल का जवाब देने में कैसे मदद करता है? (btw, मैं नीच नहीं हूँ)
गंग - मोनिका

1
@ गुंग रियल लाइफ में हस्तक्षेप करते थे इसलिए मैंने एक आंशिक उत्तर पोस्ट किया। अपडेट किया गया।
अरी बी। फ्रीडमैन

6

जैसा कि mbq कहता है, त्रुटि बार आपके पाठकों को यह महसूस करने का एक तरीका है कि क्या दो समूहों के बीच अंतर महत्वपूर्ण हैं - यानी यदि आपके प्रत्येक समूह के भीतर भिन्नता यह मानने के लिए पर्याप्त है कि अंतर आपको मतलब के लिए मिला है। अपने समूहों के बीच

बाकी सभी बराबर हैं, बड़ी त्रुटि सलाखों का मतलब समूह के अंतर में अधिक है, लेकिन ऐसा लगता है कि आपके प्लॉट की y- धुरी लॉग-रूपांतरित है, इसलिए निचले समूह समान पैमाने पर उच्चतर नहीं हैं।

आपको जागरूक होना चाहिए, आपके कई पाठक यह नहीं समझ पाएंगे कि कौन सी त्रुटि सलाखों का प्रतिनिधित्व करती है, भले ही आप इसे स्पष्ट रूप से समझाएं! अक्सर आप समान प्रभाव को प्राप्त करने के लिए घबराने वाले डॉट-प्लॉट या बॉक्सप्लेट (या दोनों एक साथ) के साथ एक ही लक्ष्य प्राप्त कर सकते हैं ।


आपके द्वारा बताए गए लेख के बारे में, यह एक दिलचस्प अवलोकन है, हालांकि यह मेरे लिए आश्चर्य की बात नहीं है। मैं सांख्यिकीय अवधारणाओं और सामान्य प्रथाओं के एक महत्वपूर्ण हिस्से को भ्रमित और दृढ़ मानता हूं (भले ही मेरे पास गणित में एक मजबूत पृष्ठभूमि है, और गणितीय आंकड़ों में कई पाठ्यक्रम ले चुके हैं)। मुझे व्यक्तिगत रूप से लगता है कि लंबी और जटिल मौखिक व्याख्याओं के बजाय, यदि वे नेत्रहीन और उदाहरणों का उपयोग करते हुए पढ़ाए जाते हैं, तो बहुत सी अवधारणाएं समझना आसान हो जाएगा।
posdef

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.