2.04 मानक त्रुटियों का मतलब? जब अंतर अंतराल व्यापक रूप से ओवरलैप होता है, तो महत्वपूर्ण रूप से अलग-अलग साधन?


10

नीचे का चित्र इस लेख से मनोवैज्ञानिक विज्ञान में है । एक सहयोगी ने इसके बारे में दो असामान्य बातें बताईं:

  1. कैप्शन के अनुसार, त्रुटि बार "the 2.04 मानक त्रुटि, 95% विश्वास अंतराल दिखाते हैं।" मैंने केवल SE 1.96 SE को 95% CI के लिए उपयोग किया है, और मैंने 2.04 SE के किसी भी उद्देश्य के लिए उपयोग किए जाने के बारे में कुछ भी नहीं पाया है। क्या 2.04 SE का कुछ स्वीकृत अर्थ है ?
  2. पाठ में कहा गया है कि नियोजित समतुल्य तुलनाओं ने त्रुटि बनाम सही पूर्वानुमेय परीक्षणों (टी (30) = 2.51, पी <.01) और त्रुटि बनाम सही अप्रत्याशित परीक्षणों (टी (30)) 2.61, पी में त्रुटि के लिए महत्वपूर्ण अंतर पाया। <.01) (omnibus F परीक्षण भी p <.05 पर महत्वपूर्ण था)। हालाँकि, ग्राफ़ सभी तीन स्थितियों के लिए त्रुटि सलाखों को पर्याप्त रूप से अतिव्यापी दिखाता है। यदि can 2.04 SE अंतराल ओवरलैप होता है, तो p <.05 पर मान कैसे भिन्न हो सकते हैं? ओवरलैप काफी बड़ा है जिसे मैं मान रहा हूं कि inter 1.96 SE अंतराल भी ओवरलैप करता है।

बार ग्राफ 2.04 एसई त्रुटि बार दिखा रहा है


1
शानदार जवाब। मैं इस बात पर जोर देना चाहूंगा कि (जैसा कि पहले से ही बताया गया है) 95% विश्वास अंतराल की तुलना करना महत्वपूर्ण स्तर 0.05 पर सांख्यिकीय परीक्षण करने के समान नहीं है। इससे निपटने के लिए पाठ्यक्रम के कागजात हैं। यदि विश्वास अंतराल केवल उपलब्ध आंकड़े हैं तो Payton et al , Gaussian डेटा के लिए महत्व स्तर 0.05 के लिए 85% अंतराल का उपयोग करने का सुझाव देते हैं। वे यहां अपना काम करते हैं
मार्टिन बरगलुंड

1
धन्यवाद, @ मर्तिन लूप बंद करने के लिए: हालांकि मैंने पेटन एट अल पेपर को नहीं देखा है , 85% के लिए आधार स्पष्ट है: 84% के अनुरूप जेड-मूल्य, जब चुकता , बराबर ; इनमें से दो जोड़ना देता है ; इसका वर्गमूल , जो कि 95% अंतराल के अनुरूप z- मान से बहुत अधिक है। मुझे लगता है कि पायटन ने 84% से 85% तक गोल किया। दूसरे शब्दों में, उनकी सिफारिश (हालांकि यह व्युत्पन्न थी) मुझे उसी विश्लेषण द्वारा समझाया जा सकता है जो मैंने प्रदान किया था। 242
whuber

@MartinBerglund और व्हुबर आपके उत्तर भर में आया जब सोच रहा था कि 0.05 स्तर पर सांख्यिकीय परीक्षण करने के लिए 83.4% विश्वास अंतराल की मेरी स्वतंत्र गणना मूल थी - जाहिर नहीं! पेपर संदर्भ के लिए धन्यवाद, बहुत उपयोगी।
ट्रिस्टन

जवाबों:


11
  1. 2.04 स्वतंत्रता के 31 डिग्री के साथ एक छात्र टी वितरण के साथ उपयोग करने के लिए गुणक है। कोटेशन का सुझाव है कि डिग्री की स्वतंत्रता उपयुक्त है, जिस स्थिति में सही गुणक ।302.0422722.04

  2. माध्य की तुलना मानक त्रुटियों के संदर्भ में की जाती है । मानक त्रुटि आमतौर पर मानक विचलन है, जहां (संभवतः लगभग यहाँ) नमूना आकार है। यदि कैप्शन इन बार को "मानक त्रुटियां" कहने में सही है, तो मानक विचलन कम से कम होना चाहिए, जैसा कि दिखाए गए लगभग के मूल्यों से गुना अधिक है । का एक डाटासेट के मानक विचलन के साथ सकारात्मक मूल्यों और के बीच एक मतलब और के पास सबसे मान करना होगा1/nn30+1=31315.56316×5.5=3314180और छोटे बड़े मूल्यों की संख्या, जो काफी कम लगती है। (यदि ऐसा होता है, तो छात्र टी आँकड़ों पर आधारित संपूर्ण विश्लेषण वैसे भी अमान्य होगा।) हमें यह निष्कर्ष निकालना चाहिए कि यह आंकड़ा मानक विचलन दिखाता है, न कि मानक त्रुटियां

  3. साधनों की तुलना विश्वास अंतराल के ओवरलैप (या उसके अभाव) पर आधारित नहीं है। दो 95% सीआई ओवरलैप कर सकते हैं, फिर भी अभी भी अत्यधिक महत्वपूर्ण अंतर का संकेत दे सकते हैं। कारण यह है कि अंतर के मानक त्रुटि ( स्वतंत्र ) का मतलब है, कम से कम लगभग, मतलब की मानक त्रुटियों के वर्गों के योग का वर्गमूल। उदाहरण के लिए, यदि इनकी औसत की मानक त्रुटि के बराबर होती है और इनकी औसत की मानक त्रुटि के बराबर होती है , तो सीआई पहले मतलब (की एक बहु का उपयोग कर ) से विस्तार होगा करने के लिए और सीआई दूसरा तक विस्तारित होगा1411712.0411.9216.0814.92करने के लिए , पर्याप्त ओवरलैप के साथ। फिर भी अंतर का एसई बराबर होगा । साधन का अंतर, , इस मूल्य से गुना से अधिक है : यह महत्वपूर्ण है।19.0312+121.411714=32.04

  4. ये जोड़ीदार तुलना हैं। व्यक्तिगत मूल्य बहुत अधिक परिवर्तनशीलता प्रदर्शित कर सकते हैं जबकि उनके अंतर अत्यधिक सुसंगत हो सकते हैं। उदाहरण के लिए, , , , , आदि जैसे जोड़ों का एक सेट , प्रत्येक घटक में भिन्नता प्रदर्शित करता है, लेकिन अंतर लगातार । यद्यपि यह अंतर या तो घटक की तुलना में छोटा है, लेकिन इसकी स्थिरता यह दर्शाता है कि यह सांख्यिकीय रूप से महत्वपूर्ण है।(14,14.01)(15,15.01)(16,16.01)(17,17.01) 0.01


बहुत धन्यवाद। यह लेख कहीं भी नहीं बताता है कि पोस्ट-हॉक परीक्षणों को दो प्रकार के परीक्षणों पर प्रत्येक प्रतिभागी की प्रतिक्रियाओं के बीच तुलना की गई थी, और इसलिए मैं इस निष्कर्ष पर कूद गया कि वे इसे विषयों के बीच तुलना के रूप में मान रहे थे (हालांकि यह होगा कि कम उपयुक्त और कम शक्तिशाली)। मुझे लगता है कि आपको सही होना चाहिए, और वे अधिक संवेदनशील (और ग्राफ के लिए और अधिक कठिन) परीक्षण कर रहे थे। बिंदु # 3 के रूप में, मेरी एकमात्र प्रतिक्रिया यह है कि मुझे स्पष्ट रूप से कुछ आंकड़ों को फिर से
परिभाषित

मैं आपके प्रश्न में एक वाक्यांश पर बात कर रहा था, "जोड़ीदार तुलना की योजना बनाई।" हालांकि, आपके द्वारा उद्धृत किए गए बाकी परिणाम, सुझाव देते हैं कि वे जोड़ीदार तुलना नहीं थे, लेकिन अधिक संभावना मेरे जवाब के बिंदु # 3 में इसी तरह की गणना से आई थी।
whuber

मेरे कहने का मतलब यह था कि वे सभी तीन स्थितियों की तुलना में एक सर्वग्राही परीक्षण करने के बजाय सीधे एक-दूसरे से तीन स्थितियों की तुलना करते हुए पोस्ट-हॉक परीक्षण कर रहे थे। भ्रम के बारे में क्षमा करें। लेकिन अब जब मैं इसे देखता हूं, तो मुझे लगता है कि आप वैसे भी सही थे। जिस तरह से वे ऑम्निबस टेस्ट स्टेटिस्टिक ( F(2,60)=5.64, p<.05) की रिपोर्ट करते हैं , उसका तात्पर्य है कि यह बार-बार किया जाने वाला टेस्ट था, और इसलिए पोस्ट हॉक टेस्ट की संभावना भी थी।
ऑक्टर्न

आपके शानदार जवाब के लिए धन्यवाद। "इसका कारण यह है कि अंतर के मानक त्रुटि (स्वतंत्र) का मतलब है, कम से कम लगभग, मतलब की मानक त्रुटियों के वर्गों के योग का वर्गमूल।" मैं उन संदर्भों की तलाश कर रहा हूं, जो इस पर चर्चा करते हैं, लेकिन कोई भी नहीं मिला। मैं इस संबंध में कुछ मार्गदर्शन की सराहना करूंगा। शायद कोई मेरी मदद कर सकता है?
जोहान्स

@ जोहान्स एसई का वर्ग नमूना माध्य के प्रसरण के लिए आनुपातिक है। (आनुपातिकता की निरंतरता किसी की परिभाषा पर निर्भर करती है और नमूना आकार के साथ थोड़ी भिन्न हो सकती है।) स्वतंत्रता का अर्थ है कि भिन्नता के नमूने वितरण के विचरण का अर्थ एसई के वर्गों का योग है।
व्हिबर

3

यहां भ्रम का एक हिस्सा डेटा का भ्रामक प्रतिनिधित्व है। ऐसा प्रतीत होता है कि बार-बार किए गए उपायों का डिज़ाइन है, फिर भी त्रुटि बार विश्वास अंतराल हैं कि सही अर्थ मूल्य कितनी अच्छी तरह अनुमानित किया गया था। कच्चे मतलब मूल्य की गुणवत्ता का अनुमान लगाने के लिए पर्याप्त डेटा एकत्र करने से बचने के लिए दोहराया उपायों का एक प्राथमिक उद्देश्य है। इसलिए त्रुटि पट्टियाँ जैसे कि वास्तव में प्रस्तुत की जाने वाली कहानी का कोई संबंध नहीं है। महत्वपूर्ण ब्याज का मूल्य प्रभाव है। रेखांकन के उद्देश्य से कहानी के मुख्य बिंदु को उजागर करने के लिए, प्रभावों को रेखांकन, और उनके आत्मविश्वास के अंतराल, अधिक उपयुक्त होंगे।


धन्यवाद! मैं यह व्यक्त करने के लिए थोड़ा संघर्ष कर रहा था कि ग्राफ़ ऐसा क्यों लगता है कि यह विश्लेषण का प्रतिनिधित्व नहीं करता है।
अष्टकवर्ग
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.