यदि अंतर अंतर लगभग 0 है तो एक टी-टेस्ट सांख्यिकीय रूप से महत्वपूर्ण कैसे हो सकता है?


10

मैं यह बताने के लिए 2 आबादी के डेटा की तुलना करने की कोशिश कर रहा हूं कि क्या उपचार के बीच का अंतर सांख्यिकीय रूप से महत्वपूर्ण है। डेटा सेट को आम तौर पर दो सेटों के बीच बहुत कम अंतर के साथ वितरित किया जाता है। औसत अंतर 0.00017 है। मैंने एक युग्मित टी-परीक्षण किया, यह उम्मीद करते हुए कि मैं साधनों के बीच कोई अंतर नहीं होने की अशक्त परिकल्पना को अस्वीकार करने में विफल रहूँगा, हालाँकि, मेरी गणना की गई टी-वैल्यू मेरे क्रिटिकल टी-मूल्य से बहुत अधिक है।


आप किस बारे में सुझाव चाहते हैं? आपके एन क्या हैं?
गूँग - मोनिका

नमस्ते, मैं वास्तव में सुनिश्चित नहीं हूं कि कैसे आगे बढ़ना है, अगर मैंने यह देखने के लिए कुछ गलत करना शुरू कर दिया कि कैसे डेटा बिल्कुल अलग नहीं लगता है। दोनों समूहों में 335 अवलोकन हैं
Kscicc26

5
साधनों में अंतर की मानक त्रुटि भी मानक विचलन और नमूना आकारों का एक कार्य है। किसी भी आश्चर्य को पंजीकृत करने से पहले इन सभी टुकड़ों को आपके प्रश्न में होना चाहिए।
Glen_b -Reinstate मोनिका

7
हर अंतर "लगभग 0" है! यदि परिणाम चर लोगों द्वारा प्राप्त वजन है और इसे पाउंड में मापा जाता है, तो 0.00017 वास्तव में छोटा है, लेकिन अगर इसे लाखों पाउंड में मापा जाता है तो 0.00017 भारी है। इस सवाल का कोई अर्थ नहीं है जब तक कि एक संदर्भ - प्रतिक्रिया में क्या मापा जा रहा है - और माप की एक इकाई प्रदान की जाती है।
whuber

1
सांख्यिकीय महत्व का अर्थ व्यापक महत्व के अंग्रेजी अर्थ में "महत्व" नहीं है।
david25272

जवाबों:


9

मुझे विश्वास है कि आप पर विश्वास करने का कोई कारण नहीं है क्योंकि परीक्षण महत्वपूर्ण था, भले ही माध्य अंतर बहुत छोटा हो। एक युग्मित टी-टेस्ट में, महत्व तीन चीजों से प्रेरित होगा:

  1. माध्य अंतर की भयावहता
  2. आपके पास जितना डेटा है
  3. मतभेदों के मानक विचलन

माना जाता है कि आपका मतलब अंतर बहुत छोटा है। दूसरी ओर, आपके पास उचित मात्रा में डेटा (N = 335) है। अंतिम कारक मतभेदों का मानक विचलन है। मुझे नहीं पता कि वह क्या है, लेकिन जब से आपको एक महत्वपूर्ण परिणाम मिला है, यह मान लेना सुरक्षित है कि आपके पास डेटा की मात्रा के साथ छोटे माध्य अंतर को दूर करने के लिए यह काफी छोटा है। अंतर्ज्ञान के निर्माण के लिए, कल्पना करें कि आपके अध्ययन में हर अवलोकन के लिए युग्मित अंतर 0.00017 था, फिर मतभेदों का मानक विचलन 0. होगा। निश्चित रूप से, यह निष्कर्ष निकालना उचित होगा कि उपचार में कमी आई (यद्यपि) एक छोटी सी)।

जैसा कि नीचे टिप्पणी में @whuber नोट करता है, यह इंगित करने योग्य है कि जबकि 0.00017 एक बहुत छोटी संख्या योग्यता संख्या की तरह लगता है, यह जरूरी नहीं कि सार्थक शब्दों में छोटा हो। यह जानने के लिए, हमें कई चीजों को जानना होगा, सबसे पहले कि इकाइयाँ क्या हैं। यदि इकाइयाँ बहुत बड़ी हैं (उदाहरण के लिए, वर्ष, किलोमीटर, आदि), तो जो प्रतीत होता है वह छोटे रूप से बड़ी हो सकती है, जबकि यदि इकाइयां छोटी हैं (उदाहरण के लिए, सेकंड, सेंटीमीटर, आदि), तो यह अंतर और भी छोटा लगता है। दूसरा, यहां तक ​​कि एक छोटा सा बदलाव भी महत्वपूर्ण हो सकता है: किसी तरह के उपचार (जैसे, वैक्सीन) की कल्पना करें जो बहुत सस्ता था, पूरे आबादी के लिए आसान और कोई दुष्प्रभाव नहीं था। यह अच्छी तरह से करने लायक हो सकता है भले ही इसने बहुत कम लोगों की जान बचाई हो।


जवाब देने के लिए धन्यवाद! मैं आँकड़ों से भी वाकिफ नहीं हूँ, इसलिए जब मैं जवाब पाने की उम्मीद कर रहा था तो मुझे जवाब नहीं मिला, तो मुझे रोक लिया गया। साधन के बीच अंतर की मानक त्रुटि है: 7.36764E-05। मुझे यकीन नहीं है कि उस की प्रासंगिकता क्या है, लेकिन मुझे यकीन है कि आप हाहा करते हैं। फिर आपकी मदद के लिए धन्यवाद
Kscicc26

आपका स्वागत है, @ Kscicc26 मतभेदों की मानक त्रुटि , और मतभेदों के मानक विचलन एक ही बात नहीं हैं। (दुख की बात है कि उन्हें लगता है जैसे वे होना चाहिए।) एसडी आपको बताता है कि आपके अंतर कितने भिन्न हैं, जबकि एसई आपको बताता है कि यदि आपने अपने अध्ययन को बार-बार और फिर से चलाया तो मतलबी अंतर का अनुमान कितना भिन्न होगा। यहाँ आपको एसई के मेरे विवरण को पढ़ने में मदद मिल सकती है
गंग -

मैं उस की जाँच करूंगा और सुबह इस थ्रेड पर वापस आ जाऊंगा!
Kscicc26

2
यह अंतर अंतर न तो छोटा है और न ही बड़ा है: आपके पास इसके आकार का आकलन करने का कोई आधार नहीं है।
whuber

@whuber, यह एक अच्छी बात है - मुझे नहीं पता कि ये संख्याएँ किसका उल्लेख करती हैं। लेकिन ओपी संभवतः ऐसा करता है और सोचता है कि यह बहुत छोटा है। मैं उस जानकारी के साथ जा रहा हूं।
गूँज - मोनिका

9

यह जानने के लिए कि क्या अंतर वास्तव में बड़ा है या छोटा है, पैमाने के कुछ माप की आवश्यकता है, मानक विचलन पैमाने का एक माप है और उस पैमाने के लिए खाते में टी-टेस्ट फॉर्मूला का हिस्सा है।

गौर कीजिए कि क्या आप 5 साल के बच्चों की ऊंचाई की तुलना 20 साल के बच्चों (इंसानों, समान भौगोलिक क्षेत्र आदि) की ऊंचाइयों से कर रहे हैं। अंतर्ज्ञान हमें बताता है कि वहाँ एक व्यावहारिक अंतर है और यदि ऊंचाइयों को इंच या सेंटीमीटर में मापा जाता है तो अंतर सार्थक दिखाई देगा। लेकिन अगर आप हाइट को किलोमीटर में बदल दें तो क्या होगा? या प्रकाश वर्ष? फिर अंतर एक बहुत छोटी संख्या (लेकिन अभी भी अलग है), लेकिन (गोल-गोल त्रुटि को रोकते हुए) टी-टेस्ट समान परिणाम देगा कि क्या ऊंचाई इंच, सेंटीमीटर या किलोमीटर में मापा जाता है।

तो माप के पैमाने के आधार पर 0.00017 का अंतर बहुत बड़ा हो सकता है।


4

tunlikely to emerge at least as large in another, similar pair of samples selected randomly from the same populations if the null hypothesis of no difference is literally true of those populationst17100,000

pop1=rep(15:20* .00001, 56);pop2=rep(0,336) #Some fake samples of sample size = 336
t.test(pop1,pop2,paired=T)                #Paired t-test with the following output...

t(335)=187.55,p<2.2×1016

.00001t

हो सकता है कि आप अशक्त परिकल्पना महत्व परीक्षण के इस शाब्दिक अर्थ की तुलना में व्यावहारिक महत्व में अधिक रुचि रखते हों। सांख्यिकीय महत्व की तुलना में व्यावहारिक महत्व आपके डेटा के अर्थ पर बहुत अधिक निर्भर करेगा; यह विशुद्ध रूप से सांख्यिकीय मामला नहीं है। मैंने यहाँ एक लोकप्रिय प्रश्न के उत्तर में इस सिद्धांत का एक उपयोगी उदाहरण उद्धृत किया है, जो पी-मानों के लुभावने विचारों को समाहित करता है :

r=.03

यह "जीवन और मृत्यु का मामला" दिल के दौरे पर एस्पिरिन के प्रभाव का आकार था, मूल रूप से - संख्यात्मक रूप से छोटा का एक शक्तिशाली उदाहरण, व्यावहारिक रूप से महत्वपूर्ण अर्थ के साथ बहुत कम सुसंगत अंतर। ठोस जवाब के साथ कई अन्य प्रश्न, जिनसे आपको लाभ मिल सकता है, यहाँ दिए गए लिंक सहित:

संदर्भ

रोसेंथल, आर।, रोसावेन, आरएल, और रुबिन, डीबी (2000)। व्यवहार अनुसंधान में विरोधाभास और प्रभाव आकार: एक सहसंबंधी दृष्टिकोण । कैम्ब्रिज यूनिवर्सिटी प्रेस।


0

यहां आर में एक उदाहरण है जो कार्रवाई में सैद्धांतिक अवधारणाओं को दर्शाता है। एक सिक्के के फ्लिप करने के 10,000 परीक्षणों में 10,000 बार एक सिक्के के फ्लिप करने के 10,000 परीक्षणों की तुलना में .0001 के प्रमुखों की संभावना होती है।

t.test (rbinom (10000, 10000, .0001), rbinom (10000, 10000, .00011)

t = -8.0299, df = 19886.35, p-value = 1.03e-15 वैकल्पिक परिकल्पना: इसका सही अर्थ में अंतर 0 95 प्रतिशत विश्वास अंतराल के बराबर नहीं है: -0.14493747 -0.08806252 नमूना अनुमान: x का मतलब y 0.9898 1.1063

मानव धारणा के संदर्भ में माध्य का अंतर अपेक्षाकृत 0 से बंद है, हालांकि यह 0 से बहुत सांख्यिकीय रूप से भिन्न है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.