बिना समूह अंतर के परिकल्पना का परीक्षण कैसे करें?


39

कल्पना कीजिए कि आपके पास एक संख्यात्मक आश्रित चर (जैसे, बुद्धि परीक्षण स्कोर) को देखते हुए दो समूहों (जैसे, पुरुषों और महिलाओं) के साथ एक अध्ययन है और आपके पास यह परिकल्पना है कि कोई समूह अंतर नहीं हैं।

सवाल:

  • यह जांचने का एक अच्छा तरीका है कि क्या कोई समूह अंतर नहीं हैं?
  • आप समूह के अंतर के लिए पर्याप्त रूप से परीक्षण के लिए आवश्यक नमूना आकार का निर्धारण कैसे करेंगे?

प्रारंभिक विचार:

  • यह एक मानक टी-परीक्षण करने के लिए पर्याप्त नहीं होगा क्योंकि अशक्त परिकल्पना को अस्वीकार करने का मतलब यह नहीं है कि ब्याज का पैरामीटर बराबर या शून्य के करीब है; यह विशेष रूप से छोटे नमूनों के मामले में है।
  • मैं 95% आत्मविश्वास अंतराल को देख सकता हूं और जांच सकता हूं कि सभी मान पर्याप्त रूप से छोटी सीमा के भीतर हैं; शायद प्लस या माइनस 0.3 मानक विचलन।

क्या मतलब है "यह शून्य परिकल्पना को सच मान लेता है"?
रॉबिन जिरार्ड

यदि आप गलत तरीके से घोषित करने की संभावना को नियंत्रित करने में सक्षम होना चाहते हैं "तो एक अंतर है" आपको दो परिकल्पना को अलग करने की आवश्यकता है (क्या मैंने पहले ही उल्लेख किया है मुझे यह उद्धरण बहुत पसंद है: आंकड़े . stackexchange.com/questions/726/… ;));
रॉबिन जिरार्ड

@ एक शून्य परिकल्पना महत्व परीक्षण के पी मान के रूप में देखा गया है कि अशक्त परिकल्पना सच है की तुलना में अधिक या चरम डेटा के रूप में देखने की संभावना है; लेकिन शायद मैं बयान को बेहतर तरीके से कह सकता हूं।
जेरोमे एंग्लीम

@ रॉबिन मैंने अपनी बात को स्पष्ट करने की कोशिश के लिए सवाल को संशोधित किया
जेरोमी एंग्लीम

जवाबों:


20

मुझे लगता है कि आप तुल्यता के लिए परीक्षण के बारे में पूछ रहे हैं । अनिवार्य रूप से आपको यह तय करने की आवश्यकता है कि आपके लिए अभी भी यह निष्कर्ष निकालना कितना बड़ा है कि दोनों समूह प्रभावी रूप से समकक्ष हैं। यह निर्णय 95% (या अन्य) आत्मविश्वास अंतराल की सीमा को परिभाषित करता है, और इस आधार पर नमूना आकार की गणना की जाती है।

विषय पर एक पूरी किताब है

तुल्यता परीक्षणों का एक बहुत ही सामान्य नैदानिक ​​"समकक्ष" एक गैर-हीनता परीक्षण / परीक्षण है । इस मामले में आप दूसरे (एक स्थापित उपचार) पर एक समूह को "पसंद" करते हैं और अपने परीक्षण को यह दिखाने के लिए डिज़ाइन करते हैं कि नया उपचार सांख्यिकीय सबूत के कुछ स्तर पर स्थापित उपचार से नीच नहीं है।

मुझे लगता है मैं क्रेडिट करने के लिए जरूरत हार्वे Motulsky के लिए GraphPad.com साइट (के तहत "पुस्तकालय" )।


16

कुछ प्रकार की तुल्यता परीक्षण की पहले से ही वर्णित संभावना के अलावा , उनमें से अधिकांश, मेरे ज्ञान के सर्वश्रेष्ठ के लिए, ज्यादातर पुरानी पुरानी अक्सरवादी परंपरा में रुट किए जाते हैं, ऐसे परीक्षण आयोजित करने की संभावना है जो वास्तव में साक्ष्य का एक परिमाण प्रदान करते हैं। एक शून्य-सम्मोहन का पक्ष, अर्थात् बायेसियन परीक्षण

एक बायेसियन टी-टेस्ट का कार्यान्वयन यहां पाया जा सकता है: वेटज़ेल्स, आर।, रायजमेकर्स, जेजीडब्ल्यू, जैकब, ई।, और वेगेनमेकर्स, ई.जे. (2009)। अशक्त परिकल्पना के लिए और उसके खिलाफ समर्थन को कैसे निर्धारित किया जाए: एक डिफ़ॉल्ट WinBUGS के एक डिफ़ॉल्ट बायेसियन टी-टेस्ट का कार्यान्वयन। साइकोनोमिक बुलेटिन एंड रिव्यू, 16, 752-760।

R में यह सब करने के लिए एक ट्यूटोरियल भी है:

http://www.ruudwetzels.com/index.php?src=SDtest


क्रूसके द्वारा इस पेपर में बायेसियन टी-टेस्ट का एक वैकल्पिक (शायद अधिक आधुनिक दृष्टिकोण) प्रदान किया गया है (कोड के साथ):

क्रुस्के, जेके (2013)। बायेसियन का अनुमान टी परीक्षण को बढ़ा देता हैप्रायोगिक मनोविज्ञान जर्नल: जनरल , 142 (2), 573-603। डोई: 10.1037 / a0029146


इस उत्तर के लिए सभी प्रॉप्स (क्रुशके के पहले) मेरे सहयोगी डेविड कैलन के पास जाना चाहिए। मैंने इस सवाल से उसका जवाब चुरा लिया ।


मैं सोच रहा था कि क्या कोई बायेसियन दृष्टिकोण प्रदान करेगा। अति उत्कृष्ट। धन्यवाद।
जेरोमे एंग्लीम

1
आर। के लिए भयानक BayesFactor पैकेज के संदर्भ को शामिल करने के लिए इस उत्तर को अपडेट करने लायक हो सकता है
cr22

13

थायलाकोलो के उत्तर के बाद, मैंने थोड़ा शोध किया।

तुल्यता आर में पैकेज है tost()समारोह।

अधिक जानकारी के लिए रॉबिन्सन और फ्रॉज़ (2004) " तुल्यता परीक्षणों का उपयोग करके मॉडल सत्यापन " देखें ।


equivalenceपैकेज के लिए लिंक और पॉइंटर के लिए धन्यवाद ।
chl

8

कुछ कागजात हैं जो मुझे पता है कि आपके लिए उपयोगी हो सकते हैं:

ट्रिवन, डब्ल्यूडब्ल्यू (2001)। अनुमानात्मक अंतरालों का उपयोग करते हुए सांख्यिकीय अंतर, तुल्यता और अनिश्चितता का मूल्यांकन करना: अशक्त परिकल्पना सांख्यिकीय परीक्षणों के संचालन की एक एकीकृत वैकल्पिक विधि। मनोवैज्ञानिक तरीके, 6, 371-386। ( मुफ़्त पीडीएफ )

और एक सुधार:
ट्राइटन, डब्ल्यूडब्ल्यू, और लुईस, सी (2008)। सांख्यिकीय समानता स्थापित करने की एक संवादात्मक विश्वास अंतराल विधि जो ट्राइटन (2001) कटौती कारक को ठीक करती है। मनोवैज्ञानिक तरीके, 13, 272-278। ( मुफ़्त पीडीएफ )

इसके अलावा:

सीमैन, एमए और सेर्लिन, आरसी (1998)। साधनों के दो-समूह तुलनाओं के लिएquivalence विश्वास अंतराल । मनोवैज्ञानिक तरीके, वॉल्यूम 3 (4), 403-411।


इस विषय पर बहुत सारे कागजात और किताबें भी हैं।
माइकल चेरिक

7

मैंने हाल ही में दो वितरणों के बीच उनके साधनों के बीच की दूरी के आधार पर "तुल्यता परीक्षण" के वैकल्पिक तरीके के बारे में सोचा है।

दो गौसियन वितरण के ओवरलैप के लिए आत्मविश्वास अंतराल प्रदान करने के कुछ तरीके हैं :यहाँ छवि विवरण दर्ज करें

ओवरलैप का (बीच में?) दो वितरण और की एक अच्छी संभाव्य व्याख्या है: जहां और बीच की कुल भिन्नता दूरी हैO(P1,P2)P1P2

1O(P1,P2)=TV(P1,P2)
TV(P1,P2)=supA|P1(A)P2(A)|P1P2

इसका मतलब है कि, उदाहरण के लिए, यदि तो किसी भी घटना के और द्वारा दी गई से अधिक नहीं होती हैं । मोटे तौर पर, दो वितरण तक समान भविष्यवाणियां करते हैं ।O(P1,P2)>0.9P1P20.110%

इस प्रकार, शास्त्रीय समतुल्यता परीक्षण के साधन के रूप में और बीच के अंतर के लिए एक महत्वपूर्ण मान के आधार पर स्वीकृति मानदंड का उपयोग करने के बजाय , हम इसे दिए गए पूर्वानुमानों की संभावनाओं के बीच अंतर के लिए एक महत्वपूर्ण मूल्य पर आधार बना सकते हैं। दो वितरण।μ1μ2

मुझे लगता है कि कसौटी के "उद्देश्य" के संदर्भ में एक फायदा है। का महत्वपूर्ण मानवास्तविक समस्या के विशेषज्ञ द्वारा दिया जाना चाहिए: यह एक ऐसा मूल्य होना चाहिए जिसके आगे अंतर का व्यावहारिक महत्व हो। लेकिन कभी-कभी किसी को वास्तविक समस्या के बारे में ठोस ज्ञान नहीं होता है और कोई भी विशेषज्ञ महत्वपूर्ण मूल्य प्रदान करने में सक्षम नहीं होता है। बारे में एक पारंपरिक महत्वपूर्ण मूल्य को अपनाना मानदंड का एक तरीका हो सकता है, जो कि विचाराधीन शारीरिक समस्या पर निर्भर न हो।|μ1μ2|TV(P1,P2)

एक ही संस्करण के साथ गॉसियन मामले में, ओवरलैप एक-से-एक मानकीकृत माध्य अंतर ।|μ1μ2|σ


क्या आपके पास कुछ वास्तविक समस्याओं में उपयोग किए जा रहे ओवरलैप दिखाने वाले संसाधन हैं ? यह अविश्वसनीय रूप से आशाजनक लगता है, लेकिन यह मेरे लिए स्पष्ट नहीं है कि कोई इसे वास्तविक समस्या में कैसे लागू करेगा (जहां आपके निष्कर्ष संभावित रूप से "यह वितरण एक्स के समान सुंदर है" से हटा दिया जाता है, जिससे यह देखना थोड़ा मुश्किल हो जाता है कि कैसे 10% टीवी इनफ़ेक्शन पर प्रभाव के आकार में अनुवाद करता है)।
स्टम्पी जो पीट

1
@StumpyJoePete ने अपने ब्लॉग पर उसी भावना से कुछ लिखा है: stla.github.io/stlapblog/posts/…
स्टीफन लॉरेंट

5

चिकित्सा विज्ञान में, दो एकतरफा परीक्षणों (टोस्ट) के विपरीत आत्मविश्वास अंतराल दृष्टिकोण का उपयोग करना बेहतर होता है। मैं बिंदु अनुमानों, CI और ग्राफी-निर्धारण समतुल्य मार्जिन को बहुत स्पष्ट करने के लिए रेखांकन करने की सलाह देता हूं।

इस तरह के दृष्टिकोण से आपके प्रश्न का समाधान होगा।

गैर-हीनता / तुल्यता अध्ययन के लिए CONSORT दिशानिर्देश इस संबंध में काफी उपयोगी हैं।

देखें पियाजियो जी, Elbourne डॉ, ऑल्टमैन महानिदेशक पोकॉक एसजे, इवांस एसजे, और पत्नी समूह। अहिंसा और तुल्यता यादृच्छिक परीक्षण की रिपोर्टिंग: CONSORT विवरण का विस्तार। जामा। 2006, 8 मार्च; 295 (10): 1152-60। (पूर्ण पाठ से लिंक करें)


1
मैं जरूरी नहीं कहूंगा कि आत्मविश्वास अंतराल को प्राथमिकता दी जाती है। वास्तव में विश्वास अंतराल परिकल्पना परीक्षणों के अनुरूप है। TOST प्रक्रिया में उपयोग किए जाने वाले दो एक तरफा टी परीक्षणों के अनुरूप दो एक तरफा विश्वास अंतरालों को प्रतिच्छेद करके प्राप्त आत्मविश्वास अंतराल को देखकर प्राप्त किया जा सकता है।
माइकल चेरिक

4

हाँ। यह तुल्यता परीक्षण है। मूल रूप से आप अशक्त और वैकल्पिक परिकल्पना को उल्टा करते हैं और यह दिखाने के लिए शक्ति पर नमूना आकार को आधार बनाते हैं कि साधनों का अंतर तुल्यता की खिड़की के भीतर है। ब्लैकवेल्डर ने इसे "शून्य परिकल्पना साबित करना" कहा। यह आमतौर पर फार्मास्युटिकल क्लिनिकल ट्रायल में किया जाता है, जहां बाजार में आने वाली दवा के लिए एक जेनेरिक दवा की तुल्यता का परीक्षण किया जाता है या एक अनुमोदित दवा की तुलना नए फॉर्मूलेशन (अक्सर बायोइस्पेवलेंस) से की जाती है। एक तरफा संस्करण को गैर-हीनता कहा जाता है। कुछ समय में एक दवा को केवल यह दिखा कर अनुमोदित किया जा सकता है कि नई दवा बाज़ारिया प्रतियोगी से नीच नहीं है। शाओ और पीजोट ने क्रॉसओवर डिज़ाइनों का उपयोग करके जैव-विविधता के लिए एक सुसंगत बूटस्ट्रैप दृष्टिकोण विकसित किया है।


0

2 नमूना समूहों के बीच बूटस्ट्रैप अंतर (उदाहरण के बीच का अंतर) और सांख्यिकीय महत्व के लिए जाँच करें। इस दृष्टिकोण का अधिक विस्तृत विवरण, एक अलग संदर्भ में, यहां पाया जा सकता है http://www.automated-trading-system.com/a-different-application-of-the-bootstrap/


1
आप बिना किसी अंतर के अशक्त परिकल्पना को स्वीकार करने और दो मात्राओं के बराबर होने का प्रमाण पा रहे हैं
एलेक्सिस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.