गैर-सामान्य डेटा के लिए समानता परीक्षण?


9

मेरे पास कुछ डेटा हैं जिन्हें मैं जरूरी नहीं मान सकता कि सामान्य वितरण से खींचा जा सकता है, और मैं समूहों के बीच समानता के परीक्षण करना चाहता हूं। सामान्य डेटा के लिए, TOST (दो एक तरफा टी-परीक्षण) जैसी तकनीकें हैं। क्या गैर-सामान्य डेटा के लिए TOST के अनुरूप कुछ है?


1
मैं TOST से परिचित नहीं हूं, लेकिन क्या आप मान-व्हिटनी की तलाश कर रहे हैं? यह एक गैरपारंपरिक परीक्षण है (इस अर्थ में कि वितरण पर कोई धारणा नहीं बनाई गई है) जो इस बात का प्रमाण दे सकता है कि दो समूह अलग-अलग वितरण से आते हैं।
निक सब्बे

1
मैं एक परीक्षण की तलाश कर रहा हूं जहां अशक्त परिकल्पना है कि एक अंतर है, और वैकल्पिक परिकल्पना यह है कि (लगभग) कोई अंतर नहीं है।
रयान सी। थॉम्पसन

छोटे नमूनों के लिए, आप आँकड़ो में जवाब देख सकते हैं ।stackexchange.com/questions/49782/… । बड़े नमूनों के लिए, टी परीक्षणों के साथ क्लासिक दृष्टिकोण केंद्रीय सीमा प्रमेय के लिए धन्यवाद है।
माइकल एम

3
वाक्यांश "दो एक-पक्षीय परीक्षण" में कुछ भी नहीं - और न ही अंतर्निहित तर्क सामान्य-सिद्धांत का अर्थ है। गैर-सामान्य वितरण के साथ इसे स्थान-शिफ्ट विकल्प के लिए अनुकूलित करना पूरी तरह से संभव होना चाहिए। लेकिन सावधान रहें - गैर-सामान्य डेटा के साथ कई मामलों में जो आप वास्तव में चाहते हैं वह एक स्केल-शिफ्ट तरह का समतुल्यता परीक्षण है, और अन्य प्रकार के डेटा के साथ, इसके बजाय कुछ और। यह जानना कि वास्तव में क्या आवश्यक है, यह इस बात पर निर्भर करता है कि आप क्या माप रहे हैं और आप क्या समस्या हल कर रहे हैं। अपने खूंटी को गोल छेद में निचोड़ने की कोशिश करने के बजाय, यह खूंटी की जांच करने के लिए भुगतान करता है।
Glen_b -Reinstate मोनिका

जवाबों:


8

TOD का तर्क वाल्ड-टाइप टी और जेड टेस्ट आँकड़ों के लिए नियोजित है (यानीθ/रोंθ तथा θ/σθ(क्रमशः) साइन, साइन रैंक और रैंक योग परीक्षणों जैसे गैर-सममित परीक्षणों के लिए z सन्निकटन के लिए लागू किया जा सकता है । सादगी के लिए मेरा मानना ​​है कि समतुल्यता एक शब्द के साथ सममित रूप से व्यक्त की जाती है, लेकिन असममित तुल्यता शब्दों के लिए मेरे उत्तर का विस्तार सीधा है।

ऐसा करते समय एक मुद्दा यह उठता है कि यदि कोई व्यक्ति समतुल्यता शब्द को व्यक्त करने का आदी है (कहो) Δ) के रूप में एक ही इकाइयों में θ, तब समतुल्यता शब्द को विशेष चिह्न, हस्ताक्षरित रैंक, या रैंक योग सांख्यिकी की इकाइयों में व्यक्त किया जाना चाहिए, जो कि संक्षिप्त है, और एन पर निर्भर है ।

हालांकि, कोई व्यक्ति केवल टेस्ट स्टेटिस्टिक की इकाइयों में TOST समतुल्यता शर्तों को भी व्यक्त कर सकता है। विचार करें कि TOST में, यदिz=θ/σθ, फिर z1=(Δ-θ)/σθ, तथा z2=(θ+Δ)/σθ। अगर हम देंε=Δ/σθ, फिर z1=εz, तथा z2=z+ε। (यहां दिए गए आंकड़े सही पूंछ में मूल्यांकन किए गए हैं :पी1=पी(जेड>z1) तथा पी2=पी(जेड>z2)।) Z वितरण की इकाइयों का उपयोग करना गैर-पैरामीट्रिक परीक्षणों के लिए तुल्यता / प्रासंगिकता सीमा को परिभाषित करने के लिए बेहतर हो सकता है, क्योंकि विकल्प हस्ताक्षरित-रैंक या रैंक रकम की इकाइयों में दहलीज को परिभाषित करता है, जो शोधकर्ताओं के लिए संभवतः अर्थहीन और कठिन हो सकता है व्याख्या।

अगर हम यह समझते हैं कि (सममित समतुल्य अंतराल के लिए) किसी भी TOST अशक्त परिकल्पना को अस्वीकार करना संभव नहीं है εz1-α, तब हम तदनुसार उचित शब्द के उचित आकार पर निर्णय लेने के लिए आगे बढ़ सकते हैं। उदाहरण के लिएε=z1-α+0.5

इस दृष्टिकोण को स्टैटा के लिए पैकेज टोस्ट में निरंतरता सुधार आदि के विकल्प के साथ लागू किया गया है (जिसमें अब शापिरो-विल्क और शापिरो-फ्रांसिया परीक्षण के लिए विशिष्ट TOST कार्यान्वयन शामिल हैं), जिसे आप स्टैटा में टाइप करके एक्सेस कर सकते हैं।

संपादित करें: TOST का तर्क ध्वनि क्यों है, और समतुल्यता परीक्षण संरचनाओं को सर्वग्राही परीक्षणों पर लागू किया गया है, मुझे समझा गया है कि मेरा समाधान शापिरो-विल्क और शापिरो-फ्रांसिया परीक्षणों के लिए अनुमानित आंकड़ों की गहरी गलतफहमी पर आधारित था।


3

यह प्रति से अधिक नहीं है, लेकिन कोमोलगोरोव-स्मिरनोव परीक्षण एक नमूना वितरण के बीच अंतर के महत्व के लिए परीक्षण करने की अनुमति देता है और एक दूसरा संदर्भ वितरण जिसे आप निर्दिष्ट कर सकते हैं। आप इस परीक्षण का उपयोग एक विशिष्ट प्रकार के विभिन्न वितरणों को नियंत्रित करने के लिए कर सकते हैं, लेकिन सामान्य रूप से भिन्न वितरणों में नहीं (कम से कम, सभी संभावित विकल्पों के परीक्षणों में त्रुटि मुद्रास्फीति के लिए नियंत्रण के बिना नहीं ... यदि यह किसी तरह संभव है तो)। किसी भी एक परीक्षण के लिए वैकल्पिक परिकल्पना हमेशा की तरह कम विशिष्ट "कैच-ऑल" परिकल्पना रहेगी।

यदि आप दो समूहों के बीच वितरण संबंधी मतभेदों की एक परीक्षा के लिए समझौता कर सकते हैं जहां अशक्त परिकल्पना यह है कि दो समूहों को समान रूप से वितरित किया जाता है, तो आप एक समूह के वितरण को दूसरे समूह के वितरण की तुलना करने के लिए कोमोलगोरोव-स्मिरनोव परीक्षण का उपयोग कर सकते हैं। शायद यह पारंपरिक दृष्टिकोण है: यदि वे सांख्यिकीय रूप से महत्वपूर्ण नहीं हैं, तो मतभेदों को अनदेखा करें, और इस निर्णय को एक परीक्षण सांख्यिकीय के साथ उचित ठहराएं।

किसी भी मामले में, आप अशक्त परिकल्पना को अस्वीकार करने के लिए "ऑल-एंड-नथिंग" दृष्टिकोण से उत्पन्न होने वाले कुछ गहरे मुद्दों पर विचार करना चाह सकते हैं। इस तरह का एक मुद्दा क्रॉस वैलिडेट पर यहां बहुत लोकप्रिय है: " क्या सामान्यता परीक्षण 'अनिवार्य रूप से बेकार है? " लोग सामान्यता-परीक्षण के सवालों का जवाब देना पसंद करते हैं: "आप यह परीक्षण क्यों करना चाहते हैं?" मेरा अभिप्राय यह है कि आम तौर पर परीक्षण के कारण को अमान्य कर दिया जाता है, जो अंततः सही दिशा में ले जा सकता है। इस प्रश्न के उपयोगी उत्तर देने के लिए जो मैंने यहाँ जोड़ा है वह इस प्रकार है:

  1. यदि आप पैरामीट्रिक परीक्षण मान्यताओं के उल्लंघन के बारे में चिंतित हैं, तो आपको केवल एक गैर-पैरामीटर परीक्षण ढूंढना चाहिए जो इसके बजाय वितरण संबंधी धारणाएं नहीं बनाता है। परीक्षण करें कि क्या आपको नॉनपैमेट्रिक परीक्षण का उपयोग करने की आवश्यकता है; बस इसका उपयोग करें!
  2. आपको प्रश्न को प्रतिस्थापित करना चाहिए, "क्या मेरा वितरण काफी गैर-सामान्य है?" के साथ, "मेरा वितरण कितना गैर-सामान्य है, और यह मेरी रुचि के विश्लेषण को कैसे प्रभावित करता है?" उदाहरण के लिए, केंद्रीय प्रवृत्ति (विशेष रूप से शामिल साधनों) के बारे में परीक्षण कर्टोसिस की तुलना में तिरछा करने के लिए अधिक संवेदनशील हो सकते हैं, और (सह) विचरण के परीक्षणों के लिए इसके विपरीत। बहरहाल, अधिकांश विश्लेषणात्मक उद्देश्यों के लिए मजबूत विकल्प हैं जो किसी भी तरह की गैर-सामान्यता के प्रति बहुत संवेदनशील नहीं हैं।

यदि आप अभी भी समतुल्यता की परीक्षा करना चाहते हैं, तो यहाँ पर एक और चर्चित चर्चा है, जिसमें समालोचना परीक्षण शामिल है।


1
समतुल्यता परीक्षण अच्छी तरह से स्थापित है, और आप इसकी अशक्त परिकल्पनाओं को गलत समझते हैं, जो आमतौर पर एच के रूप में हैं0-:|θ-θ0|Δ। यह एक अंतराल परिकल्पना है जो अनुवाद कर सकता है, उदाहरण के लिए, दो एकतरफा परीक्षणों (TOST) में: एच01-:θ-θ0Δ, या एच01-:θ-θ0-Δ। यदि कोई H को अस्वीकार करता है01- और एच02-, तो आपको यह निष्कर्ष निकालना चाहिए -Δ<θ-θ0<Δ, यानी कि आपके समूह अंतराल के बराबर हैं[-Δ,Δ]
एलेक्सिस

काफी उचित; मैं शायद थोड़ा भ्रामक था। मैंने उन हिस्सों को हटा दिया है जिनसे आपको आपत्ति होती है। हालाँकि, मुझे लगता है कि आपने अपनी टिप्पणी को बहुत दृढ़ता से लिखा है। इस तथ्य के बावजूद कि मजबूर डाइकोटोमस fail to/ rejectदृष्टिकोण अच्छी तरह से स्थापित है, अधिकांश नमूने पूरी तरह से इस संभावना को नहीं रोक सकते हैं कि अशक्त सही है। एक अस्वीकृति पर जोर देने पर लगभग हमेशा झूठी अस्वीकृति त्रुटि के कुछ अवसर होते हैं, जो आमतौर पर सचमुच आवश्यक नहीं होता है। मूल रूप से बनाने का मेरा इरादा शायद यही अधिक महत्वपूर्ण बिंदु था। उम्मीद है कि हटाए गए सामान के बिना अब यह थोड़ा स्पष्ट है
निक स्टॉनर

2
खैर, मेरी राय में, तुल्यता परीक्षण की ताकत (जैसे एच0-) अंतर के लिए परिचित परीक्षणों के साथ उनके संयोजन से आता है (जैसे एच0+)। इसे देखें: (1) एच को अस्वीकार करें0+ और एच को अस्वीकार न करें0-, प्रासंगिक अंतर ; (२) एच रिजेक्ट नहीं0+ एच को अस्वीकार करें0-, समतुल्यता (के लिए)Δ); (३) एच को अस्वीकार करना0+ एच को अस्वीकार करें0-, तुच्छ अंतर को समाप्त करें (अर्थात यह वहां है, लेकिन आपको परवाह नहीं है); और (4) एच को अस्वीकार न करें0+ और एच को अस्वीकार न करें0-, समापन अनिश्चितता _ / _ प्रबलित परीक्षण । विश्लेषण में उपयोगी रूप से शक्ति डालता है ।
एलेक्सिस

बेशक, संवेदनशीलता और विशिष्टता, पीपीवी और एनपीवी के मुद्दे दूर नहीं होते हैं।
एलेक्सिस

-1

समतुल्यता वह चीज नहीं है जिसे हम परख सकते हैं । परिकल्पना के बारे में सोचो:एच0:एक्सy बनाम एच1:एक्स=y। NHST सिद्धांत हमें बताता है कि, अशक्त के तहत, हम चुन सकते हैं कुछ भी नीचेएच0यह सबसे अच्छा डेटा फिट बैठता है। इसका मतलब है कि हम लगभग हमेशा मनमाने ढंग से वितरण के करीब पहुंच सकते हैं। उदाहरण के लिए, यदि मैं परीक्षण करना चाहता हूंएक्स~एन(0,1)संभावना मॉडल है कि अलग वितरण के लिए अनुमति देता है ^एक्स तथा ^yहमेशा अशक्त होने की संभावना अधिक होगी, महत्वपूर्ण परीक्षण मान्यताओं का उल्लंघन। भले ही नमूनाएक्स=Y समान रूप से, मैं एक संभावना अनुपात प्राप्त कर सकता हूं जो मनमाने ढंग से 1 के करीब है yएक्स

यदि आप डेटा के लिए उपयुक्त संभावना मॉडल जानते हैं, तो आप वैकल्पिक मॉडल को रैंक करने के लिए एक दंडित सूचना मानदंड का उपयोग कर सकते हैं । एक तरीका यह है कि दो प्रायिकता मॉडल के बीआईसी का उपयोग किया जाए (एक अनुमान के तहतएच0 तथा एच1। मैंने एक सामान्य संभाव्यता मॉडल का उपयोग किया है, लेकिन आप किसी भी प्रकार की अधिकतम संभावना प्रक्रिया से बीआईसी प्राप्त कर सकते हैं, या तो हाथ से या जीएलएम का उपयोग कर सकते हैं। यह स्टैकओवरफ़्लो पोस्ट फिटिंग वितरण के लिए नॉटी-ग्रिट्टी में मिलती है। ऐसा करने का एक उदाहरण यहाँ है:

set.seed(123)
p <- replicate(1000, { ## generate data under the null
  x <- rnorm(100)
  g <- sample(0:1, 100, replace=T)
  BIC(lm(x~1)) > BIC(lm(x~g))
})
mean(p)

देता है

> mean(p)
[1] 0.034

पीयहाँ कई बार का अनुपात है कि वैकल्पिक मॉडल (समकक्ष मॉडल) की तुलना में नल मॉडल (अलग मॉडल) का बीआईसी बेहतर (कम) है। यह उल्लेखनीय रूप से सांख्यिकीय परीक्षणों के नाममात्र 0.05 के स्तर के करीब है।

दूसरी ओर अगर हम लेते हैं:

set.seed(123)
p <- replicate(1000, { ## generate data under the null
  x <- rnorm(100)
  g <- sample(0:1, 100, replace=T)
  x <- x + 0.4*g
  BIC(lm(x~1)) > BIC(lm(x~g))
})
mean(p)

देता है:

> mean(p)
[1] 0.437

एनएचएसटी के साथ शक्ति और झूठे सकारात्मक त्रुटि दर के सूक्ष्म मुद्दे हैं जिन्हें निश्चित निष्कर्ष बनाने से पहले सिमुलेशन के साथ पता लगाया जाना चाहिए।

मुझे लगता है कि एक समान (शायद अधिक सामान्य विधि) या तो संभावना मॉडल के तहत अनुमानित पश्च की तुलना करने के लिए बायेसियन सांख्यिकी का उपयोग कर रहा है।


2
एडमो आप "परीक्षण समानता" के साथ "परीक्षण समानता" को भ्रमित कर रहे हैं। बाद के तरीकों और आवेदन में दशकों पुराना और ठोस साहित्य है।
एलेक्सिस

1
उदाहरण के लिए देखें, वेलेक, एस (2010)। समतुल्यता और Noninferiority के सांख्यिकीय परिकल्पना का परीक्षण । चैपमैन और हॉल / सीआरसी प्रेस, दूसरा संस्करण।
एलेक्सिस

@ एलेक्सिस हम्म, हमारे पास दुर्भाग्य से एक पुस्तकालय तक पहुंच नहीं है। क्या आप कह रहे हैं कि समानता गैर-हीनता के समान है क्योंकि एक मार्जिन के भीतर पड़े अनुमानों को समकक्ष माना जाता है?
आदमियो

1
बिल्कुल नहीं: गैर-हीनता एक परीक्षण का एकतरफा है कि क्या कोई नया उपचार कुछ मानक माइनस से भी कम बुरा प्रदर्शन करता है जो कि एक प्राथमिकता के रूप में निर्दिष्ट होता है । तुल्यता के लिए परीक्षण अशक्त परिकल्पना के परीक्षण हैं कि दो (या अधिक) मात्राएँ अलग-अलग हैं - या तो दिशा में-एक छोटे से अधिक प्रासंगिक अंतर से एक प्राथमिकता निर्धारित की गई है । कुछ शब्दार्थ पत्र:
एलेक्सिस

शूइरमैन, डीए (1987)। दो एक-पक्षीय परीक्षण प्रक्रिया और औसत जैवउपलब्धता की समानता का आकलन करने के लिए शक्ति दृष्टिकोण की तुलनाफार्माकोकाइनेटिक्स और बायोफार्मासुटिक्स की पत्रिका , 15 (6): 657–680।
एलेक्सिस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.