माध्य के विरुद्ध एकल नमूने की तुलना में क्रमपरिवर्तन परीक्षण


10

जब लोग किसी माध्य के विरूद्ध एकल नमूने की तुलना करने के लिए क्रमपरिवर्तन परीक्षण लागू करते हैं (जैसे, आप क्रमपरिवर्तन टी-परीक्षण के साथ कर सकते हैं), तो कैसे संभाला जाता है? मैंने ऐसे कार्यान्वयन देखे हैं जो एक माध्य और क्रमपरिवर्तन परीक्षण के लिए एक नमूना लेते हैं, लेकिन यह स्पष्ट नहीं है कि वे वास्तव में हुड के नीचे क्या कर रहे हैं। वहाँ एक सार्थक बनाम एक नमूना के लिए एक क्रमचय परीक्षण (जैसे, टी-परीक्षण) करने का एक सार्थक तरीका है? या, वैकल्पिक रूप से, क्या वे केवल हुड के तहत एक गैर-क्रमचय परीक्षण के लिए डिफ़ॉल्ट हैं? (जैसे, क्रमपरिवर्तन फ़ंक्शन को कॉल करने या एक क्रमपरिवर्तन परीक्षण ध्वज सेट करने के बावजूद, मानक टी-परीक्षण या समान फ़ंक्शन के लिए डिफ़ॉल्ट)

एक मानक दो-नमूना क्रमचय परीक्षण में, एक में दो समूह होंगे और लेबल के असाइनमेंट को रैंडमाइज करेंगे। हालांकि, यह कैसे संभाला जाता है जब एक "समूह" एक माना जाता है? जाहिर है, मान लिया गया है कि अपने आप में कोई नमूना आकार नहीं है। तो, एक क्रमिक प्रारूप में माध्य के काम करने का विशिष्ट तरीका क्या है? क्या "माध्य" नमूने को एकल बिंदु माना जाता है? नमूना समूह के बराबर आकार का एक नमूना? एक असीम आकार का नमूना?

यह देखते हुए कि मान लिया गया है, ठीक है, मान लिया गया- मैं कहूंगा कि इसके पास तकनीकी रूप से अनंत समर्थन है या आप इसके लिए जो भी समर्थन चाहते हैं। हालांकि, इनमें से कोई भी वास्तविक गणना के लिए बहुत उपयोगी नहीं है। सभी समानताओं के साथ समान आकार का नमूना ऐसा प्रतीत होता है कि कभी-कभी कुछ परीक्षणों के साथ किया जाता है (उदाहरण के लिए, आप बस जोड़े के दूसरे आधे भाग में मान लिया गया है)। यह थोड़ा समझ में आता है, क्योंकि यह समान-लंबाई का नमूना है जिसे आप देखेंगे यदि आपका माना जाता है कि बिना किसी विचरण के सही था।

तो मेरा सवाल यह है: व्यवहार में, क्या लोग वास्तव में क्रमपरिवर्तन-परीक्षण शैली के लेबल यादृच्छिकरण का अनुकरण करते हैं जब दूसरा सेट एक माध्य (या समान सार मान) होता है? यदि हां, तो लोग ऐसा करने पर लेबल रैंडमाइजेशन को कैसे संभालते हैं?


6
एक विशिष्ट परिकल्पित माध्य का क्रमपरिवर्तन परीक्षण शून्य से एक माध्य के खिलाफ डेटा और परीक्षण से उपकल्पित माध्य को घटाने से अलग नहीं है। एक युग्मित परीक्षण की चर्चा यहाँ की गई है ; यह धारणा बनाता है कि अशक्त के तहत जोड़ों का समान वितरण होता है, जो उन अंतरों का तात्पर्य करता है जिनके आधार पर बाद के एक-नमूना परीक्षण को सममित माना जाता है। उस आधार पर, संकेतों को प्रत्येक अंतर पर बेतरतीब ढंग से फ़्लिप किया जाता है ... (ctd)
Glen_b -Reinstate Monica

1
(ctd) ... (जो युग्मित परीक्षण के लिए समूहों के लेबल के समतुल्य है)। खैर यह एक यादृच्छिक परीक्षण के लिए है - एक पूर्ण क्रमपरिवर्तन परीक्षण के लिए आप साइन-फ़्लिप के सभी संभावित संयोजनों को करेंगे। यदि आप समरूपता नहीं मान सकते हैं, तो यह देखना थोड़ा कठिन है कि आप क्या अनुमति देंगे - लेकिन आप अभी भी बूटस्ट्रैप टेस्ट करवाने में सक्षम होना चाहिए। 2n
Glen_b -Reinstate मोनिका

यह समझ आता है। लेकिन मैं उन कम्प्यूटेशनल कार्यान्वयन से थोड़ा सोच रहा हूं जो लोग करते हैं। यदि आप इसे एक साइन टेस्ट में बदल सकते हैं, तो क्या लोग वास्तव में क्रमपरिवर्तन की गणना करने से परेशान हैं? लंबाई एन के किसी भी अनुक्रम के लिए, साइन फ़्लिप के क्रमपरिवर्तन का पूरा सेट समान होगा, नहीं? इसलिए मुझे लगता है कि हुड के तहत, लोग इसे मैन्युअल रूप से एक द्विपद परीक्षण बनाने के बजाय एक द्विपद परीक्षण में फ़नल कर सकते हैं जो एक द्विपद जिले बनाते हैं। मैं मुख्य रूप से सोच रहा हूँ कि क्या / जब वहाँ relabeling और एकल-नमूना बनाम माध्य मामले में एक मानक परीक्षण का उपयोग करके अनुमति देता है।
Namey

मैं इसे साइन टेस्ट में बदलने का सुझाव नहीं दे रहा था। इस योजना के तहत मैं चिन्हित कर रहा था कि संकेतों की अनुमति है लेकिन मूल डेटा के पूर्ण मूल्यों को बरकरार रखा गया है; वें permuted एक्समैं है रोंमैं[]|एक्समैं| कहाँ पे रों या तो +1 या -1। वह है, अगरएक्स10 शून्य के एक साधन के खिलाफ एक नमूना परीक्षण में 11.43 था, जिसे अनुमति दी गई थी एक्स10सभी या तो -11.43 या +11.43 होंगे। यदि आप पूर्ण डेटा को पहले स्थान पर रखते हैं, तो आप वास्तव में एक विलकॉक्सन हस्ताक्षरित रैंक परीक्षण के साथ समाप्त हो जाएंगे, इसलिए यह उसी के बिनारेटेड (मूल-डेटा) संस्करण की तरह है।
Glen_b -Reinstate मोनिका

जवाबों:


6

जवाब में Glen_b की टिप्पणी का विस्तार करना

एक नमूना के मतलब के लिए एक अनुमानित एक-नमूना क्रमांकन परीक्षण, शून्य माध्य की एक शून्य परिकल्पना के खिलाफ, नमूना में डेटा को यादृच्छिक संकेत प्रदान करके कार्यान्वित किया जाता है। गैर शून्य शून्य परिकल्पनाओं का परीक्षण आंकड़ों से वांछित अशक्त माध्य को घटाकर किया जा सकता है।

onetPermutationपैकेज में आर फ़ंक्शन के स्रोत में यह देखना आसान है DAAG। यहाँ प्रासंगिक कोड का एक अंश है, टिप्पणियों के साथ मैंने जोड़ा है:

function (x, nsim) {

  ## Initialize and pre-allocate

  n <- length(x)
  dbar <- mean(x)
  absx <- abs(x)  # there's actually a bug in the code; below you'll see that the function ends up re-computing abs(x) instead of using this
  z <- array(, nsim)


  ## Run the simulation    

  for (i in 1:nsim) {                             # Do nsim times:
      mn <- sample(c(-1, 1), n, replace = TRUE)   #  1. take n random draws from {-1, 1}, where n is the length of the data to be tested
      xbardash <- mean(mn * abs(x))               #  2. assign the signs to the data and put them in a temporary variable
      z[i] <- xbardash                            #  3. save the new data in an array
  }


  ## Return the p value
  # p = the fraction of fake data that is:
  #      larger than |sample mean of x|, or
  #    smaller than -|sample mean of x|

  (sum(z >= abs(dbar)) + sum(z <= -abs(dbar)))/nsim
}

absउपरोक्त कोड में क्या कार्य है ? क्या लेबल की फ़्लिपिंग बिना समान रूप से यादृच्छिक नहीं होगी abs?
मैथ्यू ब्रेट
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.