निर्भर नमूना टी-परीक्षण के लिए कोहेन की डी


10

त्वरित प्रश्न: मैंने देखा है कि कोहेन की गणना एक निर्भर नमूने टी-परीक्षण के लिए दो अलग-अलग तरीकों से की गई है (उदाहरण के लिए, नमूने के भीतर पूर्व / पोस्ट समय के साथ एक दवा की प्रभावकारिता का परीक्षण डिजाइन)।

  1. कोहेन के डी के समीकरण के हर में परिवर्तन के मानक विचलन का उपयोग करना।
  2. कोहेन के डी के समीकरण के हर में सबसे सुंदर स्कोर के मानक विचलन का उपयोग करना।

मुझे वास्तव में बहुत कम साहित्य मिला है जो कि उपयोग करने के लिए और / या जब विकल्प का उपयोग करने के लिए।

कोई त्वरित विचार?


क्या आपको पता है कि युग्मित नमूना टी-टेस्ट के लिए कोहेन की डी की गणना कैसे की जाती है?
14:55 पर user552231

@ user552231 कोचीन के डी के लिए खुला स्रोत आर कोड हैं क्या आपने देखा है?
हैलोवर्ल्ड

जवाबों:


6

ज्योफ कमिंग की इस मामले पर कुछ टिप्पणियां हैं ( कमिंग, 2013 से ली गई ):

कई मामलों में, हालांकि, मानक का सबसे अच्छा विकल्प सवाल में प्रभाव पर निष्कर्ष निकालने के लिए एसडी की आवश्यकता नहीं है। उदाहरण के लिए, युग्मित डिज़ाइन, जैसे कि एक साधारण प्री-पोस्ट प्रयोग, जिसमें प्रतिभागियों का एक एकल समूह प्रीटेस्ट और पोस्टटेस्ट डेटा दोनों प्रदान करता है। सबसे उपयुक्त मानक हमेशा वस्तुतः (कमिंग, 2012, पीपी। 290–294; कमिंग एंड फिंच, 2001, पीपी। 568–570) है, जो अनुमान लगाती है कि एसडी का अनुमान सबसे अधिक जनसंख्या में, शायद , हमारे डेटा में एसडी। इसके विपरीत, अंतर के बारे में अनुमान लगाने के लिए आवश्यकता होती है , युग्मित अंतरों का SD- एक युग्मित टी परीक्षण के लिए या अंतर पर एक सीआई की गणना करने के लिए (कमिंग एंड फिंच, 2005)। सबसे स्कोर सहसंबद्ध हैं,s1sdiffsdiff तुलना में छोटा होगा , हमारा प्रयोग अधिक संवेदनशील होगा, और मानक रूप से का उपयोग करके गणना की गई d का मूल्य बहुत बड़ा होगा।s1sdiff

युग्मित डिजाइन में मानक के रूप में को चुनने का प्राथमिक कारण यह है कि सबसे सुंदर जनसंख्या SD वस्तुतः एक संदर्भ इकाई के रूप में सर्वश्रेष्ठ वैचारिक अर्थ बनाती है। एक और महत्वपूर्ण कारण डी मान प्राप्त करने की संभावना है जो अन्य युग्मित-डिजाइन प्रयोगों द्वारा दिए गए डी मूल्यों के तुलनीय होने की संभावना है, संभवतः अलग-अलग प्रीटेस्ट-पोस्टरेस्ट सहसंबंध हैं और विभिन्न डिजाइनों के साथ प्रयोगों द्वारा, जिसमें स्वतंत्र-समूह डिजाइन शामिल हैं, जिनमें से सभी जांच करते हैं एक ही प्रभाव। ऐसे सभी मामलों में घ के मान की तुलना होने की संभावना है क्योंकि वे एक ही मानक का उपयोग करते हैं - नियंत्रण या सबसे पुराना एसडी। मेटा-विश्लेषण के लिए, साथ ही संदर्भ में सार्थक व्याख्या के लिए ऐसी तुलना आवश्यक है।spre


3

ध्यान दें कि यह आपको मानकीकृत माध्य परिवर्तन देगा जहां परिवर्तन के मानक विचलन के संदर्भ में माध्य परिवर्तन को मानकीकृत किया गया है (प्रश्न में 1. के रूप में निरूपित किया गया है)।
वोल्फगैंग

0

यहाँ एक सुझाया गया आर फ़ंक्शन है जो हेजेस जी (कोहेन के निष्पक्ष संस्करण) की गणना करता है और साथ ही साथ या भीतर-विषय डिजाइन के लिए अपने आत्मविश्वास अंतराल के साथ:

gethedgesg <-function( x1, x2, design = "between", coverage = 0.95) {
  # mandatory arguments are x1 and x2, both a vector of data

  require(psych) # for the functions SD and harmonic.mean.

  # store the columns in a dataframe: more convenient to handle one variable than two
  X <- data.frame(x1,x2)

  # get basic descriptive statistics
  ns  <- lengths(X)
  mns <- colMeans(X)
  sds <- SD(X)

  # get pairwise statistics
  ntilde <- harmonic.mean(ns)
  dmn    <- abs(mns[2]-mns[1])
  sdp    <- sqrt( (ns[1]-1) *sds[1]^2 + (ns[2]-1)*sds[2]^2) / sqrt(ns[1]+ns[2]-2)

  # compute biased Cohen's d (equation 1) 
  cohend <- dmn / sdp

  # compute unbiased Hedges' g (equations 2a and 3)
  eta     <- ns[1] + ns[2] - 2
  J       <- gamma(eta/2) / (sqrt(eta/2) * gamma((eta-1)/2) )
  hedgesg <-  cohend * J

  # compute noncentrality parameter (equation 5a or 5b depending on the design)
  lambda <- if(design == "between") {
    hedgesg * sqrt( ntilde/2)
  } else {
    r <- cor(X)[1,2]
    hedgesg * sqrt( ntilde/(2 * (1-r)) )
  }

  # confidence interval of the hedges g (equations 6 and 7)
  tlow <- qt(1/2 - coverage/2, df = eta, ncp = lambda )
  thig <- qt(1/2 + coverage/2, df = eta, ncp = lambda )

  dlow <- tlow / lambda * hedgesg 
  dhig <- thig / lambda * hedgesg 

  # all done! display the results
  cat("Hedges'g = ", hedgesg, "\n", coverage*100, "% CI = [", dlow, dhig, "]\n")

}

यहाँ इसका उपयोग कैसे किया जा सकता है:

x1 <- c(53, 68, 66, 69, 83, 91)
x2 <- c(49, 60, 67, 75, 78, 89)

# using the defaults: between design and 95% coverage
gethedgesg(x1, x2)

# changing the defaults explicitely
gethedgesg(x1, x2, design = "within", coverage = 0.90 )

मुझे उम्मीद है यह मदद करेगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.