आँकड़े: अल्फा और बीटा के बीच संबंध


13

मेरा प्रश्न अल्फा और बीटा के बीच संबंध और आंकड़ों में उनकी परिभाषा के साथ क्या करना है।

अल्फ़ा = प्रकार I त्रुटि दर = विचारणीय स्तर के तहत विचार है कि NULL परिकल्पना सही है

बीटा = प्रकार II त्रुटि दर

यदि अल्फ़ा को कम किया जाता है (अल्फा = 1- विशिष्टता के रूप में विशिष्टता बढ़ जाती है), बीटा बढ़ जाती है (संवेदनशीलता / शक्ति बीटा के रूप में घट जाती है = 1 - संवेदनशीलता / शक्ति)

अल्फा में परिवर्तन बीटा को कैसे प्रभावित करता है? कोई रैखिक संबंध है या नहीं? क्या अनुपात अल्फा / बीटा हमेशा समान होता है, दूसरे शब्दों में अनुपात विशिष्टता / संवेदनशीलता हमेशा समान होती है? यदि हाँ, तो इसका मतलब है कि एक बोनफ्रोनी सुधार का उपयोग करके हम केवल कम संवेदनशीलता और उच्च विशिष्टता में बदलाव कर रहे हैं लेकिन हम संवेदनशीलता / विशिष्टता अनुपात को नहीं बदल रहे हैं। क्या ऐसा कहना सही है?

अद्यतन (केस-विशिष्ट प्रश्न):

किसी दिए गए प्रयोगात्मक डिज़ाइन के लिए, हम डेटा पर 5 रैखिक मॉडल चलाते हैं। हमारे पास 0.8 पर एक ट्रू पॉजिटिव रेट (सेंसिटिविटी / पावर) और 0.7 पर एक ट्रू नेगेटिव रेट (विशिष्टता) है। (आइए कल्पना करें कि हम जानते हैं कि सकारात्मक क्या होना चाहिए और क्या नहीं होना चाहिए।) अगर अब हम बोनफेरोनी का उपयोग कर 0.05 / 5 = 0.01 के महत्व स्तर को ठीक करते हैं। क्या हम परिणामी पॉजिटिव रेट (संवेदनशीलता / शक्ति) और ट्रू नेगेटिव रेट (विशिष्टता) के संख्यात्मक रूप से अनुमान लगा सकते हैं?

आपकी सहायता के लिए धन्यवाद।

जवाबों:


16

और β संबंधित हैं। मैं नैदानिक ​​परीक्षण के साथ बिंदु को स्पष्ट करने की कोशिश करूंगा। मान लीजिए कि आपके पास एक नैदानिक ​​परीक्षण है जो रक्त मार्कर के स्तर को मापता है। यह ज्ञात है कि एक निश्चित बीमारी वाले लोगों में स्वस्थ लोगों की तुलना में इस मार्कर का स्तर कम होता है। यह तुरंत स्पष्ट है कि आपको एक कटऑफ मूल्य तय करना होगा, जिसके नीचे एक व्यक्ति को "बीमार" के रूप में वर्गीकृत किया गया है, जबकि इस कटऑफ से ऊपर के मूल्यों वाले लोगों को स्वस्थ माना जाता है। यह बहुत संभावना है, हालांकि, रक्तदाता का वितरणबीमार और स्वस्थ लोगों केभीतरभी काफी भिन्न होता है। कुछ स्वस्थ व्यक्तियों में बहुत कम रक्त मार्कर स्तर हो सकते हैं, भले ही वे पूरी तरह से स्वस्थ हों। और कुछ बीमार लोगों में बीमारी होने के बावजूद भी रक्त में उच्च स्तर होता है।αβ

चार कब्बाइलाइट्स हो सकते हैं:

  1. एक बीमार व्यक्ति को सही रूप में बीमार के रूप में पहचाना जाता है (सही सकारात्मक = टीपी)
  2. एक बीमार व्यक्ति को गलत तरीके से स्वस्थ (झूठे नकारात्मक = FN) के रूप में वर्गीकृत किया जाता है
  3. एक स्वस्थ व्यक्ति को स्वस्थ रूप से पहचाना जाता है (सच्चा नकारात्मक = TN)
  4. एक स्वस्थ व्यक्ति को गलत तरीके से बीमार (झूठे सकारात्मक = FP) के रूप में वर्गीकृत किया जाता है

इन संभावनाओं को 2x2 तालिका के साथ चित्रित किया जा सकता है :

               Sick Healthy
Test positive   TP     FP
Test negative   FN     TN

αα=एफपी/(एफपी+टीएन)ββ=एफएन/(टीपी+एफएन)R

alphabeta <- function(mean.sick=100, sd.sick=10, mean.healthy=130, sd.healthy=10, cutoff=120, n=10000, side="below", do.plot=TRUE) {

  popsick <- rnorm(n, mean=mean.sick, sd=sd.sick)
  pophealthy <- rnorm(n, mean=mean.healthy, sd=sd.healthy)

  if ( side == "below" ) {

    truepos <- length(popsick[popsick <= cutoff])
    falsepos <- length(pophealthy[pophealthy <= cutoff])
    trueneg <- length(pophealthy[pophealthy > cutoff])
    falseneg <- length(popsick[popsick > cutoff])

  } else if ( side == "above" ) {

    truepos <- length(popsick[popsick >= cutoff])
    falsepos <- length(pophealthy[pophealthy >= cutoff])
    trueneg <- length(pophealthy[pophealthy < cutoff])
    falseneg <- length(popsick[popsick < cutoff])

  }

  twotable <- matrix(c(truepos, falsepos, falseneg, trueneg), 2, 2, byrow=T)
  rownames(twotable) <- c("Test positive", "Test negative")
  colnames(twotable) <- c("Sick", "Healthy")

  spec <- twotable[2,2]/(twotable[2,2] + twotable[1,2])
  alpha <- 1 - spec
  sens <- pow <- twotable[1,1]/(twotable[1,1] + twotable[2,1])
  beta <- 1 - sens

  pos.pred <- twotable[1,1]/(twotable[1,1] + twotable[1,2])
  neg.pred <- twotable[2,2]/(twotable[2,2] + twotable[2,1])


  if ( do.plot == TRUE ) {

    dsick <- density(popsick)
    dhealthy <- density(pophealthy)

    par(mar=c(5.5, 4, 0.5, 0.5))
    plot(range(c(dsick$x, dhealthy$x)), range(c(c(dsick$y, dhealthy$y))), type = "n", xlab="", ylab="", axes=FALSE)
    box()
    axis(1, at=mean(pophealthy), lab=substitute(mu[H[0]]~paste("=",m, sep=""), list(m=mean.healthy)), cex.axis=1.5,tck=0.02)
    axis(1, at=mean(popsick), lab=substitute(mu[H[1]]~paste("=",m, sep=""), list(m=mean.sick)), cex.axis=1.5, tck=0.02)                                        
    axis(1, at=cutoff, lab=substitute(italic(paste("Cutoff=",coff, sep="")), list(coff=cutoff)), pos=-0.004, tick=FALSE, cex.axis=1.25)
    lines(dhealthy, col = "steelblue", lwd=2)

    if ( side == "below" ) {
      polygon(c(cutoff, dhealthy$x[dhealthy$x<=cutoff], cutoff), c(0, dhealthy$y[dhealthy$x<=cutoff],0), col = "grey65")
    } else if ( side == "above" ) {
      polygon(c(cutoff, dhealthy$x[dhealthy$x>=cutoff], cutoff), c(0, dhealthy$y[dhealthy$x>=cutoff],0), col = "grey65")
    }

    lines(dsick, col = "red", lwd=2)

    if ( side == "below" ) {
      polygon(c(cutoff,dsick$x[dsick$x>cutoff],cutoff),c(0,dsick$y[dsick$x>cutoff],0) , col="grey90")
    } else if ( side == "above" ) {
      polygon(c(cutoff,dsick$x[dsick$x<=cutoff],cutoff),c(0,dsick$y[dsick$x<=cutoff],0) , col="grey90")
    }

    legend("topleft",
           legend=(c(as.expression(substitute(alpha~paste("=", a), list(a=round(alpha,3)))), 
                     as.expression(substitute(beta~paste("=", b), list(b=round(beta,3)))))), fill=c("grey65", "grey90"), cex=1.2, bty="n")
    abline(v=mean(popsick), lty=3)
    abline(v=mean(pophealthy), lty=3)
    abline(v=cutoff, lty=1, lwd=1.5)
    abline(h=0)

  }

  #list(specificity=spec, sensitivity=sens, alpha=alpha, beta=beta, power=pow, positiv.predictive=pos.pred, negative.predictive=neg.pred)

  c(alpha, beta)

}

आइए एक उदाहरण देखें। हम मानते हैं कि बीमार लोगों के बीच रक्त मार्कर का औसत स्तर 10. के मानक विचलन के साथ 100 है। स्वस्थ लोगों में, औसत रक्त स्तर 140 के मानक विचलन के साथ 140 है। चिकित्सक 120 पर कटऑफ निर्धारित करता है।

alphabeta(mean.sick=100, sd.sick=10, mean.healthy=140, sd.healthy=15, cutoff=120, n=100000, do.plot=TRUE, side="below")

              Sick Healthy
Test positive 9764     901
Test negative  236    9099

120 के कटऑफ के साथ बीटा और अल्फा

α=901/(901+9099)0.09β=236/(236+9764)0.024

              Sick Healthy
Test positive 6909      90
Test negative 3091    9910

कटऑफ 105

αβ

αβ

cutoffs <- seq(0, 200, by=0.1)
cutoff.grid <- expand.grid(cutoffs)

plot.frame <- apply(cutoff.grid, MARGIN=1, FUN=alphabeta, mean.sick=100, sd.sick=10, mean.healthy=140, sd.healthy=15, n=100000, do.plot=FALSE, side="below")

plot(plot.frame[1,]~cutoffs, type="l", las=1, xlab="Cutoff value", ylab="Alpha/Beta", lwd=2, cex.axis=1.5, cex.lab=1.2)
lines(plot.frame[2,]~cutoffs, col="steelblue", lty=2, lwd=2)
legend("topleft", legend=c(expression(alpha), expression(beta)), lwd=c(2,2),lty=c(1,2), col=c("black", "steelblue"), bty="n", cex=1.2)

विभिन्न कटऑफ मूल्यों के साथ अल्फा और बीटा का प्लॉट

αβ

बिल्कुल सही कटऑफ

यहां हमारे पास "पूर्ण" परीक्षण इस अर्थ में है कि 150 का कटऑफ बीमार को स्वस्थ से अलग करता है।


बोनफर्रोनी समायोजन

αββ0.020.31α0.090.01


@COOLSerdash वाह अच्छा जवाब! धन्यवाद। आपके उदाहरण में महत्वपूर्ण स्तर का चुनाव ज्ञात वितरण पर किया जा सकता है। उदाहरण के लिए जीव विज्ञान में आप अपने आश्रित चर के वितरण को नहीं जान सकते हैं यदि उपचार का प्रभाव है। दूसरे शब्दों में, एक महत्व स्तर चुनकर, आप झूठी सकारात्मक दर का चयन करते हैं, लेकिन आपको लगभग पता नहीं है कि झूठी नकारात्मक दर कैसे निर्धारित की जाती है। जैसा कि आपको वास्तव में पता नहीं है कि ट्रू पॉजिटिव और नेगेटिव रेट कैसे सेट किए जाते हैं। क्या वो सही है ?
रेमी .b

1
αα1-βαβपीα

2

भविष्य में दूसरों के लिए:

नमूना आकार के आकलन में, Ztotal को Z को अल्फा और Z के समान शक्ति (1-बीटा) के साथ जोड़कर गणना की जाती है। इसलिए गणितीय रूप से, यदि नमूना आकार स्थिर रखा जाता है, तो Z के लिए अल्फा में वृद्धि का मतलब है कि आप एसएएमई राशि द्वारा Z के लिए शक्ति में कमी करते हैं, उदाहरण के लिए, Zalpha को 0.05 से बढ़ाकर 0.1 करने से Zpower 0.05 तक कम हो जाती है।

अंतर यह है कि अल्फा के लिए जेड दो-पूंछ है जबकि बीटा के लिए जेड 1-पूंछ है। इसलिए, जबकि Z मान उसी राशि से बदलता है, लेकिन संभाव्यता% जो यह Z मान उसी राशि से नहीं बदलता है।

उदाहरण:

80% शक्ति (20% बीटा) के साथ 5% अल्फा (95% आत्मविश्वास) समान नमूना आकार देता है

20% अल्फा (80% आत्मविश्वास) 93.6% शक्ति (6.4% बीटा) के साथ 95% शक्ति के बजाय अगर हमारे संबंध 1: 1 होते।


1

अल्फा और बीटा के बीच कोई सामान्य संबंध नहीं है।

यह सब आपके परीक्षण पर निर्भर करता है, सरल छूट लें:

(विकिपीडिया)

बोलचाल के उपयोग प्रकार में मुझे त्रुटि "निर्दोष व्यक्ति को दोषी" के रूप में समझा जा सकता है और II त्रुटि टाइप करें "दोषी व्यक्ति को मुक्त होने दें"।

एक जूरी गंभीर हो सकती है: कोई प्रकार II त्रुटि, कुछ प्रकार I A जूरी "दयालु" हो सकती है: कोई प्रकार I लेकिन कुछ प्रकार II A जूरी सामान्य हो सकती है: कुछ प्रकार I और कुछ प्रकार II A जूरी परिपूर्ण हो सकती है: कोई त्रुटि नहीं

व्यवहार में दो विरोधी प्रभाव है:

जब परीक्षण की गुणवत्ता बढ़ जाती है, तो टाइप I और टाइप II त्रुटि कुछ बिंदु तक कम हो जाती है। जब एक जूरी में सुधार होता है, तो वह निर्दोष और दोषी दोनों लोगों पर बेहतर निर्णय देता है।

कुछ बिंदु के बाद परीक्षण की इमारत में अंतर्निहित समस्या प्रकट होती है। टेस्ट चलाने वाले के लिए टाइप I या II अधिक महत्वपूर्ण हैं। जूरी छूट के साथ, टाइप I त्रुटियाँ अधिक महत्वपूर्ण हैं और इसलिए कानून की प्रक्रिया टाइप I से बचने के लिए बनाई गई है। यदि कोई संदेह है कि व्यक्ति स्वतंत्र है। सहज रूप से यह टाइप II त्रुटि में वृद्धि का कारण बनता है।

बोन्फ्रोनी के बारे में:

(विकिपीडिया पर फिर से)

बोन्फ्रॉनी सुधार केवल झूठी सकारात्मकता की संभावना को नियंत्रित करता है। आमतौर पर सुधार झूठी नकारात्मक उत्पादन की संभावना को बढ़ाने, और परिणामस्वरूप सांख्यिकीय शक्ति को कम करने की लागत पर आता है। बड़ी संख्या में परिकल्पनाओं का परीक्षण करते समय, इसके परिणामस्वरूप बड़े महत्वपूर्ण मूल्य हो सकते हैं।


आपके उत्तर के लिए धन्यवाद, यह उपयोगी है लेकिन फिर भी मेरे लिए कुछ स्पष्ट नहीं है। मैंने एक नया प्रश्न जोड़कर अपनी पोस्ट अपडेट की।
रेमी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.