क्या संवेदनशीलता या विशिष्टता व्यापकता का कार्य है?


10

मानक शिक्षण का कहना है कि संवेदनशीलता और विशिष्टता परीक्षण के गुण हैं और व्यापकता से स्वतंत्र हैं। लेकिन क्या यह सिर्फ एक धारणा नहीं है?

आंतरिक चिकित्सा के 19 वें संस्करण में हैरिसन के सिद्धांत कहते हैं

यह लंबे समय से माना जाता है कि संवेदनशीलता और विशिष्टता परीक्षण सटीकता के प्रचलित-स्वतंत्र पैरामीटर हैं, और कई ग्रंथ अभी भी यह बयान करते हैं। यह सांख्यिकीय रूप से उपयोगी धारणा है, हालांकि, नैदानिक ​​रूप से सरल है। ... अस्पताल में भर्ती मरीजों में टेस्ट सेंसिटिविटी अधिक होगी, और आउट पेशेंट में टेस्ट की विशिष्टता अधिक होगी।

(व्यापकता आमतौर पर बाह्य रोगियों की तुलना में रोगियों में अधिक होती है)

क्या इन मापदंडों के बीच एक गणितीय या एक अनुमानित ग्राफिकल संबंध है?

यहां तक ​​कि यह लिंक इसे 'सरलीकरण' भी कहता है। क्यों?

संपादित करें: मुझे पता है कि संवेदनशीलता कैसे परिभाषित की जाती है। इसमें प्रचलित शब्द का कोई अर्थ नहीं है, जैसा कि उत्तर में वर्णित है। मैंने स्वयं यह सुनिश्चित किया है कि ये प्रयोग किए गए जनसंख्या के अप्रभावित परीक्षण के गुण हैं, जब तक कि मैं इस कथन के पार नहीं आया, इसलिए प्रश्न। लेकिन मुझे लगता है, यह भ्रम परिभाषा के कारण नहीं बल्कि इन मूल्यों की व्यावहारिक गणना के कारण उत्पन्न हो रहा है। 2x2 तालिकाओं का उपयोग करके विशिष्टता और संवेदनशीलता की गणना की जाती है, क्या यहां संदर्भ आबादी की व्यापकता मायने रखती है? क्या वे जिसका जिक्र कर रहे हैं? यदि ऐसा है, तो क्या कार्य है?

जवाबों:


4

यद्यपि @ टिम ♦ का और @ गंग का जवाब सब कुछ बहुत कवर करता है, मैं उन दोनों को एक एकल में संश्लेषित करने और आगे स्पष्टीकरण प्रदान करने का प्रयास करूंगा।

उद्धृत पंक्तियों का संदर्भ ज्यादातर एक निश्चित थ्रेशोल्ड के रूप में नैदानिक ​​परीक्षणों को संदर्भित कर सकता है, जैसा कि सबसे आम है। एक बीमारी कल्पना करें , और स्वस्थ राज्य सहित अलावा सब कुछ रूप में संदर्भित किया जाता है । हम, हमारे परीक्षण के लिए, कुछ प्रॉक्सी माप प्राप्त करना चाहते हैं जो हमें लिए एक अच्छी भविष्यवाणी प्राप्त करने की अनुमति देता है । (1) इसका कारण हमें पूर्ण विशिष्टता / संवेदनशीलता नहीं मिलती है, यह है कि हमारी प्रॉक्सी मात्रा का मान पूरी तरह से सहसंबंधित नहीं है। रोग की स्थिति लेकिन आम तौर पर इसके साथ संबद्ध होते हैं, और इसलिए, व्यक्तिगत माप में, हमारे पास लिए हमारी मात्रा को पार करने की उस मात्रा का एक मौका हो सकता है।डी डी सी डी डी सी सीDDDcDDcव्यक्तियों और इसके विपरीत। स्पष्टता के लिए, आइए परिवर्तनशीलता के लिए एक गाऊसी मॉडल मानें।

हम कहते हैं कि हम प्रॉक्सी मात्रा के रूप में का उपयोग कर रहे हैं । यदि को अच्छी तरह से चुना गया है, तो ( अपेक्षित मान ऑपरेटर है) से अधिक होना चाहिए । अब समस्या तब पैदा होती है जब हमें पता चलता है कि एक समग्र स्थिति है (इसलिए ), वास्तव में गंभीरता के 3 ग्रेड से बना है , , , प्रत्येक लिए उत्तरोत्तर बढ़ते मूल्य के साथ । एक एकल व्यक्ति के लिए, श्रेणी से या से चयनितएक्सxx[ एक्स डी सी ] डी डी सी डी 1 डी 2 डी 3 एक्स डी डी सी एक्स टी डी डी सी एक्स टी डी एक्स डी सीE[xD]E[xDc]EDDcD1D2D3xDDcश्रेणी, 'परीक्षण' के सकारात्मक आने या न होने की संभावनाएं हमारे द्वारा चुने गए सीमा मूल्य पर निर्भर करेंगी। हम कहते हैं कि हम और दोनों व्यक्तियों के लिए सही मायने में यादृच्छिक नमूने का अध्ययन करने के आधार पर चुनते हैं । हमारा कुछ गलत सकारात्मक और नकारात्मक कारण देगा। यदि हम एक व्यक्ति को अनियमित रूप से चुनते हैं , तो हरे रंग के ग्राफ द्वारा दिए गए उसके / उसके मान को नियंत्रित करने वाली संभावना , और लाल ग्राफ द्वारा एक यादृच्छिक रूप से चुने गए व्यक्ति को।xTDDcxTDxDcयहां छवि विवरण दर्ज करें

प्राप्त वास्तविक संख्या और व्यक्तियों की वास्तविक संख्या पर निर्भर करेगी लेकिन परिणामी विशिष्टता और संवेदनशीलता नहीं होगी। आज्ञा देना एक संचयी संभावना समारोह है। फिर, के प्रसार के लिए रोग के , यहाँ एक 2x2 तालिका के रूप में सामान्य स्थिति की उम्मीद होगी है, जब हम वास्तव में संयुक्त जनसंख्या में कैसे को देखने के लिए हमारे परीक्षण प्रदर्शन का प्रयास करें।डी सी एफ ( ) पी डीDDcF()pD

(D,+)=p(1FD(xT))
(Dc,)=(1p)(1FDc(xT))
(D,)=p(FD(xT))
(Dc,+)=(1p)FDc(xT)

वास्तविक संख्या निर्भर हैं, लेकिन संवेदनशीलता और विशिष्टता स्वतंत्र हैं। लेकिन, ये दोनों और पर निर्भर हैं । इसलिए, सभी कारक जो इन्हें प्रभावित करते हैं, निश्चित रूप से इन मैट्रिक्स को बदल देंगे। यदि हम उदाहरण के लिए, ICU में काम कर रहे हैं, तो हमारे को द्वारा प्रतिस्थापित किया जाएगा , और यदि हम बारे में बात कर रहे हैं, तो द्वारा प्रतिस्थापित किया जाएगा । यह अलग बात है कि अस्पताल में, प्रचलन भी अलग है,ppFDFDcFDFD3FD1लेकिन यह अलग-अलग प्रचलन नहीं है जो संवेदनाओं और विशिष्टताओं को अलग-अलग कर रहा है, लेकिन अलग-अलग वितरण, क्योंकि जिस मॉडल पर सीमा को परिभाषित किया गया था, वह आउट पेशेंट, या inpatients के रूप में दिखाई देने वाली आबादी पर लागू नहीं था । आप आगे जा सकते हैं और कई उप-योगों में को तोड़ सकते हैं, के inpatient उप-भाग को फिर से अन्य कारणों से उठाया भी हो सकता है (क्योंकि अधिकांश प्रॉक्सी भी अन्य गंभीर परिस्थितियों में 'उन्नत' हैं)। की तोड़कर उप-जनसंख्या में जनसंख्या संवेदनशीलता में परिवर्तन बताते हैं, जबकि की कि आबादी (विशिष्टता में परिवर्तन बताते हैं इसी में परिवर्तन से औरDcDcxDDcFDFDc )। यह वह है जो समग्र ग्राफ़ में वास्तव में शामिल है। प्रत्येक रंग में वास्तव में अपने स्वयं के , और इसलिए, जब तक यह से भिन्न होता है जिस पर मूल संवेदनशीलता और विशिष्टता की गणना की गई थी, ये मैट्रिक्स बदल जाएंगे।DFF

यहां छवि विवरण दर्ज करें

उदाहरण

क्रमशः 10000 Dc, 500,750,300 D1, D2, D3 के साथ 11550 की आबादी मान लें। टिप्पणी किया गया भाग उपरोक्त ग्राफ़ के लिए प्रयुक्त कोड है।

set.seed(12345)
dc<-rnorm(10000,mean = 9, sd = 3)
d1<-rnorm(500,mean = 15,sd=2)
d2<-rnorm(750,mean=17,sd=2)
d3<-rnorm(300,mean=20,sd=2)
d<-cbind(c(d1,d2,d3),c(rep('1',500),rep('2',750),rep('3',300)))
library(ggplot2)
#ggplot(data.frame(dc))+geom_density(aes(x=dc),alpha=0.5,fill='green')+geom_density(data=data.frame(c(d1,d2,d3)),aes(x=c(d1,d2,d3)),alpha=0.5, fill='red')+geom_vline(xintercept = 13.5,color='black',size=2)+scale_x_continuous(name='Values for x',breaks=c(mean(dc),mean(as.numeric(d[,1])),13.5),labels=c('x_dc','x_d','x_T'))

#ggplot(data.frame(d))+geom_density(aes(x=as.numeric(d[,1]),..count..,fill=d[,2]),position='stack',alpha=0.5)+xlab('x-values')

हम आसानी से Dc, D1, D2, D3 और कम्पोजिट D सहित विभिन्न आबादी के लिए x- साधनों की गणना कर सकते हैं।

mean(dc) 
mean(d1) 
mean(d2) 
mean(d3) 
mean(as.numeric(d[,1]))

> mean(dc) [1] 8.997931
> mean(d1) [1] 14.95559
> mean(d2) [1] 17.01523
> mean(d3) [1] 19.76903
> mean(as.numeric(d[,1])) [1] 16.88382

हमारे मूल टेस्ट केस के लिए 2x2 टेबल प्राप्त करने के लिए, हम पहले डेटा के आधार पर एक थ्रेशोल्ड सेट करते हैं (जो @gung शो के रूप में परीक्षण चलाने के बाद वास्तविक मामले में सेट किया जाएगा)। वैसे भी, 13.5 की सीमा मानकर, संपूर्ण जनसंख्या पर गणना करने पर हमें निम्नलिखित संवेदनशीलता और विशिष्टता प्राप्त होती है।

sdc<-sample(dc,0.1*length(dc)) 
sdcomposite<-sample(c(d1,d2,d3),0.1*length(c(d1,d2,d3))) 
threshold<-13.5 
truepositive<-sum(sdcomposite>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sdcomposite<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity<-truepositive/length(sdcomposite) 
specificity<-truenegative/length(sdc) 
print(c(sensitivity,specificity))

> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]139 928  72  16
> print(c(sensitivity,specificity)) [1] 0.8967742 0.9280000

आइए हम मान लें कि हम आउट पेशेंट के साथ काम कर रहे हैं, और हम रोगग्रस्त रोगियों को केवल डी 1 अनुपात से प्राप्त करते हैं, या हम आईसीयू में काम कर रहे हैं जहां हमें केवल डी 3 मिलता है। (अधिक सामान्य मामले के लिए, हमें डीसी घटक को भी विभाजित करने की आवश्यकता है) हमारी संवेदनशीलता और विशिष्टता कैसे बदलती है? व्यापकता को बदलने से (यानी किसी भी मामले से संबंधित रोगियों के सापेक्ष अनुपात में परिवर्तन करके, हम विशिष्टता और संवेदनशीलता को बिल्कुल भी नहीं बदलते हैं। यह सिर्फ इतना होता है कि यह प्रसार भी बदलते वितरण के साथ बदल जाता है)

sdc<-sample(dc,0.1*length(dc)) 
sd1<-sample(d1,0.1*length(d1)) 
truepositive<-sum(sd1>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sd1<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity1<-truepositive/length(sd1) 
specificity1<-truenegative/length(sdc) 
print(c(sensitivity1,specificity1)) 
sdc<-sample(dc,0.1*length(dc)) 
sd3<-sample(d3,0.1*length(d3)) 
truepositive<-sum(sd3>13.5) 
truenegative<-sum(sdc<=13.5) 
falsepositive<-sum(sdc>13.5) 
falsenegative<-sum(sd3<=13.5) 
print(c(truepositive,truenegative,falsepositive,falsenegative)) 
sensitivity3<-truepositive/length(sd3) 
specificity3<-truenegative/length(sdc) 
print(c(sensitivity3,specificity3))

> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]  38 931  69  12
> print(c(sensitivity1,specificity1)) [1] 0.760 0.931
> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]  30 944  56   0
> print(c(sensitivity3,specificity3)) [1] 1.000 0.944

संक्षेप में, संवेदनशीलता के परिवर्तन को दिखाने के लिए एक भूखंड (विशिष्टता एक समान प्रवृत्ति का पालन करेगी हमने आबादी के लिए अलग-अलग मीन एक्स के साथ डीसी आबादी की रचना भी की थी), यहां एक ग्राफ है

df<-data.frame(V1=c(sensitivity,sensitivity1,sensitivity3),V2=c(mean(c(d1,d2,d3)),mean(d1),mean(d3))) 
ggplot(df)+geom_point(aes(x=V2,y=V1),size=2)+geom_line(aes(x=V2,y=V1))

यहां छवि विवरण दर्ज करें

  1. यदि यह प्रॉक्सी नहीं है, तो हम तकनीकी रूप से 100% विशिष्टता और संवेदनशीलता रखेंगे। उदाहरण के लिए कहें कि हम को लिवर बायोप्सी के रूप में एक विशेष रूप से परिभाषित पैथोलॉजिकल तस्वीर के रूप में परिभाषित करते हैं, तो लिवर बायोप्सी परीक्षण सोने का मानक बन जाएगा और हमारी संवेदनशीलता को खुद के खिलाफ मापा जाएगा और इसलिए 100% उपज होगीD

9

सबसे पहले, यह पहचानने योग्य है कि आप आमतौर पर विशिष्टता के स्वतंत्र रूप से संवेदनशीलता को नहीं बदल सकते हैं, और इसके विपरीत। यह एक आरओसी वक्र का बिंदु है। डेटा जनरेट करने की प्रक्रिया की प्रकृति, और आपके विशिष्ट डेटा और मॉडल को देखते हुए, आप हमेशा संवेदनशीलता और विशिष्टता के बीच कुछ ट्रेडऑफ़ से चिपके रहेंगे। आप निश्चित रूप से एक ही समय में 100% संवेदनशीलता और 100% विशिष्टता रखना पसंद करेंगे, लेकिन आमतौर पर आप ऐसा नहीं कर सकते। आप बेहतर संवेदनशीलता प्राप्त कर सकते हैं, लेकिन बदतर विशिष्टता, या बेहतर विशिष्टता की कीमत पर, लेकिन सबसे खराब संवेदनशीलता की कीमत पर। आरओसी वक्र आपको उन ट्रेडऑफ के सेट को दिखाता है जिन्हें आप के बीच चयन करने के लिए मजबूर किया जाता है। (नोटों की एक जोड़ी: 1. आप कभी-कभी एक आयाम पर दूसरे पर कुछ खोए बिना प्राप्त कर सकते हैं क्योंकि आपके डेटासेट में एक अंतर है, लेकिन यह ज्यादातर भ्रम है; 2आरओसी वक्र संवेदनशीलता 1-विशिष्टता के एक समारोह के रूप में है, संवेदनशीलता बनाम विशिष्टता की साजिश रचने के लिए स्वयं एक प्रतिबिंबित आरओसी वक्र होगा।)

यहां छवि विवरण दर्ज करें

किसी भी दर पर, प्रसार के साथ स्पष्ट संवेदनशीलता और विशिष्टता कैसे बदल सकती है? यह एक ऐसा मुद्दा है जहां यह कुछ डेटा के साथ अनुकरण और खेलने में मदद करता है कि यह कैसे व्यवहार में काम कर सकता है। आइए कल्पना करें कि एक मॉडल काफी बड़े डेटासेट के लिए फिट है जिसमें एक विशेष प्रचलन है, और एक्स-अक्ष 1 पर एक सीमा निर्धारित है । बाद में, इस परीक्षण के प्रदर्शन की गणना उन नमूनों के साथ की जाती है जिनके अलग-अलग प्रचलन हैं (और इस प्रकार अलग-अलग x-मान)। परिणाम यह है कि एक ही मॉडल, एक ही सीमा का उपयोग करते समय अलग-अलग प्रचलन के साथ डेटासेट पर लागू किया जाएगा।

library(caret)  # we'll use these packages
library(binom)
  # we'll use this function to convert log odds to probabilities
lo2p = function(lo){ exp(lo)/(1+exp(lo)) }

##### training dataset for original model
set.seed(734)                     # these make the examples exactly reproducible
Nt = 1000
xt = rnorm(Nt, mean=5, sd=1)      # this is the distribution of X
lo = -1.386 + .308*xt             # this is the data generating process
pt = lo2p(lo)
yt = rbinom(Nt, size=1, prob=pt)
mt = glm(yt~xt, family=binomial)
summary(mt)
# ...
# Coefficients:
#             Estimate Std. Error z value Pr(>|z|)    
# (Intercept) -1.16736    0.32794  -3.560 0.000371 ***
# xt           0.24980    0.06429   3.886 0.000102 ***
# ...
#     Null deviance: 1384.5  on 999  degrees of freedom
# Residual deviance: 1369.1  on 998  degrees of freedom
# AIC: 1373.1

## determine threshold
# prob(Y) = 50%, where log odds = 0, so:
-coef(mt)[1]/coef(mt)[2]  # 4.673159
threshold = 4.7  # a simple round number
classt    = ifelse(xt>threshold, 1, 0)
tabt      = table(classt, yt)[2:1,2:1]

confusionMatrix(tabt)
#       yt
# classt   1   0
#      1 346 279
#      0 175 200
#                                           
#                Accuracy : 0.546           
#                     ...                                          
#             Sensitivity : 0.6641          
#             Specificity : 0.4175          
#          Pos Pred Value : 0.5536          
#          Neg Pred Value : 0.5333          
#              Prevalence : 0.5210          


##### high prevalence dataset from hospital
set.seed(4528)
Nh = 500
xh = rnorm(Nh, mean=6, sd=1)  # a different distribution of X
lo = -1.386 + .308*xh         # but the same data generating process
ph = lo2p(lo)
yh = rbinom(Nh, size=1, prob=ph)
classh = ifelse(xh>threshold, 1, 0)  # the same threshold is used
tabh   = table(classh, yh)[2:1,2:1]

confusionMatrix(tabh)
#       yh
# classh   1   0
#      1 284 163
#      0  20  33
#                                           
#                Accuracy : 0.634           
#                     ...
#             Sensitivity : 0.9342          
#             Specificity : 0.1684          
#          Pos Pred Value : 0.6353          
#          Neg Pred Value : 0.6226          
#              Prevalence : 0.6080          


##### low prevalence dataset from outpatients
set.seed(1027)
Nl = 500
xl = rnorm(Nl, mean=3, sd=1)
lo = -1.386 + .308*xl
pl = lo2p(lo)
yl = rbinom(Nl, size=1, prob=pl)
classl = ifelse(xl>threshold, 1, 0)
tabl   = table(classl, yl)[2:1,2:1]

confusionMatrix(tabl)
#       yl
# classl   1   0
#      1   9  14
#      0 190 287
#                                           
#                Accuracy : 0.592           
#                     ...
#             Sensitivity : 0.04523         
#             Specificity : 0.95349         
#          Pos Pred Value : 0.39130         
#          Neg Pred Value : 0.60168         
#              Prevalence : 0.39800         


##### sensitivities
binom.confint(346, 521, method="e")
#   method   x   n      mean     lower    upper
# 1  exact 346 521 0.6641075 0.6217484 0.704592
binom.confint(284, 304, method="e")
#   method   x   n      mean   lower     upper
# 1  exact 284 304 0.9342105 0.90022 0.9593543
binom.confint(  9, 199, method="e")
#   method x   n       mean      lower      upper
# 1  exact 9 199 0.04522613 0.02088589 0.08411464

##### specificities
binom.confint(200, 479, method="e")
#   method   x   n      mean     lower     upper
# 1  exact 200 479 0.4175365 0.3729575 0.4631398
binom.confint( 33, 196, method="e")
#   method  x   n      mean     lower     upper
# 1  exact 33 196 0.1683673 0.1188206 0.2282441
binom.confint(287, 301, method="e")
#   method   x   n      mean     lower     upper
# 1  exact 287 301 0.9534884 0.9231921 0.9743417

सटीक 95% आत्मविश्वास अंतराल के साथ, प्रचलितताओं के एक समारोह के रूप में संवेदनशीलता और विशिष्टताएं हैं:

यहां छवि विवरण दर्ज करें

तो यहां क्या हो रहा है? विचार करें कि एक प्रोटोटाइप लॉजिस्टिक रिग्रेशन नीचे दिए गए आंकड़े की तरह लग सकता है। ध्यान दें कि सभी 'क्रिया' x- अक्ष पर अंतराल [4, 6] में हो रही है। नीचे दिए गए डेटा में बहुत कम प्रसार होगा, और मॉडल खराब भेदभाव और संवेदनशीलता दिखाएगा। उस अंतराल से ऊपर के डेटा में बहुत अधिक प्रचलन होगा, लेकिन मॉडल फिर से अच्छी तरह से भेदभाव नहीं करेगा और खराब विशिष्टता होगी।

यहां छवि विवरण दर्ज करें

यह समझने में मदद करने के लिए कि यह कैसे हो सकता है, यह निर्धारित करने के लिए कि रोगी का लिवर 2 फेल हो रहा है या नहीं, यह निर्धारित करने के लिए ऐलेनिन ट्रांसमिनेज़ के परीक्षण पर विचार करें। विचार यह है कि लीवर सामान्य रूप से एएलटी का उपयोग करता है, लेकिन अगर लिवर ने काम करना बंद कर दिया है तो एएलटी को रक्त प्रवाह में डंप किया जाएगा। इसलिए यदि किसी मरीज के रक्तप्रवाह में ALT का स्तर कुछ सीमा से ऊपर है, तो इसका मतलब है कि लीवर विफल हो रहा है। यदि आप जिगर की विफलता के उच्च प्रसार के साथ एक नमूना बनाते हैं, तो आप रक्त में एएलटी के उच्च स्तर के साथ एक नमूना तैयार करेंगे। इस प्रकार, आपके पास थ्रेशोल्ड से अधिक रोगी होंगे। एएलटी के उच्च रक्त स्तर वाले सभी लोगों में यकृत की विफलता नहीं होगी - कुछ रोगियों के लिए कुछ अन्य कारण होंगे। लेकिन जिगर की विफलता वाले लोगों को पकड़ा जाना चाहिए। इससे उच्च संवेदनशीलता होती है। इसी तरह, एएलटी के सामान्य स्तर वाले सभी रोगियों में स्वस्थ लिवर नहीं होते हैं, लेकिन कम प्रसार वाले एक नमूने में एएलटी के निम्न स्तर होंगे, और अधिक रोगी परीक्षण पास करेंगे। जिनकी नदियां उठीं ' t असफल होना, लेकिन जिनके पास ALT के सामान्य स्तर हैं वे छूट जाएंगे। यह कम संवेदनशीलता की ओर जाता है, लेकिन उच्च विशिष्टता।

आम तौर पर, एक चिकित्सा परीक्षण का पूरा विचार यह है कि कुछ या अन्य एक बीमारी की स्थिति का एक सहसंबंध है जिसे आप सीधे उपाय करना पसंद कर सकते हैं, लेकिन नहीं कर सकते। सहसंबंध का एक उपाय प्राप्त करने से आपको रोग की स्थिति का पता चलता है। ए (संभावित) परीक्षण जहां यह सच नहीं है, इसका कोई मूल्य नहीं होगा और इसका उपयोग नहीं किया जाएगा। इस प्रकार व्यवहार में, उच्च प्रसार के नमूनों में अधिक असामान्य मूल्यों के साथ सहसंबंध का वितरण होना चाहिए, जो उच्च संवेदनशीलता और इसके विपरीत होता है। (ध्यान दें कि सहसंबंध बीमारी का कारण नहीं है; एएलटी उदाहरण में, यह एक प्रभाव है, अन्य उदाहरणों में, बीमारी और सहसंबंध दोनों एक सामान्य कारण के प्रभाव हो सकते हैं, आदि)

1. यह वास्तव में दवा में काफी आम है। विचार करें कि कोलेस्ट्रॉल <200 होना चाहिए, सिस्टोलिक रक्तचाप <140 होना चाहिए, आदि वे वास्तव में प्रति परीक्षण 'परीक्षण' नहीं हैं, लेकिन बहुत सारे परीक्षण हैं जो इस तरह से काम करते हैं। थ्रेसहोल्ड पर कुछ (शायद दूर की) संबंधित चर्चाओं के लिए, क्या यह मेरे जवाब पढ़ने में मदद कर सकता है कि क्या 0-1 थ्रेसहोल्ड हमेशा x- अक्ष की परतों के बराबर होते हैं? , और नमूना आकार से स्वतंत्र झूठी सकारात्मक संख्या क्यों है, अगर हम दो स्वतंत्र डेटासेट की तुलना करने के लिए पी-मान का उपयोग करते हैं?
2. कृपया ध्यान रखें कि मैं एक चिकित्सक नहीं हूं, और यह उदाहरण अच्छी तरह से बुरी तरह से पीड़ित हो सकता है। एक वास्तविक चिकित्सक से पूछें कि क्या आप लिवर फंक्शन, इसके परीक्षण और संबंधित मामलों की सटीक जानकारी चाहते हैं।


धन्यवाद! यह दिखाने के लिए कि यह वास्तव में परिवर्तन करता है। लेकिन यह @Tim के उत्तर पर विचार कैसे करता है? क्या यह विरोधाभासी नहीं है?
पॉलीसिट्टी

1
@ पॉलिसट्टी, टिम कहते हैं कि, "इन-पेशेंट और आउट पेशेंट कई पहलुओं में भिन्न हो सकते हैं, केवल प्रचलन में ही नहीं, इसलिए कुछ अन्य कारक संवेदनशीलता को प्रभावित कर सकते हैं"। यदि परीक्षण रोगियों की कुछ संपत्ति (कहते हैं, कोलेस्ट्रॉल) का एक कार्य है, और रोग दृढ़ता से सहसंबंधित है w / उस संपत्ति के साथ ही (जो आमतौर पर पूरे बिंदु है), तो "अन्य कारकों" को संयोजन w / में स्थानांतरित करना चाहिए प्रचलन। इस प्रकार, जब व्यापकता में परिवर्तन होता है, तो अन्य सहसंबंध बदल जाते हैं, और परीक्षण में कम या ज्यादा संवेदनशीलता w / i है जो कि विशिष्ट समूह है।
गुंग - को पुनः स्थापित मोनिका

7

जैसा कि पहले ही दूसरों ने कहा है, संवेदनशीलता और विशिष्टता व्यापकता पर निर्भर नहीं करती है। संवेदनशीलता सभी सकारात्मकताओं के बीच वास्तविक सकारात्मकता का अनुपात है और विशिष्टता सभी नकारात्मकताओं के बीच सही नकारात्मक का अनुपात है। इसलिए यदि संवेदनशीलता 90% है, तो परीक्षण 90% मामलों के लिए सही होगा जो सकारात्मक हैं। स्पष्ट रूप से 90% कुछ छोटा है और कुछ बड़ा 90% अभी भी 90% है ...

इसलिए आपके द्वारा उल्लिखित सारणीबद्ध डेटा,

positiveconditionnegativeconditionpositivetestacnegativetestbd

संवेदनशीलता (से) है सशर्त संभाव्यता की परिभाषा ) और विशिष्टता । प्रत्येक मैट्रिक्स के लिए, आप उस समय केवल एक कॉलम को देखते हैं, इसलिए उन मीट्रिक के लिए व्यापकता (स्तंभों के सापेक्ष आकार) कोई मायने नहीं रखते हैं। व्यापकता समीकरणों में नहीं आती है। इसके अलावा यह अजीब होगा अगर "व्यावहारिक" संवेदनशीलता को अलग-अलग रूप से परिभाषित किया गया और फिर अलग-अलग निष्कर्ष निकाले गए।aa+b+c+d/a+ba+b+c+d=aa+b p(YX)=p(YX)p(X)da+b+c+d/c+da+b+c+d=dc+d

लेकिन बोली कुछ और भी लगती है

अस्पताल में भर्ती मरीजों में परीक्षण संवेदनशीलता अधिक होगी, और बाह्य रोगियों में परीक्षण विशिष्टता अधिक होगी

इसलिए लेखक कहते हैं कि संवेदनशीलता विभिन्न समूहों में भिन्न होती है। मुझे लगता है कि केवल कुछ प्रचलन में ही नहीं, बल्कि कुछ अन्य कारकों में संवेदनशीलता प्रभावित हो सकती है। इसलिए मैं मानता हूं कि वे अलग-अलग डेटासेट के बीच बदल सकते हैं, जो कि प्रचलन में भिन्न हैं, लेकिन परिवर्तन स्वयं प्रचलन का कार्य नहीं होगा (जैसा कि उनके उत्तर में @gung द्वारा दिखाया गया है )।

दूसरी ओर, यदि मुझे अनुमान लगाना था, तो शायद लेखक पश्चगामी संभावना के साथ संवेदनशीलता को भ्रमित कर रहे हैं । संवेदनशीलता , जबकि पीछे की संभावना हैp(positive testcondition)

p(conditionpositive test)p(positive testcondition)×p(condition)

और कई मामलों में यह संभावना है कि लोगों में दिलचस्पी है ("सकारात्मक परीक्षण के परिणाम के साथ रोगी को वास्तव में बीमारी कैसे होती है?") और यह व्यापकता पर निर्भर करता है। ध्यान दें कि आपके लिंक पर भी सकारात्मक भविष्यवाणी मूल्य पर प्रभाव के प्रभाव पर चर्चा की जाती है, यानी बाद की संभावना, संवेदनशीलता पर नहीं।


जैसा कि मैंने पिछले जवाबों में से एक में उल्लेख किया है, मुझे पूरा यकीन है कि ऑक्टोरेटर्स ने इसे बाद की संभावना के साथ भ्रमित नहीं किया, क्योंकि वे स्पष्ट रूप से उल्लेख करते हैं कि "कई ग्रंथ अभी भी यह बयान करते हैं"। और मैं एक अन्य स्रोत भी उद्धृत करता हूं, एलथोगुह हैरिसन के रूप में विश्वसनीय नहीं है, जो कहता है कि यह एक सुरक्षित 'धारणा' है। मैं केवल इतना पूछना चाहता हूं कि 'धारणा' क्या है?
21

2
@ रिपब्लिक मैं लेखकों के लिए नहीं कह सकता, लेकिन उद्धरण से, वे स्वतंत्रता को "धारणा" के रूप में कहते हैं, लेकिन यह एक गणितीय तथ्य है। अगर यह पकड़ में नहीं आया, तो इसका मतलब होगा कि संभावना सिद्धांत टूट गया है और ऐसा नहीं है।
टिम

संवेदनशीलता और विशिष्टता को नैदानिक ​​परीक्षण के निश्चित गुण माना जा सकता है। [यह एक मामूली सरलीकरण है, लेकिन यह हमारे उद्देश्यों के लिए पर्याप्त है]। - यह क्या कहता है
Polisetty

3

मेरा जवाब यहाँ देखें सत्य / असत्य सकारात्मक / नकारात्मक दर पर।

संवेदनशीलता सकारात्मक सकारात्मक दर के लिए सिर्फ एक और नाम है, और विशिष्टता वास्तविक नकारात्मक दर के समान है। संवेदनशीलता और विशिष्टता दोनों सशर्त संभावनाएं हैं; वे रोगी की बीमारी की स्थिति पर शर्त लगाते हैं। इस प्रकार रोग की व्यापकता (अर्थात एक प्राथमिकता संभावना है कि एक मरीज को बीमारी है) अप्रासंगिक है, क्योंकि आप एक विशेष बीमारी की स्थिति मान रहे हैं ।

मैं इस बात पर टिप्पणी नहीं कर सकता कि पाठ्यपुस्तक के लेखक का दावा है कि संवेदनशीलता और विशिष्टता नैदानिक ​​संदर्भ पर निर्भर करती है। क्या ये अनुभवजन्य अवलोकन हैं?


बिल्कुल सही। इसलिए सवाल। एक परीक्षण की संवेदनशीलता जनसंख्या पर निर्भर करती है जहां उपयोग किया जाता है। स्वतंत्र होने की धारणा हमेशा सच नहीं होती है। मैं पूछ रहा हूं कि कैसे और क्यों। पुस्तक बाद में मूल्यों को भी उद्धृत करती है
पॉलिसटेटी

जनसंख्या-विशिष्ट कारक हो सकते हैं जो संवेदनशीलता और विशिष्टता को प्रभावित करते हैं। लेकिन यह संवेदनशीलता और विशिष्टता की गणितीय परिभाषाओं से है कि व्यापकता इन कारकों में से एक नहीं हो सकती है, कम से कम सीधे नहीं। (वैसे, मेरे जवाब को स्वीकार करने के लिए स्वतंत्र महसूस करें यदि आप गणितीय परिभाषाओं के मेरे स्पष्टीकरण से संतुष्ट हैं।)
tddevlin

क्षमा करें, मुझे लगता है कि यह स्पष्ट नहीं था। मैं गणितीय रूप से संवेदनशीलता और व्यापकता के बीच संबंध जानना चाहता था। मुझे पता है कि वे कैसे परिभाषित हैं। मुझे लगता है कि जिस तरह से उनकी गणना की जाती है, उसके कारण संबंध आता है। संवेदनशीलता tp / / (tp + fn) है, जबकि प्रचलन tp + fn / / (tp + fn + fp + tn) है
Polisetty

P(Disease)P(+|disease)

हैरिसन यह गलत नहीं होगा। यहां तक ​​कि यह लिंक इसे सरलीकरण भी कहता है। med.uottawa.ca/sim/data/Sunning_and_Prevalence_e.htm
पुलिस

1

मैं, लेखक के इरादों के बारे में नहीं बोल सकता, लेकिन यहाँ उस कथन के लिए मेरा तर्क होगा:

नैदानिक ​​परीक्षण के रूप में नैदानिक ​​संदर्भ पर विचार करें। के साथ एक बहुत ही गरीब संवेदनशीलता और विशिष्टता है, लेकिन एक परीक्षण से कोई भी कम। यदि आप अस्पताल में हैं, तो आपके बीमार होने की संभावना है। यदि आप अस्पताल में नहीं हैं, तो आपके बीमार होने की संभावना नहीं है।

इस दृष्टिकोण से, आप जो वास्तविक नैदानिक ​​परीक्षण करते हैं, वह वास्तव में धारावाहिक में किए गए दो परीक्षणों का दूसरा भाग है।


आपकी व्याख्या में, प्राथमिकता बड़ी पश्चगामी संभावना के लिए बदल रही है। यह सच है। लेकिन संवेदनशीलता कैसे बदलती है यह सवाल है।
21

@Polisetty क्या होगा यदि आप एक उच्च पोस्टीरियर को सकारात्मक परीक्षण कहते हैं? "नैदानिक ​​संदर्भ अपने आप में एक परीक्षा है।" मुझे लगता है कि किसी भी मनमाने ढंग से तय किए गए परीक्षण को इस तरह से व्यापकता पर निर्भर किया जा सकता है, इसलिए "परीक्षण" को विशेष रूप से परिभाषित किया जाना चाहिए। मुझे लगता है कि कथन कुछ प्रॉक्सी माप की सीमा के आधार पर सामान्य किस्म के परीक्षणों पर लागू होता है।
सात्विक पसान

1

यह एक गलती होनी चाहिए। मुझे लगता है कि शायद लेखक यह सुझाव देने की कोशिश कर रहा है कि सकारात्मक और नकारात्मक भविष्य कहनेवाला मूल्य (पीपीवी और एनपीवी) व्यापकता (साथ ही संवेदनशीलता और विशिष्टता) पर निर्भर हैं। ये अक्सर नैदानिक ​​परीक्षणों और एक चिकित्सक से चर्चा की जाती हैं, शायद संवेदनशीलता और विशिष्टता की कच्ची व्याख्या की तुलना में अधिक मूल्यवान।

यह ग्राफ 95% संवेदनशीलता और 85% विशिष्टता के साथ परीक्षण के लिए, पीपीवी और एनपीवी के बीच के संबंधों को व्यापकता के साथ प्रदर्शित करता है।

मौसनर जेएस से, क्रेमर एस: मौसनेर और बान एपिडेमियोलॉजी: एक परिचयात्मक पाठ।  फिलाडेल्फिया, डब्ल्यूबी सॉन्डर्स, 1985, पी।  221।

मौसनर जेएस से, क्रेमर एस: मौसनेर और बान एपिडेमियोलॉजी: एक परिचयात्मक पाठ। फिलाडेल्फिया, डब्ल्यूबी सॉन्डर्स, 1985, पी। 221।


1

@Satwik, @gung और @Tim ने पहले ही बहुत विस्तार प्रदान कर दिया है, लेकिन मैं कोशिश करूँगा और एक छोटा सा उदाहरण जोड़ूंगा कि कैसे अंतर्निहित कारकों का मामला इस तरह के प्रभाव का कारण बन सकता है।

एक प्रमुख सिद्धांत: पूर्वाग्रह

संवेदनशीलता / विशिष्टता और सभी सांख्यिकीय परीक्षण समान चेतावनी साझा करते हैं: यह केवल एक ही तरीके से पहले की तरह ही नमूना प्रक्रिया को दोहराने के लिए लागू होता है।

अस्पताल ऐसे कार्यशील संगठन हैं जो पक्षपाती नमूना तैयार करने के लिए डिज़ाइन किए गए हैं, जो प्रवेश और उपचार की आवश्यकता वाले सामान्य आबादी को नीचे फ़िल्टर करने के लिए प्रवेश नीतियों का उपयोग करते हैं। यह वैज्ञानिक प्रक्रिया का बहुत विरोधी है। यदि आप जानना चाहते हैं कि एक परीक्षण अलग-अलग आबादी में कैसा प्रदर्शन करता है, तो इसे अलग-अलग आबादी में परीक्षण करने की आवश्यकता होती है।

अव्यक्त प्रभाव: सहसंबंध

एक रोग के लिए अन्य सभी जोखिम कारकों के लिए स्वतंत्र / ऑर्थोगोनल होने के लिए एक निदान के लिए (यदि आप सख्त होना चाहते हैं तो यह वास्तविक दुनिया में असंभव है), इसलिए कुछ हद तक सहसंबंध है।

यदि अस्पताल में प्रवेश के लिए स्क्रीन को नैदानिक ​​रूप से सकारात्मक रूप से सहसंबंधित किया जाता है, तो आप क्या पाएंगे कि प्रवेश परीक्षा पास करने वाले लोग नैदानिक ​​रूप से सहसंबंध के आनुपातिक रूप से सकारात्मक परिणामों के लिए पूर्वनिर्मित हैं। इस प्रकार सच्चे सकारात्मक को समृद्ध किया जाता है और झूठी नकारात्मक को सहसंबंध के अनुपात में घटाया जाता है।

इसके बाद संवेदनशीलता बड़ी दिखाई देती है।

घटना की व्याख्या

एक अवलोकन कि संवेदनशीलता अस्पताल आधारित संदर्भ में अधिक हो सकती है इसलिए अवास्तविक नहीं है। वास्तव में अगर प्रवेश नीति अच्छी तरह से सोचा गया है और उद्देश्य के लिए फिट है तो यह होने की उम्मीद होगी।

यह इस धारणा में टूटने का सबूत नहीं है कि संवेदनशीलता और विशिष्टता व्यापकता स्वतंत्र है, बल्कि यह अस्पताल में प्रवेश नीति के आधार पर एक पक्षपाती नमूने का सबूत है।

जो, लोगों को इलाज करने और वैज्ञानिक प्रयोग न करने के लिए एक अस्पताल दिया जाता है, निश्चित रूप से एक अच्छी बात है।

लेकिन यह वैज्ञानिकों को सिरदर्द देता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.