यद्यपि @ टिम ♦ का और @ गंग का जवाब सब कुछ बहुत कवर करता है, मैं उन दोनों को एक एकल में संश्लेषित करने और आगे स्पष्टीकरण प्रदान करने का प्रयास करूंगा।
उद्धृत पंक्तियों का संदर्भ ज्यादातर एक निश्चित थ्रेशोल्ड के रूप में नैदानिक परीक्षणों को संदर्भित कर सकता है, जैसा कि सबसे आम है। एक बीमारी कल्पना करें , और स्वस्थ राज्य सहित अलावा सब कुछ रूप में संदर्भित किया जाता है । हम, हमारे परीक्षण के लिए, कुछ प्रॉक्सी माप प्राप्त करना चाहते हैं जो हमें लिए एक अच्छी भविष्यवाणी प्राप्त करने की अनुमति देता है । (1) इसका कारण हमें पूर्ण विशिष्टता / संवेदनशीलता नहीं मिलती है, यह है कि हमारी प्रॉक्सी मात्रा का मान पूरी तरह से सहसंबंधित नहीं है। रोग की स्थिति लेकिन आम तौर पर इसके साथ संबद्ध होते हैं, और इसलिए, व्यक्तिगत माप में, हमारे पास लिए हमारी मात्रा को पार करने की उस मात्रा का एक मौका हो सकता है।डी डी सी डी डी सी सीडीडीडीसीडीडीसीव्यक्तियों और इसके विपरीत। स्पष्टता के लिए, आइए परिवर्तनशीलता के लिए एक गाऊसी मॉडल मानें।
हम कहते हैं कि हम प्रॉक्सी मात्रा के रूप में का उपयोग कर रहे हैं । यदि को अच्छी तरह से चुना गया है, तो ( अपेक्षित मान ऑपरेटर है) से अधिक होना चाहिए । अब समस्या तब पैदा होती है जब हमें पता चलता है कि एक समग्र स्थिति है (इसलिए ), वास्तव में गंभीरता के 3 ग्रेड से बना है , , , प्रत्येक लिए उत्तरोत्तर बढ़ते मूल्य के साथ । एक एकल व्यक्ति के लिए, श्रेणी से या से चयनितएक्सएक्सएक्सई [ एक्स डी सी ] ई डी डी सी डी 1 डी 2 डी 3 एक्स डी डी सी एक्स टी डी डी सी एक्स टी डी एक्स डी सीइ[ एक्सडी]इ[ एक्सडी सी]इडीडीसीडी1डी2D3xDDcश्रेणी, 'परीक्षण' के सकारात्मक आने या न होने की संभावनाएं हमारे द्वारा चुने गए सीमा मूल्य पर निर्भर करेंगी। हम कहते हैं कि हम और दोनों व्यक्तियों के लिए सही मायने में यादृच्छिक नमूने का अध्ययन करने के आधार पर चुनते हैं । हमारा कुछ गलत सकारात्मक और नकारात्मक कारण देगा। यदि हम एक व्यक्ति को अनियमित रूप से चुनते हैं , तो हरे रंग के ग्राफ द्वारा दिए गए उसके / उसके मान को नियंत्रित करने वाली संभावना , और लाल ग्राफ द्वारा एक यादृच्छिक रूप से चुने गए व्यक्ति को।xTDDcxTDxDc
प्राप्त वास्तविक संख्या और व्यक्तियों की वास्तविक संख्या पर निर्भर करेगी लेकिन परिणामी विशिष्टता और संवेदनशीलता नहीं होगी। आज्ञा देना एक संचयी संभावना समारोह है। फिर, के प्रसार के लिए रोग के , यहाँ एक 2x2 तालिका के रूप में सामान्य स्थिति की उम्मीद होगी है, जब हम वास्तव में संयुक्त जनसंख्या में कैसे को देखने के लिए हमारे परीक्षण प्रदर्शन का प्रयास करें।डी सी एफ ( ) पी डीDDcF()pD
(D,+)=p(1−FD(xT))
(Dc,−)=(1−p)(1−FDc(xT))
(D,−)=p(FD(xT))
(Dc,+)=(1−p)∗FDc(xT)
वास्तविक संख्या निर्भर हैं, लेकिन संवेदनशीलता और विशिष्टता स्वतंत्र हैं। लेकिन, ये दोनों और पर निर्भर हैं । इसलिए, सभी कारक जो इन्हें प्रभावित करते हैं, निश्चित रूप से इन मैट्रिक्स को बदल देंगे। यदि हम उदाहरण के लिए, ICU में काम कर रहे हैं, तो हमारे को द्वारा प्रतिस्थापित किया जाएगा , और यदि हम बारे में बात कर रहे हैं, तो द्वारा प्रतिस्थापित किया जाएगा । यह अलग बात है कि अस्पताल में, प्रचलन भी अलग है,ppFDFDcFDFD3FD1लेकिन यह अलग-अलग प्रचलन नहीं है जो संवेदनाओं और विशिष्टताओं को अलग-अलग कर रहा है, लेकिन अलग-अलग वितरण, क्योंकि जिस मॉडल पर सीमा को परिभाषित किया गया था, वह आउट पेशेंट, या inpatients के रूप में दिखाई देने वाली आबादी पर लागू नहीं था । आप आगे जा सकते हैं और कई उप-योगों में को तोड़ सकते हैं, के inpatient उप-भाग को फिर से अन्य कारणों से उठाया भी हो सकता है (क्योंकि अधिकांश प्रॉक्सी भी अन्य गंभीर परिस्थितियों में 'उन्नत' हैं)। की तोड़कर उप-जनसंख्या में जनसंख्या संवेदनशीलता में परिवर्तन बताते हैं, जबकि की कि आबादी (विशिष्टता में परिवर्तन बताते हैं इसी में परिवर्तन से औरDcDcxDDcFDFDc )। यह वह है जो समग्र ग्राफ़ में वास्तव में शामिल है। प्रत्येक रंग में वास्तव में अपने स्वयं के , और इसलिए, जब तक यह से भिन्न होता है जिस पर मूल संवेदनशीलता और विशिष्टता की गणना की गई थी, ये मैट्रिक्स बदल जाएंगे।DFF
उदाहरण
क्रमशः 10000 Dc, 500,750,300 D1, D2, D3 के साथ 11550 की आबादी मान लें। टिप्पणी किया गया भाग उपरोक्त ग्राफ़ के लिए प्रयुक्त कोड है।
set.seed(12345)
dc<-rnorm(10000,mean = 9, sd = 3)
d1<-rnorm(500,mean = 15,sd=2)
d2<-rnorm(750,mean=17,sd=2)
d3<-rnorm(300,mean=20,sd=2)
d<-cbind(c(d1,d2,d3),c(rep('1',500),rep('2',750),rep('3',300)))
library(ggplot2)
#ggplot(data.frame(dc))+geom_density(aes(x=dc),alpha=0.5,fill='green')+geom_density(data=data.frame(c(d1,d2,d3)),aes(x=c(d1,d2,d3)),alpha=0.5, fill='red')+geom_vline(xintercept = 13.5,color='black',size=2)+scale_x_continuous(name='Values for x',breaks=c(mean(dc),mean(as.numeric(d[,1])),13.5),labels=c('x_dc','x_d','x_T'))
#ggplot(data.frame(d))+geom_density(aes(x=as.numeric(d[,1]),..count..,fill=d[,2]),position='stack',alpha=0.5)+xlab('x-values')
हम आसानी से Dc, D1, D2, D3 और कम्पोजिट D सहित विभिन्न आबादी के लिए x- साधनों की गणना कर सकते हैं।
mean(dc)
mean(d1)
mean(d2)
mean(d3)
mean(as.numeric(d[,1]))
> mean(dc) [1] 8.997931
> mean(d1) [1] 14.95559
> mean(d2) [1] 17.01523
> mean(d3) [1] 19.76903
> mean(as.numeric(d[,1])) [1] 16.88382
हमारे मूल टेस्ट केस के लिए 2x2 टेबल प्राप्त करने के लिए, हम पहले डेटा के आधार पर एक थ्रेशोल्ड सेट करते हैं (जो @gung शो के रूप में परीक्षण चलाने के बाद वास्तविक मामले में सेट किया जाएगा)। वैसे भी, 13.5 की सीमा मानकर, संपूर्ण जनसंख्या पर गणना करने पर हमें निम्नलिखित संवेदनशीलता और विशिष्टता प्राप्त होती है।
sdc<-sample(dc,0.1*length(dc))
sdcomposite<-sample(c(d1,d2,d3),0.1*length(c(d1,d2,d3)))
threshold<-13.5
truepositive<-sum(sdcomposite>13.5)
truenegative<-sum(sdc<=13.5)
falsepositive<-sum(sdc>13.5)
falsenegative<-sum(sdcomposite<=13.5)
print(c(truepositive,truenegative,falsepositive,falsenegative))
sensitivity<-truepositive/length(sdcomposite)
specificity<-truenegative/length(sdc)
print(c(sensitivity,specificity))
> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]139 928 72 16
> print(c(sensitivity,specificity)) [1] 0.8967742 0.9280000
आइए हम मान लें कि हम आउट पेशेंट के साथ काम कर रहे हैं, और हम रोगग्रस्त रोगियों को केवल डी 1 अनुपात से प्राप्त करते हैं, या हम आईसीयू में काम कर रहे हैं जहां हमें केवल डी 3 मिलता है। (अधिक सामान्य मामले के लिए, हमें डीसी घटक को भी विभाजित करने की आवश्यकता है) हमारी संवेदनशीलता और विशिष्टता कैसे बदलती है? व्यापकता को बदलने से (यानी किसी भी मामले से संबंधित रोगियों के सापेक्ष अनुपात में परिवर्तन करके, हम विशिष्टता और संवेदनशीलता को बिल्कुल भी नहीं बदलते हैं। यह सिर्फ इतना होता है कि यह प्रसार भी बदलते वितरण के साथ बदल जाता है)
sdc<-sample(dc,0.1*length(dc))
sd1<-sample(d1,0.1*length(d1))
truepositive<-sum(sd1>13.5)
truenegative<-sum(sdc<=13.5)
falsepositive<-sum(sdc>13.5)
falsenegative<-sum(sd1<=13.5)
print(c(truepositive,truenegative,falsepositive,falsenegative))
sensitivity1<-truepositive/length(sd1)
specificity1<-truenegative/length(sdc)
print(c(sensitivity1,specificity1))
sdc<-sample(dc,0.1*length(dc))
sd3<-sample(d3,0.1*length(d3))
truepositive<-sum(sd3>13.5)
truenegative<-sum(sdc<=13.5)
falsepositive<-sum(sdc>13.5)
falsenegative<-sum(sd3<=13.5)
print(c(truepositive,truenegative,falsepositive,falsenegative))
sensitivity3<-truepositive/length(sd3)
specificity3<-truenegative/length(sdc)
print(c(sensitivity3,specificity3))
> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1] 38 931 69 12
> print(c(sensitivity1,specificity1)) [1] 0.760 0.931
> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1] 30 944 56 0
> print(c(sensitivity3,specificity3)) [1] 1.000 0.944
संक्षेप में, संवेदनशीलता के परिवर्तन को दिखाने के लिए एक भूखंड (विशिष्टता एक समान प्रवृत्ति का पालन करेगी हमने आबादी के लिए अलग-अलग मीन एक्स के साथ डीसी आबादी की रचना भी की थी), यहां एक ग्राफ है
df<-data.frame(V1=c(sensitivity,sensitivity1,sensitivity3),V2=c(mean(c(d1,d2,d3)),mean(d1),mean(d3)))
ggplot(df)+geom_point(aes(x=V2,y=V1),size=2)+geom_line(aes(x=V2,y=V1))
- यदि यह प्रॉक्सी नहीं है, तो हम तकनीकी रूप से 100% विशिष्टता और संवेदनशीलता रखेंगे। उदाहरण के लिए कहें कि हम को लिवर बायोप्सी के रूप में एक विशेष रूप से परिभाषित पैथोलॉजिकल तस्वीर के रूप में परिभाषित करते हैं, तो लिवर बायोप्सी परीक्षण सोने का मानक बन जाएगा और हमारी संवेदनशीलता को खुद के खिलाफ मापा जाएगा और इसलिए 100% उपज होगीD