आरओसी और मल्टीआरसी विश्लेषण: इष्टतम कटपॉइंट की गणना कैसे करें?


14

मैं यह समझने की कोशिश कर रहा हूं कि आरओसी वक्र के लिए इष्टतम कट-पॉइंट की गणना कैसे करें (जिस मूल्य पर संवेदनशीलता और विशिष्टता अधिकतम होती है)। मैं aSAHपैकेज से डेटासेट का उपयोग कर रहा हूं pROC

outcomeचर दो स्वतंत्र चर द्वारा समझाया जा सकता: s100bऔर ndkaEpiपैकेज के सिंटैक्स का उपयोग करते हुए , मैंने दो मॉडल बनाए हैं:

library(pROC)
library(Epi)
ROC(form=outcome~s100b, data=aSAH)
ROC(form=outcome~ndka, data=aSAH)

आउटपुट को निम्नलिखित दो ग्राफ़ों में चित्रित किया गया है:

यहाँ छवि विवरण दर्ज करें यहाँ छवि विवरण दर्ज करें

पहले ग्राफ ( s100b) में, फ़ंक्शन कहता है कि इष्टतम कट-पॉइंट उसी के अनुरूप मूल्य पर स्थानीयकृत है lr.eta=0.304। दूसरे ग्राफ ( ndka) में इष्टतम कट-पॉइंट उसी मूल्य पर स्थानीयकृत है lr.eta=0.335(जिसका अर्थ है lr.eta)। मेरा पहला सवाल है:

  • संकेतित मूल्यों के लिए संगत s100bऔर ndkaमान lr.etaक्या है ( s100bऔर के संदर्भ में इष्टतम कट-पॉइंट क्या है ndka)?

दूसरा सवाल:

अब मान लीजिए कि मैं दोनों चर को ध्यान में रखते हुए एक मॉडल बनाता हूं:

ROC(form=outcome~ndka+s100b, data=aSAH)

प्राप्त ग्राफ है:

यहाँ छवि विवरण दर्ज करें

मैं यह जानना चाहता हूं कि ndkaAND के मान क्या हैं और s100bकिस संवेदनशीलता और विशिष्टता को कार्य द्वारा अधिकतम किया जाता है। अन्य शब्दों में: हमारे पास कौन से मूल्य हैं ndkaऔर s100bजिन पर हमारे पास Se = 68.3% और Sp = 76.4% (ग्राफ से प्राप्त मान) हैं?

मुझे लगता है कि यह दूसरा सवाल मल्टीआरसी विश्लेषण से संबंधित है, लेकिन Epiपैकेज के प्रलेखन में यह नहीं बताया गया है कि मॉडल में उपयोग किए जाने वाले दोनों चर के लिए इष्टतम कटऑफ की गणना कैसे करें ।

मेरा प्रश्न reasearchGate के इस प्रश्न के समान प्रतीत होता है , जो संक्षेप में कहता है:

कट-ऑफ स्कोर का निर्धारण जो संवेदनशीलता और एक उपाय की विशिष्टता के बीच बेहतर व्यापार-बंद का प्रतिनिधित्व करता है, सीधा है। हालांकि, बहुभिन्नरूपी आरओसी वक्र विश्लेषण के लिए, मैंने नोट किया है कि अधिकांश शोधकर्ताओं ने एयूसी के संदर्भ में कई संकेतकों (चर) के रैखिक संयोजन की समग्र सटीकता निर्धारित करने के लिए एल्गोरिदम पर ध्यान केंद्रित किया है। [...]

हालाँकि, इन विधियों में यह उल्लेख नहीं किया गया है कि सर्वश्रेष्ठ निदान सटीकता प्रदान करने वाले कई संकेतकों से जुड़े कट-ऑफ स्कोर के संयोजन को कैसे तय किया जाए।

एक संभावित समाधान यह है कि शुल्ट्ज़ ने अपने पेपर में प्रस्तावित किया है , लेकिन इस लेख से मैं यह नहीं समझ पा रहा हूं कि मल्टीवेरेट आरओसी वक्र के लिए इष्टतम कटपॉइंट की गणना कैसे करें।

शायद Epiपैकेज से समाधान आदर्श नहीं है, इसलिए किसी भी अन्य उपयोगी लिंक की सराहना की जाएगी।

जवाबों:


10

फ्रैंक हैरेल के उत्तर पर विस्तृत करने के लिए, Epiपैकेज ने जो किया वह एक लॉजिस्टिक रिग्रेशन को फिट करने के लिए था, और निम्नलिखित फॉर्म के परिणामों की भविष्यवाणी के साथ आरओसी वक्र बनाने के लिए:

outcome=11+e(β0+β1s100b+β2ndka)

β0β1β2

0.312=11+-(-2.379+5.334रों100+0.031n)
1.588214=5.334रों100+0.031n
रों100=1.588214-0.031n5.334

(S100b, ndka) मूल्यों की कोई भी जोड़ी जो इस समानता को संतुष्ट करती है वह है "इष्टतम"। आपके लिए बुरी किस्मत, इन जोड़ियों की एक अनंतता है। उदाहरण के लिए, (०.२ ९, १), (०, ५१.२), आदि, और भी बदतर, उनमें से ज्यादातर कोई मतलब नहीं है। जोड़ी (-580, 10000) का क्या अर्थ है? कुछ भी तो नहीं!

दूसरे शब्दों में, आप इनपुट पर कट-ऑफ स्थापित नहीं कर सकते - आपको इसे आउटपुट पर करना होगा, और यह मॉडल का पूरा बिंदु है।


8

Y^


मैंने आपके द्वारा बताई गई समस्या को समझा। मैं सोच रहा हूं, अगर एक विशिष्ट स्थिति (रोग / परिणाम / आदि) की पहचान करने के लिए सेंसर और कल्पना को बढ़ाने के लिए, समानांतर में दो (या अधिक) परीक्षणों के लिए कट-ऑफ अंक की गणना करने की विधि है। )। अग्रिम में धन्यवाद।
टॉमासो

1
चूँकि X1 के लिए "इष्टतम" कटपॉइंट x2 के निरंतर मूल्य पर निर्भर करेगा, और x2 के लिए "इष्टतम" कटपंट, X1 के निरंतर मूल्य पर निर्भर करेगा, ऐसा करने का कोई तरीका नहीं है और इसे बनाने के लिए पर्याप्त जानकारी को संरक्षित करने के लिए नहीं है आपदा।
फ्रैंक हरेल

तो संवेदनशीलता और विशिष्टता को अधिकतम करने के लिए, दो या दो से अधिक परीक्षणों के लिए कट-ऑफ पॉइंट खोजने का कोई तरीका नहीं है? बेशक एक विधि जो एक मल्टीआरओसी विश्लेषण नहीं है। एक बार फिर धन्यवाद।
टॉमासो

2
इनपुट्स पर कटऑफ मांगना उचित नहीं है। पूर्वानुमानित संभावनाओं पर कटऑफ बनाकर, निर्णय समय से पहले की आवश्यकता होने पर, बिना किसी कटऑफ का उपयोग करते हुए, इष्टतम निर्णय लिए जाते हैं। अनुमानित जोखिम पर इष्टतम कटऑफ को हल करने के लिए उपयोगिता (हानि / लागत) की आवश्यकता होती है।
फ्रैंक हार्डेल

1
आरओसी कर्व्स का उस लक्ष्य को पूरा करने से कोई लेना देना नहीं है। ऐसा करने के लिए आपको SCr को परिणाम से संबंधित करना होगा, या सामान्य जनसंख्या की तुलना में अधिक चरम SCr प्राप्त करने की संभावना की गणना करना होगा।
फ्रैंक हरेल

3

lr.etaηROC

आपके पहले वाक्य को (जैसा कि रेखांकन द्वारा स्पष्ट किया गया है) कहना चाहिए कि आप उस जगह की तलाश कर रहे हैं जहां संवेदनशीलता और विशिष्टता का योग अधिकतम होता है। लेकिन यह "इष्टतम" क्यों है? क्या एक झूठे सकारात्मक परिणाम का एक गलत नकारात्मक परिणाम के समान आयात होता है? देखें यहाँ


यह सही था, मैं फिट किए गए मॉडल (एक स्वतंत्र चर के लिए) से कट-ऑफ पॉइंट की गणना कर सकता हूं, या वैकल्पिक रूप coordsसे pROCपैकेज से फ़ंक्शन का उपयोग कर सकता हूं, जैसा कि मैंने बाद में पाया। इष्टतम कट-ऑफ़ पॉइंट, मेरे मामले में, सेंसर और स्पेस का सबसे अच्छा संयोजन था; मैं लिंक किए गए उत्तर को पढ़ता हूं, लेकिन मैं झूठे सकारात्मक और गलत नकारात्मक परिणामों के बारे में (अभी के लिए कम से कम) परवाह नहीं करता हूं, क्योंकि (यदि मैं अच्छी तरह से समझा हूं) तो मैं अनुसंधान के लिए एकत्रित डेटा के एक समूह का विश्लेषण कर रहा हूं।
टॉमासो

क्या करते हैं आप तो के बारे में परवाह? कट-ऑफ के साथ आप क्या कर रहे हैं जिसके परिणाम के बारे में विचार करने की आवश्यकता नहीं है? और फिर यह 'इष्टतम' या 'सर्वश्रेष्ठ' किस लिए है ?
Scortchi - को पुनः स्थापित मोनिका

टॉमासो ने "इष्टतम" को "उस मूल्य के रूप में परिभाषित किया है जिस पर संवेदनशीलता और विशिष्टता अधिकतम होती है" (प्रश्न के पहले वाक्य को उद्धृत करते हुए), जिसका अर्थ है अधिकतम (संवेदनशीलता + विशिष्टता)। यह समझ में आता है या नहीं (और जब मैं पढ़ता हूं तो वह परवाह नहीं करता है, मुझे लगता है कि ऐसा नहीं करने के लिए इच्छुक है) एक अन्य प्रश्न है।
कैलिमो

1
यह दृष्टिकोण निर्णय लेने के साथ बाधाओं पर है।
फ्रैंक हरेल

1
lr.eta[Yमैं|एक्समैं]=1 1+-(β0+β1×रों100)

0

आप उस सीमा को पा सकते हैं जिस पर वास्तविक सकारात्मक दर (tpr) सही नकारात्मक दर (tnr) को काटती है, यह वह बिंदु होगा जिस पर गलत सकारात्मक और गलत नकारात्मक का योग न्यूनतम होता है।


एक-वाक्य के उत्तर को आमतौर पर हमारे प्रारूप के लिए थोड़ा छोटा माना जाता है। क्या आप अपने उत्तर का विस्तार कर सकते हैं कि आप यह जान सकते हैं कि कैसे पता होना चाहिए कि न्यूनतम कहाँ होना चाहिए?
Glen_b -Reinstate मोनिका

1
इस तरह की रणनीति इष्टतम निर्णय लेने की स्थिति में उड़ान भरती है।
फ्रैंक हरेल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.