आप छुट्टी-एक-आउट क्रॉस सत्यापन के लिए आरओसी वक्र कैसे उत्पन्न करते हैं?


10

5-गुना क्रॉस-वैलिडेशन (उदाहरण के लिए) का प्रदर्शन करते समय, प्रत्येक 5 तह के लिए एक अलग आरओसी वक्र की गणना करना विशिष्ट होता है और अक्सर एक मतलब आरओसी वक्र होता है जिसमें एसटीडी होता है। देव। वक्र मोटाई के रूप में दिखाया गया है।

हालाँकि, LOO क्रॉस-मान्यता के लिए, जहाँ प्रत्येक तह में केवल एक ही टेस्ट डेटापॉइंट होता है, इस सिंगल डेटापॉइंट के लिए ROC "कर्व" की गणना करना कामुक नहीं लगता है।

मैं अपने सभी परीक्षण डेटा बिंदु (उनके अलग-अलग गणना किए गए पी-मूल्यों के साथ) ले रहा हूं और उन्हें एक एकल आरओसी वक्र की गणना करने के लिए एक बड़े सेट में पूल कर रहा हूं, लेकिन क्या यह सांख्यिकीय रूप से कोषेर बात है?

आरओसी विश्लेषण को लागू करने का सही तरीका क्या है जब प्रत्येक तह में डेटा बिंदुओं की संख्या एक है (जैसा कि एलओयू क्रॉस वैधता के मामले में है)?


क्यों? आप इस तरह के प्राणी के साथ क्या करना चाहते हैं?

मुझे पी-वैल्यू थ्रेसहोल्ड की एक श्रृंखला में समग्र भविष्यवाणी प्रदर्शन का विश्लेषण करने की आवश्यकता है, और आरओसी घटता है जो मैंने पारंपरिक रूप से हर दूसरे प्रकार के क्रॉस सत्यापन के लिए उपयोग किया है। इसलिए मूल रूप से यही कारण है कि आरओसी विश्लेषण किसी भी के-गुना क्रॉस सत्यापन के लिए उपयोगी है। अगर LOO xval के लिए एक अलग, अनुरूप दृष्टिकोण है, तो इसके बारे में जानना भी बहुत अच्छा होगा। इसके अलावा, मैं 10-गुना xval की तरह कुछ करूँगा अगर मेरे पास पर्याप्त डेटा था और यह एक मुद्दा नहीं होगा।
191 पर यूजर 1121

1
मैं कहूंगा कि आप इसे समझदारी से कर रहे हैं, बस एक ही आरओसी वक्र बनाएं जिसका उपयोग वास्तविक लेबल और प्रत्येक मामले के लिए अनुमानित मूल्य (जहां यह मामला पकड़ में था)
B_Miner

जवाबों:


15

यदि क्लासिफायरियर संभावनाओं का उत्पादन करता है, तो एकल आरओसी वक्र के लिए सभी परीक्षण बिंदु आउटपुट को जोड़ना उचित है। यदि नहीं, तो क्लासिफायर के आउटपुट को इस तरीके से मापें जो कि इसे सीधे क्लासिफायरियर के साथ तुलना कर सके। उदाहरण के लिए, मान लें कि आप रैखिक विवेचक विश्लेषण का उपयोग कर रहे हैं। क्लासिफायरियर को प्रशिक्षित करें और फिर क्लासिफायर के माध्यम से प्रशिक्षण डेटा डालें। दो वज़न जानें: एक स्केल पैरामीटरσ (वर्ग साधनों के मानक विचलन, कक्षा के साधनों को घटाने के बाद), और एक पाली पैरामीटर μ(पहली कक्षा का मतलब)। कच्चे को सामान्य करने के लिए इन मापदंडों का उपयोग करेंआर के माध्यम से प्रत्येक एलडीए वर्गीकारक का उत्पादन n=(आर-μ)/σ, और फिर आप सामान्यीकृत आउटपुट के सेट से एक आरओसी वक्र बना सकते हैं। इसके पास यह चेतावनी है कि आप अधिक मापदंडों का अनुमान लगा रहे हैं, और इस तरह से परिणाम थोड़ा भिन्न हो सकते हैं यदि आपने एक अलग परीक्षण सेट के आधार पर आरओसी वक्र का निर्माण किया है।

यदि क्लासिफायर आउटपुट को सामान्य करना या उन्हें संभावनाओं में बदलना संभव नहीं है, तो LOO-CV पर आधारित ROC विश्लेषण उचित नहीं है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.