मूल्यांकन को लेकर बहुत गलतफहमी है। इसका एक हिस्सा डेटा पर एल्गोरिदम को अनुकूलित करने की कोशिश करने के मशीन लर्निंग दृष्टिकोण से आता है, जिसमें डेटा में कोई वास्तविक रुचि नहीं है।
एक चिकित्सा संदर्भ में, यह वास्तविक दुनिया के परिणामों के बारे में है - उदाहरण के लिए, आप कितने लोगों को मरने से बचाते हैं। एक चिकित्सा संदर्भ में संवेदनशीलता (टीपीआर) का उपयोग यह देखने के लिए किया जाता है कि सकारात्मक मामलों में से कितने सही ढंग से उठाए गए हैं (अनुपात को गलत नकारात्मक = FNR के रूप में याद किया जाता है) जबकि विशिष्टता (TNR) का उपयोग यह देखने के लिए किया जाता है कि कितने नकारात्मक मामले सही हैं समाप्त (झूठी सकारात्मक = FPR के रूप में पाया अनुपात को कम से कम)। कुछ बीमारियों में एक लाख में से एक का प्रचलन है। इस प्रकार यदि आप हमेशा नकारात्मक का अनुमान लगाते हैं, तो आपके पास 0.999999 की सटीकता है - यह साधारण ज़ीरो सीखने वाले द्वारा प्राप्त किया जाता है जो कि अधिकतम वर्ग की भविष्यवाणी करता है। अगर हम रिकॉल और प्रिसिजन के बारे में भविष्यवाणी करने के लिए सोचते हैं कि आप बीमारी मुक्त हैं, तो हमारे पास जीरो के लिए रिकॉल = 1 और प्रिसिजन = 0.999999 है। बेशक, यदि आप + ve और -ve को उल्टा करते हैं और यह अनुमान लगाने की कोशिश करते हैं कि किसी व्यक्ति को ZeroR से बीमारी है, तो आपको रिकॉल = 0 और प्रिसिजन = अपरिभाषित मिलता है (जैसा कि आपने सकारात्मक भविष्यवाणी भी नहीं की थी, लेकिन अक्सर लोग प्रिसिजन को 0 के रूप में परिभाषित करते हैं। मामला)। ध्यान दें कि रिकॉल (+ ve रिकॉल) और व्युत्क्रम रिकॉल (-ve रिकॉल), और संबंधित TPR, FPR, TNR और FNR को हमेशा परिभाषित किया जाता है क्योंकि हम केवल समस्या से निपट रहे हैं क्योंकि हम जानते हैं कि भेद करने के लिए दो वर्ग हैं और हम जानबूझकर प्रदान करते हैं प्रत्येक के उदाहरण।
चिकित्सा संदर्भ में गायब कैंसर के बीच के भारी अंतर पर ध्यान दें (किसी की मृत्यु हो जाती है और आप पर मुकदमा दायर होता है) बनाम एक वेब खोज में एक कागज गायब हो जाता है (अच्छा मौका दूसरों में से एक इसे संदर्भित करेगा यदि इसके महत्वपूर्ण)। दोनों ही मामलों में इन त्रुटियों को झूठी नकारात्मक के रूप में चित्रित किया जाता है, बनाम नकारात्मक जनसंख्या। वेबसर्च मामले में हम स्वचालित रूप से सच्ची नकारात्मक लोगों की एक बड़ी आबादी प्राप्त करेंगे, क्योंकि हम केवल परिणाम की एक छोटी संख्या दिखाते हैं (जैसे 10 या 100) और नहीं दिखाया जा रहा है वास्तव में एक नकारात्मक भविष्यवाणी के रूप में नहीं लिया जाना चाहिए (यह 101 हो सकता है ), जबकि कैंसर परीक्षण मामले में हमारे पास हर व्यक्ति के लिए एक परिणाम है और वेबसर्च के विपरीत हम सक्रिय रूप से झूठे नकारात्मक स्तर (दर) को नियंत्रित करते हैं।
तो आरओसी वास्तविक सकारात्मक (वास्तविक सकारात्मक के अनुपात के रूप में गलत नकारात्मक) और झूठी सकारात्मक (बनाम वास्तविक नकारात्मक के अनुपात के रूप में वास्तविक नकारात्मक) के बीच व्यापार की खोज कर रहा है। यह संवेदनशीलता (+ ve रिकॉल) और विशिष्टता (-ve रिकॉल) की तुलना करने के बराबर है। एक पीएन ग्राफ भी है जो उसी तरह दिखता है जहां हम टीपीआर बनाम एफपीआर के बजाय टीपी बनाम एफपी की साजिश रचते हैं - लेकिन जब से हम प्लॉट स्क्वायर बनाते हैं, केवल वही अंतर होता है जो हम तराजू पर डालते हैं। वे कॉन्स्टेंट टीपीआर = टीपी / आरपी, एफपीआर = टीपी / आरएन से संबंधित हैं, जहां आरपी = टीपी + एफएन और आरएन = एफएन + एफपी डेटासेट में रियल पॉजिटिव और रियल नेगेटिव की संख्या हैं और इसके विपरीत पीपी / टीपी + एफपी और पीएन हैं। = TN + FN कई बार हम सकारात्मक या भविष्यवाणी नकारात्मक भविष्यवाणी करते हैं। ध्यान दें कि हम आरपी = आरपी / एन और आरएन = आरएन / एन को सकारात्मक सम्मान की व्यापकता कहते हैं। नकारात्मक और पीपी = पीपी / एन और आरपी = आरपी / एन सकारात्मक पूर्वाग्रह को पूर्वाग्रह।
यदि हम योग या औसत संवेदनशीलता और विशिष्टता या ट्रेडऑफ़ के तहत क्षेत्र को देखते हैं वक्र (आरओसी के बराबर एक्स-अक्ष को उलट कर) तो हमें एक ही परिणाम मिलता है अगर हम इंटरचेंज करते हैं कि कौन सी कक्षा + ve और + ve है। यह परिशुद्धता और रिकॉल के लिए सच नहीं है (जैसा कि ZeroR द्वारा बीमारी की भविष्यवाणी के साथ ऊपर सचित्र है)। यह मनमानी परिशुद्धता, रिकॉल और उनके औसत (चाहे अंकगणित, ज्यामितीय या हार्मोनिक) और ट्रेडऑफ ग्राफ़ की एक बड़ी कमी है।
पीआर, पीएन, आरओसी, एलआईएफटी और अन्य चार्ट को प्लॉट किया जाता है क्योंकि सिस्टम के मापदंडों को बदल दिया जाता है। प्रत्येक व्यक्ति प्रणाली के लिए यह शास्त्रीय रूप से कथानक इंगित करता है, अक्सर उस सीमा को बढ़ाने या घटाने के साथ जिस बिंदु पर सकारात्मक बनाम नकारात्मक वर्गीकृत किया जाता है।
कभी-कभी प्लॉट किए गए बिंदु एक ही तरीके से प्रशिक्षित (लेकिन अलग-अलग यादृच्छिक संख्याओं या नमूने या आदेशों का उपयोग करके) सिस्टम के सेट पर औसत (बदलते पैरामीटर / थ्रेसहोल्ड / एल्गोरिदम) हो सकते हैं। ये सैद्धांतिक निर्माण हैं जो हमें किसी विशेष समस्या पर उनके प्रदर्शन के बजाय सिस्टम के औसत व्यवहार के बारे में बताते हैं। ट्रेडऑफ़ चार्ट का उद्देश्य किसी विशेष एप्लिकेशन (डेटासेट और एप्रोच) के लिए सही ऑपरेटिंग पॉइंट चुनने में हमारी मदद करना है और यहीं से आरओसी को अपना नाम मिलता है (रिसीवर ऑपरेटिंग कैरेक्टर्स का उद्देश्य सूचना के अर्थ में प्राप्त जानकारी को अधिकतम करना है)।
आइए विचार करें कि रिकॉल या टीपीआर या टीपी के खिलाफ क्या साजिश रची जा सकती है।
टीपी बनाम एफपी (पीएन) - बिल्कुल अलग-अलग नंबरों के साथ आरओसी प्लॉट की तरह दिखता है
टीपीआर बनाम एफपीआर (आरओसी) - एयूसी के साथ एफपीआर के खिलाफ टीपीआर अपरिवर्तित है यदि +/- उलटा हो।
TPR बनाम TNR (alt ROC) - ROC की दर्पण छवि TNR = 1-FPR (TN + FP = RN) के रूप में
टीपी बनाम पीपी (एलआईएफटी) - सकारात्मक और नकारात्मक उदाहरणों के लिए एक्स इंक (नॉनलाइनियर स्ट्रेच)
TPR बनाम pp (alt LIFT) - अलग-अलग संख्याओं के साथ LIFT जैसा ही दिखता है
टीपी बनाम 1 / पीपी - लिफ्ट के समान (लेकिन नॉनलाइनर स्ट्रेच के साथ उलटा)
टीपीआर बनाम 1 / पीपी - टीपी बनाम 1 / पीपी के समान दिखता है (y- अक्ष पर अलग संख्या)
टीपी बनाम टीपी / पीपी - समान है लेकिन एक्स-एक्सिस के विस्तार के साथ (टीपी = एक्स -> टीपी = एक्स * टीपी)
टीपीआर बनाम टीपी / पीपी - कुल्हाड़ियों पर अलग-अलग संख्याओं के साथ समान दिखता है
आखिरी रिकॉल बनाम सटीक है!
इन रेखांकन के लिए किसी भी घटता पर ध्यान दें जो अन्य घटता (बेहतर या कम से कम सभी बिंदुओं पर उच्च) पर इन परिवर्तनों के बाद भी हावी रहेगा। चूंकि वर्चस्व का मतलब है "कम से कम उच्च" हर बिंदु पर, उच्च वक्र में भी "कम से कम उतना ही उच्च" वक्र (AUC) के तहत एक क्षेत्र है क्योंकि इसमें वक्र के बीच का क्षेत्र भी शामिल है। रिवर्स सच नहीं है: यदि कर्व्स को काटते हैं, तो स्पर्श करने के विपरीत, कोई प्रभुत्व नहीं है, लेकिन एक एयूसी अभी भी दूसरे से बड़ा हो सकता है।
सभी परिवर्तन आरओसी या पीएन ग्राफ के किसी विशेष भाग में अलग-अलग (गैर-रैखिक) तरीकों से प्रतिबिंबित और / या ज़ूम होते हैं। हालांकि, केवल आरओसी की वक्र के तहत क्षेत्र की अच्छी व्याख्या है (संभावना है कि एक सकारात्मक नकारात्मक से अधिक रैंक किया गया है - मैन-व्हिटनी यू स्टेटिस्टिक) और वक्र के ऊपर की दूरी (संभावना है कि अनुमान लगाने के बजाय एक सूचित निर्णय किया जाता है - यूडेन जे। आँकड़ा के विचित्र रूप के रूप में आँकड़ा)।
आम तौर पर, पीआर ट्रेडऑफ़ वक्र का उपयोग करने की कोई आवश्यकता नहीं होती है और यदि विस्तार की आवश्यकता होती है, तो आप बस आरओसी वक्र में ज़ूम कर सकते हैं। आरओसी वक्र में अद्वितीय गुण है जो विकर्ण (TPR = FPR) मौका का प्रतिनिधित्व करता है, कि संभावना रेखा (DAC) के ऊपर की दूरी सूचना या सूचित निर्णय की संभावना का प्रतिनिधित्व करती है, और वक्र (AUC) के तहत क्षेत्र रैंकिडनेस का प्रतिनिधित्व करता है या सही जोड़ीदार रैंकिंग की संभावना। ये परिणाम पीआर वक्र के लिए पकड़ में नहीं आते हैं, और एयूसी उच्चतर रिकॉल या टीपीआर के लिए विकृत हो जाता है जैसा कि ऊपर बताया गया है। पीआर एयूसी बड़ा नहीं है imply ROC AUC बड़ा है और इस प्रकार यह रैंक मेंडनेस नहीं बढ़ाता है (रैंक की संभावना +/- जोड़े का सही अनुमान लगाया जा रहा है - अर्थात यह कितनी बार + से ऊपर ves की भविष्यवाणी करता है) और इम्पेक्टेडनेस बढ़ने की बजाय सूचित नहीं करता है। एक यादृच्छिक अनुमान - अर्थात कितनी बार यह जानता है कि जब यह भविष्यवाणी करता है तो यह क्या कर रहा है)।
क्षमा करें - कोई रेखांकन नहीं! यदि कोई उपरोक्त परिवर्तनों को दर्शाने के लिए रेखांकन जोड़ना चाहता है, तो यह बहुत अच्छा होगा! मैं आरओसी, लिफ्ट, बर्ड, कापा, एफ उपाय, Informedness, आदि के बारे में मेरे पत्र में काफी कुछ है, लेकिन वे काफी इस तरीके से प्रस्तुत नहीं कर रहे हैं, हालांकि LIFT बर्ड आरपी बनाम बनाम बनाम आरओसी के चित्र में हैं https : //arxiv.org/pdf/1505.00401.pdf
अद्यतन: अधिक उत्तर या टिप्पणियों में पूर्ण स्पष्टीकरण देने की कोशिश करने से बचने के लिए, यहाँ मेरे कुछ शोधपत्र हैं, जो सटीक बनाम रिकॉल ट्रेडऑफ़ के साथ समस्या की "खोज" कर रहे हैं। एफ 1, अनौपचारिकता को प्राप्त करने और फिर आरओसी, कप्पा, सिग्नेचर, डेल्टापी, एयूसी, आदि के साथ रिश्तों की "खोज" कर रहा है। यह एक समस्या है जो मेरे छात्रों में से 20 साल पहले (एंटविसल) में टकरा गई थी और तब से बहुत कुछ पाया गया जब से कि असली का उदाहरण आया उनका अपना अनुभवजन्य प्रमाण था कि आर / पी / एफ / ए दृष्टिकोण ने शिक्षार्थी को गलत तरीके से भेजा, जबकि सूचना (या उपयुक्त मामलों में कप्पा या सहसंबंध) ने उन्हें सही तरीके से भेजा - अब दर्जनों क्षेत्रों में। कप्पा और आरओसी पर अन्य लेखकों द्वारा कई अच्छे और प्रासंगिक पेपर भी हैं, लेकिन जब आप कप्पा बनाम आरओसी एयूसी बनाम आरओसी ऊंचाई (सूचना या Youden) का उपयोग करते हैं एस जे) को 2012 के प्रश्नपत्रों की सूची में स्पष्ट किया गया है (दूसरों के कई महत्वपूर्ण कागजात उन्हें उद्धृत किए गए हैं)। 2003 का बुकमेकर पेपर पहली बार मल्टीक्लास केस के लिए इन्फॉर्मेडनेस के लिए एक फॉर्मूला है। 2013 का पेपर Adaboost को अनुकूलित करने के लिए अनुकूलित किए गए Adaboost के एक बहुस्तरीय संस्करण को प्राप्त करता है (संशोधित Weka के लिंक के साथ जो इसे होस्ट करता है और चलाता है)।
संदर्भ
1998 एनएलपी पार्सर्स के मूल्यांकन में आंकड़ों का वर्तमान उपयोग। जे एंटविसल, डीएमडब्ल्यू पॉवर्स - भाषा प्रसंस्करण में नए तरीकों पर संयुक्त सम्मेलनों की कार्यवाही: 215-224
https://dl.acm.org/citation.cfm?id=1603935
15 द्वारा उद्धृत
2003 बुकमेकर बनाम रिकॉल एंड प्रिसिजन। DMW पॉवर्स - संज्ञानात्मक विज्ञान पर अंतर्राष्ट्रीय सम्मेलन: 529-534
http://dspace2.flinders.edu.au/xmlui/handle/2328/27159
46 द्वारा उद्धृत
2011 मूल्यांकन: सटीक, रिकॉल और एफ-माप से आरओसी, सूचना, चिह्नितता और सहसंबंध। DMW पॉवर्स - जर्नल ऑफ़ मशीन लर्निंग टेक्नोलॉजी 2 (1): 37-63।
http://dspace2.flinders.edu.au/xmlui/handle/2328/27165
C 1749
2012 कप्पा के साथ समस्या। DMW पॉवर्स - यूरोपीय ACL के 13 वें सम्मेलन की कार्यवाही: 345-355
https://dl.acm.org/citation.cfm?id=2380859
63 द्वारा उद्धृत
2012 आरओसी-कॉन्सर्ट: आरओसी-आधारित मापन की संगति और निश्चितता। DMW पॉवर्स - इंजीनियरिंग और प्रौद्योगिकी पर स्प्रिंग कांग्रेस (S-CET) 2: 238-241
http://www.academia.edu/download/31939951/201203-SCET30795-ROC-ConCert-Pn1124774.pdf
5 द्वारा उद्धृत
2013 ADABOOK & MULTIBOOK:: संभावना सुधार के साथ अनुकूल बूस्टिंग। DMW पॉवर्स- नियंत्रण, स्वचालन और रोबोटिक्स में सूचना विज्ञान पर ICINCO अंतर्राष्ट्रीय सम्मेलन
http://www.academia.edu/download/31947210/201309-ABookBook-ICINCO-SCITE-Harvard-2upc>poster.pdf
https://www.dropbox.com/s/artzz1l3vozb6c4/weka.jar (goes into Java Class Path)
https://www.dropbox.com/s/dqws9ixew3egraj/wekagui (GUI start script for Unix)
https://www.dropbox.com/s/4j3fwx997kq2xcq/wekagui.bat (GUI shortcut on Windows)
4 द्वारा उद्धृत