आरओसी फ़ंक्शन (यह जरूरी नहीं कि एक वक्र है) आपको एए विशिष्ट सांख्यिकीय मॉडल द्वारा प्रदान की गई भेदभाव की क्षमता का आकलन करने की अनुमति देता है (जिसमें एक भविष्यवक्ता चर या उनमें से एक सेट शामिल है)।
आरओसी का एक मुख्य विचार यह है कि मॉडल की भविष्यवाणियां केवल मॉडल की क्षमता से भेदभाव करने / भविष्यवाणी करने वाले चर द्वारा प्रदान किए गए साक्ष्यों के आधार पर भविष्यवाणियां करने की क्षमता से उपजी नहीं हैं। साथ ही ऑपरेटिंग एक प्रतिक्रिया मानदंड है जो यह परिभाषित करता है कि मॉडल को किसी प्रतिक्रिया की भविष्यवाणी करने के लिए कितने साक्ष्य आवश्यक हैं, और इन प्रतिक्रियाओं का परिणाम क्या है। प्रतिक्रिया मानदंड के लिए जो मान स्थापित किया गया है, वह मॉडल भविष्यवाणियों को बहुत प्रभावित करेगा, और अंततः गलतियों का प्रकार जो इसे बना देगा।
भविष्यवक्ता चर और प्रतिक्रिया मानदंड के साथ एक सामान्य मॉडल पर विचार करें। यह मॉडल हां या नहीं का जवाब देकर, X की उपस्थिति की भविष्यवाणी करने की कोशिश कर रहा है, इसलिए आपके पास निम्न भ्रम मैट्रिक्स है:
**X present X absent**
**Model Predicts X Present** Hit False Alarm
**Model Predicts X Absent** Miss Correct Rejection
इस मैट्रिक्स में, आपको केवल हिट्स और फाल्स अलार्म के अनुपात पर विचार करने की आवश्यकता है (क्योंकि अन्य को इन से लिया जा सकता है, यह देखते हुए कि उन्हें कुछ से 1 तक है)। प्रत्येक प्रतिक्रिया मानदंड के लिए, आप एवे को एक अलग भ्रम मैट्रिक्स से मिटा देंगे। त्रुटियां (मिसेज एंड फाल्स अलार्म) नकारात्मक रूप से संबंधित हैं, जिसका अर्थ है कि एक प्रतिक्रिया मानदंड जो झूठे अलार्म को कम करता है, मिसेज और इसके विपरीत को अधिकतम करता है। संदेश है: कोई मुफ्त भोजन नहीं है।
इसलिए, यह समझने के लिए कि मॉडल मामलों में कितनी अच्छी तरह भेदभाव करता है / भविष्यवाणियां करता है, स्वतंत्र रूप से स्थापित प्रतिक्रिया मानदंड से, आप संभावित प्रतिक्रिया मानदंड की सीमा में उत्पादित हिट्स और गलत दरों की साजिश करते हैं।
इस भूखंड से आपको जो मिलता है वह आरओसी फ़ंक्शन है। फ़ंक्शन के तहत क्षेत्र मॉडल की भेदभाव क्षमता का एक निष्पक्ष और गैर-पैरामीट्रिक माप प्रदान करता है। यह माप बहुत महत्वपूर्ण है क्योंकि यह उन किसी भी भ्रम से मुक्त है जो प्रतिक्रिया मानदंड द्वारा निर्मित किया जा सकता था।
एक दूसरा महत्वपूर्ण पहलू यह है कि फ़ंक्शन का विश्लेषण करके, कोई भी यह परिभाषित कर सकता है कि आपके उद्देश्यों के लिए क्या प्रतिक्रिया मानदंड बेहतर है। आप किस प्रकार की त्रुटियों से बचना चाहते हैं, और कौन सी त्रुटियां ठीक हैं। उदाहरण के लिए, एक एचआईवी परीक्षण पर विचार करें: यह एक ऐसा परीक्षण है जो किसी प्रकार के साक्ष्य (इस मामले में एंटीबॉडीज) को देखता है और प्रतिक्रिया मानदंड के साथ साक्ष्यों की तुलना के आधार पर भेदभाव / भविष्यवाणी करता है। यह प्रतिक्रिया मानदंड आमतौर पर बहुत कम सेट किया जाता है, ताकि आप मिसेज को कम से कम करें। निश्चित रूप से इसके परिणामस्वरूप अधिक गलत अलार्म होंगे, जिनकी लागत है, लेकिन एक लागत जो कि मिसेज की तुलना में नगण्य है।
आरओसी के साथ, आप कुछ मॉडल की भेदभाव क्षमता का आकलन कर सकते हैं, स्वतंत्र रूप से प्रतिक्रिया मानदंड, और जो भी आप माप रहे हैं उसकी आवश्यकताओं और बाधाओं को देखते हुए, इष्टतम प्रतिक्रिया मानदंड स्थापित करें। हाई-स्क्वायर जैसे टेस्ट इस सब में मदद नहीं कर सकते हैं क्योंकि भले ही आपका परीक्षण अगर भविष्यवाणियों के मौके के स्तर पर हो, तो कई अलग-अलग हिट-फाल्स अलार्म जोड़े मौका स्तर के अनुरूप होते हैं।
सिग्नल की खोज सिद्धांत जैसे कुछ चौखटे एक प्राथमिकता मानते हैं कि भेदभाव के लिए उपलब्ध सबूतों में विशिष्ट डिस्ट्रीब्यूटोन (जैसे, सामान्य वितरण, या गामा वितरण) होते हैं। जब ये धारणाएं पकड़ती हैं (या बहुत करीब हैं), कुछ बहुत अच्छे उपाय उपलब्ध हैं जो आपके जीवन को आसान बनाते हैं।
आशा है कि यह आपको आरओसी के फायदों के बारे में बताने में मदद करेगा