आरओसी वक्र की व्याख्या कैसे करें?


14

मैंने एसएएस पर अपने डेटा पर लॉजिस्टिक रिग्रेशन लागू किया और यहां आरओसी वक्र और वर्गीकरण तालिका हैं।

यहाँ छवि विवरण दर्ज करें

मैं वर्गीकरण तालिका में आंकड़ों के साथ सहज हूं, लेकिन यह बिल्कुल निश्चित नहीं है कि आरओ वक्र और इसके नीचे का क्षेत्र क्या दर्शाता है। किसी भी स्पष्टीकरण बहुत सराहना की जाएगी।

जवाबों:


22

जब आप लॉजिस्टिक रिग्रेशन करते हैं, तो आपको दो कक्षाएं और 0 के रूप में कोडित की जाती हैं । अब, आप उन संभावनाओं की गणना करते हैं जो कुछ व्याख्यात्मक वैरिएबल्स को एक व्यक्ति को 1 के रूप में कोडित वर्ग से संबंधित हैं । यदि आप अब प्रायिकता सीमा का चयन करते हैं और सभी व्यक्तियों को इस सीमा से अधिक की संभावना वाले वर्ग और कक्षा ० से नीचे के रूप में वर्गीकृत करते हैं10110, आप ज्यादातर मामलों में कुछ त्रुटियां करेंगे क्योंकि आमतौर पर दो समूहों को पूरी तरह से भेदभाव नहीं किया जा सकता है। इस सीमा के लिए अब आप अपनी त्रुटियों और तथाकथित संवेदनशीलता और विशिष्टता की गणना कर सकते हैं। यदि आप कई थ्रेसहोल्ड के लिए ऐसा करते हैं, तो आप कई संभावित थ्रेसहोल्ड के लिए 1-विशिष्टता के खिलाफ संवेदनशीलता की साजिश रचकर आरओसी वक्र का निर्माण कर सकते हैं। यदि आप दो वर्गों के बीच भेदभाव करने की कोशिश करने वाले विभिन्न तरीकों की तुलना करना चाहते हैं, तो वक्र के नीचे का क्षेत्र खेल में आता है, उदाहरण के लिए विभेदक विश्लेषण या एक प्रोबिट मॉडल। आप इन सभी मॉडलों के लिए आरओसी वक्र का निर्माण कर सकते हैं और वक्र के नीचे उच्चतम क्षेत्र के साथ सबसे अच्छे मॉडल के रूप में देखा जा सकता है।

यदि आपको गहरी समझ प्राप्त करने की आवश्यकता है, तो आप यहां क्लिक करके आरओसी वक्रों के संबंध में एक अलग प्रश्न का उत्तर भी पढ़ सकते हैं।


वर्गीकरण तालिका में सही दर से अलग आरओसी वक्र के तहत क्षेत्र कैसे है?
गुनाल

2
तालिका केवल एक सीमा के लिए सही और गैर सही दिखाती है। हालांकि, एयूआरओसी वक्र पूर्ण वर्गीकरण विधि का माप है और कई अलग-अलग थ्रेसहोल्ड के लिए सही और गैर सही है।
random_guy

यह सुन कर अच्छा लगा कि!
random_guy 20

6

एयूसी मूल रूप से आपको केवल यह बता रहा है कि आपके 1-लेबल वाले डेटा पर आपकी अनुमानित प्रतिक्रिया संभावनाओं से कितनी बार एक यादृच्छिक ड्रॉ आपके 0-लेबल वाले डेटा पर आपकी अनुमानित प्रतिक्रिया संभावनाओं से एक यादृच्छिक ड्रॉ से अधिक होगा।


6

लॉजिस्टिक रिग्रेशन मॉडल एक प्रत्यक्ष संभावना आकलन विधि है। वर्गीकरण को इसके उपयोग में कोई भूमिका नहीं निभानी चाहिए। व्यक्तिगत विषयों पर उपयोगिताओं (हानि / लागत समारोह) का आकलन करने के आधार पर कोई भी वर्गीकरण बहुत विशेष आपात स्थितियों को छोड़कर अनुचित नहीं है। आरओसी वक्र यहाँ सहायक नहीं है; न तो संवेदनशीलता या विशिष्टता है, जो समग्र वर्गीकरण सटीकता की तरह है, अनुचित सटीकता स्कोरिंग नियम हैं जो अधिकतम संभावना अनुमान द्वारा फिट नहीं किए गए फर्जी मॉडल द्वारा अनुकूलित हैं।

c15pYपी0.05


@ फ्रेंक हरेल: क्या आप इंटरसेप्ट के साथ-साथ त्रुटि के मार्जिन के बारे में टिप्पणी के बारे में गणना पर विस्तार से बता सकते हैं। धन्यवाद!
julieth 16

@FrankHarrell आपकी सलाह है कि यदि हम मॉडल को जांचने के लिए रिज रिग्रेशन कर रहे हैं तो हमें कम से कम 15 पी टिप्पणियों की आवश्यकता है? मेरी समझ यह है कि हम पी को फिर प्रभावी आयाम से प्रतिस्थापित करते हैं।
लेपिडोप्टेरिस्ट

ठीक है, और मैं कहूंगा कि आप मापदंडों का अनुमान लगाने के लिए द्विघात (रिज) दंड के रूप में दंड का उपयोग करते हैं, जिसके परिणामस्वरूप बेहतर अंशांकन होता है
फ्रैंक हरेल

4

मैं इस ब्लॉग का लेखक नहीं हूं और मुझे यह ब्लॉग बेहद मददगार लगा: http://fouryears.eu/2011/10/12/roc-area-under-the-curve-explained

इस स्पष्टीकरण को अपने डेटा पर लागू करने पर, औसत सकारात्मक उदाहरण में लगभग 10% नकारात्मक उदाहरण हैं जो इससे अधिक है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.