"अस्वीकृति को अस्वीकार" क्या है और इसका उपयोग किसी मॉडल की सटीकता बढ़ाने के लिए कैसे किया जा सकता है?


10

क्या कोई इसे विस्तार से बता सकता है:

  1. अधर्म को अस्वीकार करने का क्या अर्थ है?
  2. मेरे मॉडल की सटीकता बढ़ाने के लिए इसका उपयोग कैसे किया जा सकता है?

मेरे पास क्रेडिट कार्ड एप्लिकेशन में हीनता को अस्वीकार करने का विचार है, लेकिन अपने मॉडल की सटीकता को बढ़ाने के लिए इसका उपयोग करने के विचार के साथ संघर्ष कर रहा हूं।

जवाबों:


23

क्रेडिट मॉडल निर्माण में, अस्वीकृति को अस्वीकार करना उन क्रेडिट खातों के प्रदर्शन का उल्लेख करने की प्रक्रिया है जो आवेदन प्रक्रिया में खारिज कर दिए गए थे।

एप्लिकेशन क्रेडिट जोखिम मॉडल का निर्माण करते समय, हम एक मॉडल बनाना चाहते हैं, जिसमें " थ्रू द डोर " प्रयोज्यता हो, यानी, हम सभी एप्लिकेशन डेटा को क्रेडिट जोखिम मॉडल में इनपुट करते हैं, और मॉडल एक जोखिम रेटिंग या प्रायिकता का आउटपुट देता है डिफ़ॉल्ट रूप से। पिछले डेटा से एक मॉडल बनाने के लिए प्रतिगमन का उपयोग करते समय समस्या यह है कि हम केवल पिछले स्वीकृत अनुप्रयोगों के लिए खाते के प्रदर्शन को जानते हैं। हालाँकि, हम अस्वीकार के प्रदर्शन को नहीं जानते हैं, क्योंकि आवेदन करने के बाद हमने उन्हें वापस भेज दिया। यह हमारे मॉडल में चयन पूर्वाग्रह का परिणाम हो सकता है , क्योंकि अगर हम केवल अपने मॉडल में पिछले "स्वीकार" का उपयोग करते हैं, तो मॉडल "थ्रू-द-डोर" आबादी पर अच्छा प्रदर्शन नहीं कर सकता है।

अधर्म को अस्वीकार करने से निपटने के कई तरीके हैं, सभी विवादास्पद हैं। मैं यहाँ दो सरल का उल्लेख करूँगा।

  • "भूतकाल को बुरा मानते हुए परिभाषित करें"
  • टुकड़े टुकड़े करना

"अतीत को अस्वीकार के रूप में बुरा परिभाषित करें" बस खारिज किए गए एप्लिकेशन डेटा के सभी ले रहा है, और मॉडल का निर्माण करते समय इसे त्यागने के बजाय उन सभी को खराब बताएं। यह पद्धति पिछले स्वीकार / अस्वीकार की नीति के प्रति मॉडल को बहुत पूर्वाग्रह करती है।

"पार्सलिंग" थोड़ा अधिक परिष्कृत है। यह मिश्रण है

  1. पिछले "स्वीकार करता है" के साथ प्रतिगमन मॉडल बनाएँ
  2. मॉडल को उन पर जोखिम रेटिंग प्रदान करने के लिए पिछले अस्वीकरणों पर लागू करें
  3. प्रत्येक जोखिम रेटिंग के लिए डिफ़ॉल्ट की अपेक्षित संभावना का उपयोग करते हुए, अस्वीकार किए गए अनुप्रयोगों को अच्छा या बुरा होने के लिए असाइन करें। उदाहरण के लिए, यदि जोखिम रेटिंग में 10% डिफ़ॉल्ट होने की संभावना है, और 100 अस्वीकृत एप्लिकेशन हैं जो इस जोखिम रेटिंग में आते हैं, तो अस्वीकार के 10 को "खराब" और 90 को "अच्छे" के लिए अस्वीकार करें।
  4. स्वीकार किए गए अनुप्रयोगों और अब अस्वीकृत आवेदनों के प्रदर्शन का उपयोग करके प्रतिगमन मॉडल का पुनर्निर्माण करें

चरण 3 में असाइनमेंट को अच्छा या बुरा करने के लिए अलग-अलग तरीके हैं, और इस प्रक्रिया को पुनरावृत्त रूप से भी लागू किया जा सकता है।

जैसा कि पहले कहा गया था, अस्वीकार अस्वीकार का उपयोग विवादास्पद है, और यह कैसे मॉडल का सटीकता बढ़ाने के लिए इस्तेमाल किया जा सकता है पर एक सीधा जवाब देना मुश्किल है। मैं बस कुछ अन्य लोगों को इस मामले पर उद्धृत करूंगा।

जोनाथन क्रुक और जॉन बनासिक, रिजेक्शन इनविज़न वास्तव में एप्लीकेशन स्कोरिंग मॉडल के प्रदर्शन में सुधार करता है?

सबसे पहले, यहां तक ​​कि जहां आवेदकों के एक बहुत बड़े अनुपात को खारिज कर दिया जाता है, केवल स्वीकार किए गए मॉडल पर सुधार करने की गुंजाइश मामूली रूप से प्रकट होती है। जहां अस्वीकृति दर इतनी बड़ी नहीं है, वह दायरा वास्तव में बहुत छोटा प्रतीत होता है।

डेविड हैंड, "डायरेक्ट इनफरेंस इन क्रेडिट ऑपरेशंस", हैंडबुक ऑफ़ क्रेडिट स्कोरिंग, 2001 में प्रदर्शित हुआ

कई तरीके प्रस्तावित किए गए हैं और उनका उपयोग किया जाता है और, जबकि उनमें से कुछ स्पष्ट रूप से खराब हैं और कभी भी अनुशंसित नहीं किया जाना चाहिए, जब तक कि अतिरिक्त जानकारी प्राप्त न हो, सार्वभौमिक प्रयोज्यता की कोई अनूठी सर्वोत्तम विधि नहीं है। यही है, सबसे अच्छा समाधान उन आवेदकों के बारे में अधिक जानकारी (शायद कुछ संभावित अस्वीकारों को ऋण देकर) प्राप्त करना है जो अस्वीकार क्षेत्र में आते हैं।


1
व्यापक अवलोकन के लिए +1। अब मुझे यह भी पता है कि
अधर्म

1
धन्यवाद। लेकिन आप चरण 3 में कैसे असाइन करते हैं? मैंने पढ़ा है कि 1 या 0 का उपयोग करने के लिए आप प्रत्येक पंक्ति के लिए प्रायिकता का उपयोग कर सकते हैं। तो आपके पास एक ही व्यक्ति होगा जिसमें 10% और 90% होंगे। नए लॉजिस्टिक मॉडल निर्माण के साथ यह कैसे काम कर सकता है?
GABLP

1

@GabyLP पिछली टिप्पणियों में। मेरे अनुभव के आधार पर आप ऐसे क्लाइंट को दो भागों में विभाजित कर सकते हैं और प्रायिकता के अनुसार दोनों विभाजन के लिए वेट असाइन कर सकते हैं। उदाहरण के लिए यदि अस्वीकृत ग्राहक के पास 10% पीडी है तो आप दो ग्राहकों को इसमें से एक बना सकते हैं। पहले लक्ष्य चर 1 और वजन 0.1 और दूसरा लक्ष्य चर 0 और वजन 0.9 वाले।

ग्राहकों के पूरे स्वीकृत नमूने का वजन == 1 होगा।

जबकि यह लॉजिस्टिक रिग्रेशन के साथ काम करता है, यह ट्री बेस्ड मॉडल्स के साथ काम नहीं करता है।


क्या आपके पास अपने बयान के लिए एक स्रोत है?
टी। बेज

यदि प्रश्न इसके बारे में है कि यह पेड़ आधारित मॉडल पर काम नहीं कर रहा है तो मेरा उत्तर है - व्यक्तिगत अनुभव। मैंने इस दृष्टिकोण को लागू करने की कोशिश की है लेकिन सफल नहीं हुआ है।
मिकसएल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.