"अस्वीकृति को अस्वीकार" क्या है और इसका उपयोग किसी मॉडल की सटीकता बढ़ाने के लिए कैसे किया जा सकता है?

10

क्या कोई इसे विस्तार से बता सकता है:

अधर्म को अस्वीकार करने का क्या अर्थ है?
मेरे मॉडल की सटीकता बढ़ाने के लिए इसका उपयोग कैसे किया जा सकता है?

मेरे पास क्रेडिट कार्ड एप्लिकेशन में हीनता को अस्वीकार करने का विचार है, लेकिन अपने मॉडल की सटीकता को बढ़ाने के लिए इसका उपयोग करने के विचार के साथ संघर्ष कर रहा हूं।

logistic

— आयुष बियानी
स्रोत

23

क्रेडिट मॉडल निर्माण में, अस्वीकृति को अस्वीकार करना उन क्रेडिट खातों के प्रदर्शन का उल्लेख करने की प्रक्रिया है जो आवेदन प्रक्रिया में खारिज कर दिए गए थे।

एप्लिकेशन क्रेडिट जोखिम मॉडल का निर्माण करते समय, हम एक मॉडल बनाना चाहते हैं, जिसमें " थ्रू द डोर " प्रयोज्यता हो, यानी, हम सभी एप्लिकेशन डेटा को क्रेडिट जोखिम मॉडल में इनपुट करते हैं, और मॉडल एक जोखिम रेटिंग या प्रायिकता का आउटपुट देता है डिफ़ॉल्ट रूप से। पिछले डेटा से एक मॉडल बनाने के लिए प्रतिगमन का उपयोग करते समय समस्या यह है कि हम केवल पिछले स्वीकृत अनुप्रयोगों के लिए खाते के प्रदर्शन को जानते हैं। हालाँकि, हम अस्वीकार के प्रदर्शन को नहीं जानते हैं, क्योंकि आवेदन करने के बाद हमने उन्हें वापस भेज दिया। यह हमारे मॉडल में चयन पूर्वाग्रह का परिणाम हो सकता है , क्योंकि अगर हम केवल अपने मॉडल में पिछले "स्वीकार" का उपयोग करते हैं, तो मॉडल "थ्रू-द-डोर" आबादी पर अच्छा प्रदर्शन नहीं कर सकता है।

अधर्म को अस्वीकार करने से निपटने के कई तरीके हैं, सभी विवादास्पद हैं। मैं यहाँ दो सरल का उल्लेख करूँगा।

"भूतकाल को बुरा मानते हुए परिभाषित करें"
टुकड़े टुकड़े करना

"अतीत को अस्वीकार के रूप में बुरा परिभाषित करें" बस खारिज किए गए एप्लिकेशन डेटा के सभी ले रहा है, और मॉडल का निर्माण करते समय इसे त्यागने के बजाय उन सभी को खराब बताएं। यह पद्धति पिछले स्वीकार / अस्वीकार की नीति के प्रति मॉडल को बहुत पूर्वाग्रह करती है।

"पार्सलिंग" थोड़ा अधिक परिष्कृत है। यह मिश्रण है

पिछले "स्वीकार करता है" के साथ प्रतिगमन मॉडल बनाएँ
मॉडल को उन पर जोखिम रेटिंग प्रदान करने के लिए पिछले अस्वीकरणों पर लागू करें
प्रत्येक जोखिम रेटिंग के लिए डिफ़ॉल्ट की अपेक्षित संभावना का उपयोग करते हुए, अस्वीकार किए गए अनुप्रयोगों को अच्छा या बुरा होने के लिए असाइन करें। उदाहरण के लिए, यदि जोखिम रेटिंग में 10% डिफ़ॉल्ट होने की संभावना है, और 100 अस्वीकृत एप्लिकेशन हैं जो इस जोखिम रेटिंग में आते हैं, तो अस्वीकार के 10 को "खराब" और 90 को "अच्छे" के लिए अस्वीकार करें।
स्वीकार किए गए अनुप्रयोगों और अब अस्वीकृत आवेदनों के प्रदर्शन का उपयोग करके प्रतिगमन मॉडल का पुनर्निर्माण करें

चरण 3 में असाइनमेंट को अच्छा या बुरा करने के लिए अलग-अलग तरीके हैं, और इस प्रक्रिया को पुनरावृत्त रूप से भी लागू किया जा सकता है।

जैसा कि पहले कहा गया था, अस्वीकार अस्वीकार का उपयोग विवादास्पद है, और यह कैसे मॉडल का सटीकता बढ़ाने के लिए इस्तेमाल किया जा सकता है पर एक सीधा जवाब देना मुश्किल है। मैं बस कुछ अन्य लोगों को इस मामले पर उद्धृत करूंगा।

जोनाथन क्रुक और जॉन बनासिक, रिजेक्शन इनविज़न वास्तव में एप्लीकेशन स्कोरिंग मॉडल के प्रदर्शन में सुधार करता है?

सबसे पहले, यहां तक कि जहां आवेदकों के एक बहुत बड़े अनुपात को खारिज कर दिया जाता है, केवल स्वीकार किए गए मॉडल पर सुधार करने की गुंजाइश मामूली रूप से प्रकट होती है। जहां अस्वीकृति दर इतनी बड़ी नहीं है, वह दायरा वास्तव में बहुत छोटा प्रतीत होता है।

डेविड हैंड, "डायरेक्ट इनफरेंस इन क्रेडिट ऑपरेशंस", हैंडबुक ऑफ़ क्रेडिट स्कोरिंग, 2001 में प्रदर्शित हुआ

कई तरीके प्रस्तावित किए गए हैं और उनका उपयोग किया जाता है और, जबकि उनमें से कुछ स्पष्ट रूप से खराब हैं और कभी भी अनुशंसित नहीं किया जाना चाहिए, जब तक कि अतिरिक्त जानकारी प्राप्त न हो, सार्वभौमिक प्रयोज्यता की कोई अनूठी सर्वोत्तम विधि नहीं है। यही है, सबसे अच्छा समाधान उन आवेदकों के बारे में अधिक जानकारी (शायद कुछ संभावित अस्वीकारों को ऋण देकर) प्राप्त करना है जो अस्वीकार क्षेत्र में आते हैं।

— डेरेक प्लोर
स्रोत

1

व्यापक अवलोकन के लिए +1। अब मुझे यह भी पता है कि

— अधर्म

1

धन्यवाद। लेकिन आप चरण 3 में कैसे असाइन करते हैं? मैंने पढ़ा है कि 1 या 0 का उपयोग करने के लिए आप प्रत्येक पंक्ति के लिए प्रायिकता का उपयोग कर सकते हैं। तो आपके पास एक ही व्यक्ति होगा जिसमें 10% और 90% होंगे। नए लॉजिस्टिक मॉडल निर्माण के साथ यह कैसे काम कर सकता है?

— GABLP

1

@GabyLP पिछली टिप्पणियों में। मेरे अनुभव के आधार पर आप ऐसे क्लाइंट को दो भागों में विभाजित कर सकते हैं और प्रायिकता के अनुसार दोनों विभाजन के लिए वेट असाइन कर सकते हैं। उदाहरण के लिए यदि अस्वीकृत ग्राहक के पास 10% पीडी है तो आप दो ग्राहकों को इसमें से एक बना सकते हैं। पहले लक्ष्य चर 1 और वजन 0.1 और दूसरा लक्ष्य चर 0 और वजन 0.9 वाले।

ग्राहकों के पूरे स्वीकृत नमूने का वजन == 1 होगा।

जबकि यह लॉजिस्टिक रिग्रेशन के साथ काम करता है, यह ट्री बेस्ड मॉडल्स के साथ काम नहीं करता है।

— MiksL
स्रोत

क्या आपके पास अपने बयान के लिए एक स्रोत है?

— टी। बेज

यदि प्रश्न इसके बारे में है कि यह पेड़ आधारित मॉडल पर काम नहीं कर रहा है तो मेरा उत्तर है - व्यक्तिगत अनुभव। मैंने इस दृष्टिकोण को लागू करने की कोशिश की है लेकिन सफल नहीं हुआ है।

— मिकसएल