पूर्वाग्रह सुधार क्या है? [बन्द है]


12

मैंने कई स्थानों को देखा है जहां उनके पास इनपुट / आउटपुट डेटासेट हैं जहां वे पहली बार एक रैखिक प्रतिगमन रेखा बनाते हैं, पूर्वाग्रह को सही करते हैं, और उसके बाद ही अपने मॉडल के लिए उस डेटा का उपयोग करते हैं। मुझे नहीं मिला कि यह पूर्वाग्रह सुधार क्या है?


6
मुझे लगता है कि आपको एक संदर्भ या एक स्पष्ट उदाहरण की आपूर्ति करने की आवश्यकता हो सकती है ताकि हम ठीक से जान सकें कि यह आप पर क्या प्रतिक्रिया कर रहे हैं।
whuber

@ n-0101, कृपया एक बार में कुछ करें, मुख्य पृष्ठ को स्पैम न करें।
गंग -

@gung: आह .. तुम्हारा मतलब है टैग कुछ और फिर थोड़ा इंतजार करो? खेद है बहुत देर हो चुकी। मैंने केवल 10 या तो पाया, और मैंने सिर्फ उन सभी को किया। फ्रंट पेज इफ़ेक्ट के बारे में भूल गए: / यदि केवल SE के पास एक अच्छा मास-टैगिंग फीचर था।
naught101

@ गुंग: शायद आज उद्घाटन पूर्वाग्रह-सुधार दिवस हो सकता है: D
naught101

1
@ naught101 एकतरफा बड़े पैमाने पर होने वाली गोलीबारी में कोई कमी नहीं है, खासकर आपके द्वारा किए गए टैग पर। मोटे तौर पर यह मेटा पर संलग्न होने के लिए सबसे अच्छा है जहां व्यवहार्य (यह समझाने के लिए कि आप क्या इरादा रखते हैं), और अगर यह अनियंत्रित लगता है, तो कुछ रीटैगिंग करने के लिए लेकिन एक समय में केवल कुछ।
Glen_b -Reinstate Monica

जवाबों:


11

यद्यपि समस्या का विवरण सटीक रूप से यह जानने के लिए पर्याप्त नहीं है कि आप किस प्रकार के पूर्वाग्रह सुधार का उल्लेख कर रहे हैं, मुझे लगता है कि मैं इसके बारे में सामान्य शब्द में बात कर सकता हूं। कभी-कभी एक अनुमानक पक्षपाती हो सकता है। इसका केवल यह अर्थ है कि यद्यपि यह एक अच्छा अनुमानक हो सकता है, इसका अपेक्षित या औसत मूल्य पैरामीटर के बराबर नहीं है। अनुमानक के औसत और सच्चे पैरामीटर मान के बीच अंतर को पूर्वाग्रह कहा जाता है। जब एक अनुमानक पक्षपाती होने के लिए जाना जाता है, तो यह कभी-कभी संभव होता है, अन्य तरीकों से, पूर्वाग्रह का अनुमान लगाने के लिए और फिर मूल अनुमान से अनुमानित पूर्वाग्रह को घटाकर अनुमानक को संशोधित करता है। इस प्रक्रिया को पूर्वाग्रह सुधार कहा जाता है। यह अनुमान को बेहतर बनाने के इरादे से किया जाता है। यह पूर्वाग्रह को कम करेगा, वहीं यह विचरण को भी बढ़ाएगा।

सफल पूर्वाग्रह सुधार का एक अच्छा उदाहरण वर्गीकरण त्रुटि दर का बूटस्ट्रैप पूर्वाग्रह सुधार अनुमान है। नमूना आकार छोटा होने पर त्रुटि दर के पुनर्वितरण अनुमान में एक बड़ा आशावादी पूर्वाग्रह है। बूटस्ट्रैप का उपयोग पुनर्जीवन अनुमान के पूर्वाग्रह का अनुमान लगाने के लिए किया जाता है और पुनर्जीवन के अनुमान के बाद से त्रुटि दर को कम करके आंका जाता है क्योंकि बूटस्ट्रैप पूर्वाग्रह को त्रुटि दर के सही अनुमान को प्राप्त करने के लिए पूर्वाग्रह के अनुमान को पूर्वाग्रह अनुमान में जोड़ा जाता है। जब नमूना आकार छोटा 30 या दो वर्गों के संयोजन में दो वर्गों की समस्या में बूटस्ट्रैप अनुमान के कुछ रूपों (विशेष रूप से 632 अनुमान), छुट्टी-एक-आउट क्रॉस सत्यापन की तुलना में त्रुटि दर के अधिक सटीक अनुमान प्रदान करता है (जो कि एक बहुत ही है त्रुटि दर का लगभग निष्पक्ष अनुमान)।


1
"जबकि यह पूर्वाग्रह को कम करेगा यह विचरण को भी बढ़ाएगा।" - क्या आप समझा सकते हैं कि थोड़ा और अधिक? क्या यह विधि पर निर्भर नहीं करता है? क्या आप मूल रूप से मतलब है कि एक RMSE- इष्टतम रैखिक प्रतिगमन के पूर्वाग्रह को कम करने से जरूरी RMSE बढ़ जाएगा, या यह कुछ और है?
n
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.