मान लें, मेरे पास एक क्लासिफायरियर है (यह किसी भी मानक क्लासिफायरिफायर हो सकता है जैसे नीचे दिए गए कोड का उपयोग करके धोखाधड़ी का पता लगाने के लिए निर्णय पेड़, यादृच्छिक वन, लॉजिस्टिक प्रतिगमन .. आदि)।
library(randomForest)
rfFit = randomForest(Y ~ ., data = myData, ntree = 400) # A very basic classifier
Say, Y is a binary outcome - Fraud/Not-Fraud
अब, मैंने अनदेखी डेटा सेट पर भविष्यवाणी की है ।
pred = predict(rfFit, newData)
फिर मैंने अपने वर्गीकरण पर जांच टीम से प्रतिक्रिया प्राप्त की और पाया कि मैंने एक धोखाधड़ी को गैर-धोखाधड़ी (यानी एक झूठी नकारात्मक ) के रूप में वर्गीकृत करने की गलती की है । वहाँ वैसे भी है कि मैं अपने एल्गोरिथ्म को समझने दे सकता हूँ कि यह एक गलती की है? यानी एल्गोरिथ्म में एक फीडबैक लूप जोड़ने का कोई तरीका ताकि यह गलतियों को ठीक कर सके?
एक विकल्प जो मैं सोच सकता हूं कि मेरे सिर के ऊपर से एक का निर्माण होता है adaboost classifierताकि नया क्लासिफायरियर पुराने की गलती को ठीक कर दे। या मैंने कुछ सुना है Incremental Learningया Online learning। क्या इसमें कोई मौजूदा कार्यान्वयन (पैकेज) हैं R?
क्या यह सही तरीका है? या क्या इसे खरोंच से बनाने के बजाय मॉडल को मोड़ने का कोई और तरीका है?