मान लें, मेरे पास एक क्लासिफायरियर है (यह किसी भी मानक क्लासिफायरिफायर हो सकता है जैसे नीचे दिए गए कोड का उपयोग करके धोखाधड़ी का पता लगाने के लिए निर्णय पेड़, यादृच्छिक वन, लॉजिस्टिक प्रतिगमन .. आदि)।
library(randomForest)
rfFit = randomForest(Y ~ ., data = myData, ntree = 400) # A very basic classifier
Say, Y is a binary outcome - Fraud/Not-Fraud
अब, मैंने अनदेखी डेटा सेट पर भविष्यवाणी की है ।
pred = predict(rfFit, newData)
फिर मैंने अपने वर्गीकरण पर जांच टीम से प्रतिक्रिया प्राप्त की और पाया कि मैंने एक धोखाधड़ी को गैर-धोखाधड़ी (यानी एक झूठी नकारात्मक ) के रूप में वर्गीकृत करने की गलती की है । वहाँ वैसे भी है कि मैं अपने एल्गोरिथ्म को समझने दे सकता हूँ कि यह एक गलती की है? यानी एल्गोरिथ्म में एक फीडबैक लूप जोड़ने का कोई तरीका ताकि यह गलतियों को ठीक कर सके?
एक विकल्प जो मैं सोच सकता हूं कि मेरे सिर के ऊपर से एक का निर्माण होता है adaboost classifier
ताकि नया क्लासिफायरियर पुराने की गलती को ठीक कर दे। या मैंने कुछ सुना है Incremental Learning
या Online learning
। क्या इसमें कोई मौजूदा कार्यान्वयन (पैकेज) हैं R
?
क्या यह सही तरीका है? या क्या इसे खरोंच से बनाने के बजाय मॉडल को मोड़ने का कोई और तरीका है?