सामान्य रूप से वर्गीकरण में ओवरसम्पलिंग और विशेष रूप से SMOTE एल्गोरिदम के बारे में आपकी क्या राय है? वर्ग डेटा में असंतुलन और त्रुटियों की असंतुलित लागत को समायोजित करने के लिए हम सिर्फ लागत / जुर्माना क्यों नहीं लगाएंगे? मेरे उद्देश्यों के लिए, प्रायोगिक इकाइयों के भविष्य के सेट के लिए भविष्यवाणी की सटीकता अंतिम उपाय है।
संदर्भ के लिए, SMOTE पेपर: http://www.jair.org/papers/paper953.html