एक असंतुलित डेटासेट बनाना


11

मैं अपने प्रशिक्षित मॉडल का असंतुलित डेटासेट पर परीक्षण करना चाहूंगा। क्या संतुलित लेबल डेटासेट (स्पैम / गैर-स्पैम) से सिंथेटिक डेटा उत्पन्न करने के लिए कोई एल्गोरिदम उपलब्ध है?


आप किसी भी डेटा को केवल एक वर्ग को रेखांकित करके हमेशा असंतुलित कर सकते हैं।
user2974951

जवाबों:


8

SMOTE का प्रयास करें , इसका एल्गोरिथ्म ओवर-सैंपलिंग के लिए उपयोग किया जाता है। यह उस वर्ग से सिंथेटिक नमूने बनाता है जिसे आप ओवर-सैंपल चाहते हैं।

आप अपनी ज़रूरत के किसी भी नमूने को बनाने के लिए इसका उपयोग कर सकते हैं।


1
क्या SMOTE का उपयोग अंडर-सैंपलिंग के लिए भी किया जा सकता है?
स्टुअर्ट पीटरसन

ठीक है, आप वर्ग ए के द्वारा वर्ग ए के
अंडरसैंपलिंग

3
@StuartPeterson नहीं, SMOTE एक ओवर-सैंपलिंग एल्गोरिथ्म है, लेकिन कई अन्य अंडर-सैंपलिंग एल्गोरिदम हैं
1893 में मैरी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.