यह सामान्य रूप से एक प्रश्न है, किसी विधि या डेटा सेट के लिए विशिष्ट नहीं है। हम सुपरवाइज्ड मशीन लर्निंग में एक वर्ग असंतुलन की समस्या से कैसे निपटते हैं, जहां 0 की संख्या 90% के आसपास है और 1 की संख्या आपके डेटासेट में लगभग 10% है। क्या हम बेहतर रूप से क्लासिफायर ट्रेन करते हैं।
मेरे द्वारा अनुसरण किए जाने वाले तरीकों में से एक डेटासेट को संतुलित करने के लिए नमूना है और फिर क्लासिफायरियर को प्रशिक्षित करके कई नमूनों के लिए इसे दोहराएं।
मुझे लगता है कि यह यादृच्छिक है, क्या इस तरह की समस्याओं से निपटने के लिए कोई रूपरेखा है।