मैं यह जानना चाहूंगा कि क्या वर्गीकरण के लिए मूल डेटासेट को प्रशिक्षण और परीक्षण में विभाजित करते समय यादृच्छिक नमूने के बजाय स्तरीकृत नमूने का उपयोग करने के कोई / कुछ फायदे हैं।
इसके अलावा, स्तरीकृत नमूने यादृच्छिक नमूनाकरण की तुलना में क्लासिफायर में अधिक पूर्वाग्रह का परिचय देता है?
आवेदन, जिसके लिए मैं डेटा तैयारी के लिए स्तरीकृत नमूने का उपयोग करना चाहूंगा, एक यादृच्छिक वन वर्गीकरण है, जिसे पर प्रशिक्षित किया गया है
[१] चावला, नितेश वी।, एट अल। " SMOTE: सिंथेटिक अल्पसंख्यक अति-नमूना तकनीक। " जर्नल ऑफ आर्टिफिशियल इंटेलिजेंस रिसर्च 16 (2002): 321-357।