एक साधारण वर्गीकरण में, हमारे पास दो वर्ग हैं: कक्षा -० और कक्षा -१। कुछ आंकड़ों में मेरे पास केवल कक्षा -1 के लिए मान हैं, इसलिए कक्षा -0 के लिए कोई नहीं है। अब मैं क्लास -1 के लिए डेटा मॉडल करने के लिए एक मॉडल बनाने के बारे में सोच रहा हूं। इसलिए, जब नया डेटा आता है, तो यह मॉडल नए डेटा पर लागू होता है और यह कहते हुए एक संभावना पाता है कि नया डेटा इस मॉडल के लिए कितना उपयुक्त है। फिर एक सीमा के साथ तुलना करते हुए, मैं अनुपयुक्त डेटा को फ़िल्टर कर सकता हूं।
मेरे प्रश्न हैं:
- क्या ऐसी समस्याओं के साथ काम करने का यह एक अच्छा तरीका है?
- क्या इस मामले के लिए रैंडमफोरेस्ट क्लासिफायर का इस्तेमाल किया जा सकता है? क्या मुझे कक्षा -० के लिए कृत्रिम डेटा जोड़ने की आवश्यकता है जो मुझे उम्मीद है कि क्लासिफायर का संबंध शोर के रूप में है?
- इस समस्या के लिए कोई अन्य विचार मदद कर सकता है?