मैं आर में एक यादृच्छिक वन मॉडल का उपयोग करके भविष्यवाणियां करने की कोशिश कर रहा हूं।
हालाँकि, मुझे त्रुटि मिलती है क्योंकि प्रशिक्षण सेट की तुलना में कुछ कारकों का परीक्षण सेट में भिन्न मूल्य है। उदाहरण के लिए, एक कारक Cat_2
में मान हैं 34, 68, 76
, आदि, परीक्षण सेट में जो प्रशिक्षण सेट में प्रकट नहीं होता है। दुर्भाग्य से, टेस्ट सेट पर मेरा नियंत्रण नहीं है ... मुझे इसका उपयोग करना चाहिए।
मेरा एकमात्र काम समस्याग्रस्त कारकों को संख्यात्मक मानों में परिवर्तित करना था, उपयोग करना as.numeric()
। यह काम करता है लेकिन मैं बहुत संतुष्ट नहीं हूं, क्योंकि ये मूल्य ऐसे कोड हैं जिनमें कोई संख्यात्मक अर्थ नहीं है ...
क्या आपको लगता है कि परीक्षण सेट से नए मूल्यों को छोड़ने के लिए एक और समाधान होगा? लेकिन सभी अन्य कारक मूल्यों को हटाने के बिना (मान मानें 1, 2, 14, 32
, आदि) जो प्रशिक्षण और परीक्षण दोनों में हैं, और भविष्यवाणियों के लिए संभावित रूप से उपयोगी जानकारी शामिल हैं।