रैंडमफॉरस्ट मॉडल का उपयोग करते हुए परीक्षण डेटा की भविष्यवाणी करते समय मुझे वैल्यूआवर मिला।
मेरा कोड:
clf = RandomForestClassifier(n_estimators=10, max_depth=6, n_jobs=1, verbose=2)
clf.fit(X_fit, y_fit)
df_test.fillna(df_test.mean())
X_test = df_test.values
y_pred = clf.predict(X_test)
त्रुटि:
ValueError: Input contains NaN, infinity or a value too large for dtype('float32').
मुझे परीक्षण डेटासेट में खराब मान कैसे मिलते हैं? इसके अलावा, मैं इन रिकॉर्ड्स को नहीं छोड़ना चाहता, क्या मैं उन्हें केवल माध्य या माध्यिका से बदल सकता हूं?
धन्यवाद।