मुझे श्रेणीबद्ध और संख्यात्मक डेटा दोनों के साथ एक वर्गीकरण समस्या है। मुझे जो समस्या आ रही है, वह यह है कि मेरा श्रेणीबद्ध डेटा तय नहीं है, इसका मतलब यह है कि जिस नए उम्मीदवार के लिए मैं भविष्यवाणी करना चाहता हूं, उसके पास एक नई श्रेणी हो सकती है जो पहले से नहीं देखी गई थी।
उदाहरण के लिए, यदि मेरा श्रेणीबद्ध डेटा था sex, तो एकमात्र संभव लेबल होगा female, maleऔर other, चाहे जो भी हो। हालाँकि, मेरा श्रेणीबद्ध चर cityइतना है कि ऐसा हो सकता है कि मैं जिस व्यक्ति की भविष्यवाणी करने की कोशिश कर रहा हूं उसके पास एक नया शहर है जिसे मेरे क्लासिफायर ने कभी नहीं देखा है।
मैं सोच रहा हूं कि क्या इन शब्दों में वर्गीकरण करने का कोई तरीका है या यदि मुझे इस नए श्रेणीबद्ध डेटा पर विचार करके फिर से प्रशिक्षण करना चाहिए।
cityकुछ फ़ंक्शन के आधार पर संख्या में परिवर्तित कर सकते हैं ? जैसाcity' = f(latitude, longitude)कि जिस तरह से, आप किसी भी शहर के लिए एक नया मूल्य बना सकते हैं