मुझे श्रेणीबद्ध और संख्यात्मक डेटा दोनों के साथ एक वर्गीकरण समस्या है। मुझे जो समस्या आ रही है, वह यह है कि मेरा श्रेणीबद्ध डेटा तय नहीं है, इसका मतलब यह है कि जिस नए उम्मीदवार के लिए मैं भविष्यवाणी करना चाहता हूं, उसके पास एक नई श्रेणी हो सकती है जो पहले से नहीं देखी गई थी।
उदाहरण के लिए, यदि मेरा श्रेणीबद्ध डेटा था sex
, तो एकमात्र संभव लेबल होगा female
, male
और other
, चाहे जो भी हो। हालाँकि, मेरा श्रेणीबद्ध चर city
इतना है कि ऐसा हो सकता है कि मैं जिस व्यक्ति की भविष्यवाणी करने की कोशिश कर रहा हूं उसके पास एक नया शहर है जिसे मेरे क्लासिफायर ने कभी नहीं देखा है।
मैं सोच रहा हूं कि क्या इन शब्दों में वर्गीकरण करने का कोई तरीका है या यदि मुझे इस नए श्रेणीबद्ध डेटा पर विचार करके फिर से प्रशिक्षण करना चाहिए।
city
कुछ फ़ंक्शन के आधार पर संख्या में परिवर्तित कर सकते हैं ? जैसाcity' = f(latitude, longitude)
कि जिस तरह से, आप किसी भी शहर के लिए एक नया मूल्य बना सकते हैं