क्या एक गर्म वैक्टर को संख्यात्मक विशेषताओं के साथ बढ़ाया जाना चाहिए


20

श्रेणीगत और संख्यात्मक विशेषताओं के संयोजन के मामले में, मैं आमतौर पर श्रेणीगत विशेषताओं को एक गर्म वैक्टर में परिवर्तित करता हूं। मेरा सवाल यह है कि क्या मैं उन वैक्टरों को छोड़ता हूं और मानकीकरण / सामान्यीकरण के माध्यम से संख्यात्मक विशेषताओं को मापता हूं, या क्या मुझे संख्यात्मक विशेषताओं के साथ एक गर्म वैक्टर को स्केल करना चाहिए?

जवाबों:


11

एक बार संख्यात्मक रूप में परिवर्तित हो जाने के बाद, मॉडल किसी भी अन्य संख्यात्मक डेटा की तुलना में एक-हॉट-एन्कोड किए गए कॉलम के लिए अलग-अलग प्रतिक्रिया नहीं देते हैं। यदि आप अन्य स्तंभों को तैयार करने के लिए किसी भी कारण से ऐसा कर रहे हैं, तो {0,1} मानों को सामान्य करने के लिए एक स्पष्ट मिसाल है।

ऐसा करने का प्रभाव मॉडल वर्ग, और आपके द्वारा लागू किए जाने वाले सामान्यीकरण के प्रकार पर निर्भर करेगा, लेकिन मैंने कुछ 0 (छोटे) सुधारों पर ध्यान दिया है जब स्केलिंग का मतलब 0, std 1 के लिए एक-हॉट-एन्कोडेड श्रेणीबद्ध डेटा, जब तंत्रिका नेटवर्क को प्रशिक्षित करना है।

यह दूरी मीट्रिक के आधार पर मॉडल कक्षाओं के लिए भी एक अंतर बना सकता है।

दुर्भाग्य से, इस तरह के अधिकांश विकल्पों में से, अक्सर आपको दोनों दृष्टिकोणों को आज़माना होगा और सबसे अच्छे मीट्रिक के साथ लेना होगा।


1
शब्दांकन थोड़ा अस्पष्ट था। क्या आप कह रहे हैं कि यदि आप किसी भी गैर-ओह कॉलम को सामान्यीकृत करते हैं, तो आप केवल एक-हॉट-एन्कोडेड कॉलम को सामान्य कर सकते हैं?
Info5ek

@ Info5ek: मैं कह रहा हूं कि एक-हॉट-एन्कोडेड कॉलम को सामान्य करने के लिए बेहतर हो सकता है, और यदि आप पहले से ही अन्य कॉलमों के लिए कर रहे हैं, तो आप इसे भी आजमा सकते हैं। इसके लिए कोई निश्चित नियम नहीं हैं, बहुत अधिक समस्या हाथ पर निर्भर करती है।
नील स्लेटर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.