क्या कोई भी सूची दे सकता है कि एल्गोरिदम को एक-हॉट-एन्कोडेड होने के लिए स्पष्ट विशेषताओं की आवश्यकता क्या होगी और कौन से नहीं होंगे?
AFAIU, यह विशेष डेटा के साथ और अधिक करना है , विशेष एल्गोरिथ्म के साथ कम है । विशेष रूप से, यह इस बात पर निर्भर करता है कि श्रेणियों में कुछ सार्थक क्रम है या नहीं।
दो मामलों पर विचार करें। पहले में आपके पास श्रेणियां खराब, मेह, अच्छी हैं , और दूसरे में आपके पास सेब, नारंगी, नाशपाती हैं । पहले मामले में एक प्राकृतिक आदेश है, क्योंकि मेह शायद बुरे और अच्छे के बीच है , लेकिन शायद सेब, नारंगी, नाशपाती में ऐसा कुछ नहीं होता है ।
यदि आप पहले मामले के लिए एक-हॉट एन्कोडिंग से बचते हैं, तो आप ऑर्डर के बारे में जानकारी "खो" रहे हैं। यदि आप दूसरे मामले के लिए एक-हॉट एन्कोडिंग का उपयोग करते हैं, तो आप श्रेणियों के लिए कुछ आदेश दे रहे हैं जो स्वाभाविक रूप से सच नहीं है।
मैं ऐसा तब करता हूं जब एल्गोरिथ्म समानता की गणना करने के लिए एक दूरी मीट्रिक का उपयोग करता है।
क्यों? मान लीजिए कि सुविधाओं में से एक श्रेणीगत बुरा, meh, अच्छा है , और आपके पास तीन उदाहरण हैं, 1, 2, और 3, जहां वे समान हैं, सिवाय इसके कि 1 बुरा है , 2 meh है , और 3 अच्छा है। आप शायद एल्गोरिथ्म को व्यक्त करना चाहते हैं कि 1 2 से अधिक समान है जो कि 3 है।