जब एमएल एल्गोरिदम, उदाहरण के लिए Vowpal Wabbit या जीतने वाले कुछ कारक मशीनों ने दर प्रतियोगिताओं ( कागल ) के माध्यम से क्लिक किया , तो उल्लेख किया कि विशेषताएं ' हैशेड ' हैं, वास्तव में मॉडल के लिए इसका क्या मतलब है? कहते हैं कि एक चर है जो एक इंटरनेट ऐड की आईडी का प्रतिनिधित्व करता है, जो '236BG231' जैसे मूल्यों को लेता है। तब मैं समझता हूं कि यह सुविधा यादृच्छिक पूर्णांक के लिए हैशेड है। लेकिन, मेरा सवाल यह है:
- क्या पूर्णांक अब मॉडल में पूर्णांक (संख्यात्मक) या के रूप में उपयोग किया जाता है
- क्या हैशेड मूल्य वास्तव में एक श्रेणीगत चर और एक-गर्म-एन्कोडेड की तरह व्यवहार किया जाता है? इस प्रकार हैशिंग ट्रिक केवल बड़े डेटा के साथ किसी तरह अंतरिक्ष को बचाने के लिए है?