मैं एक रिग्रेशन समस्या के लिए कुछ अनुभवजन्य सुविधा चयन करने के लिए रैंडम फ़ॉरेस्ट से फीचर इंपोर्टेंस का उपयोग करने की कोशिश कर रहा था, जहां सभी सुविधाएँ श्रेणीबद्ध हैं और उनमें से कई के कई स्तर हैं (100-1000 के आदेश पर)। यह देखते हुए कि एक-गर्म एन्कोडिंग प्रत्येक स्तर के लिए एक डमी वैरिएबल बनाता है, फीचर इंपोर्टेंस प्रत्येक स्तर के लिए है और प्रत्येक सुविधा (स्तंभ) नहीं है। इन फीचर इंपोर्टेंस को एग्रीगेट करने का एक अच्छा तरीका क्या है?
मैंने किसी फीचर के सभी स्तरों के लिए औसत महत्व प्राप्त करने या प्राप्त करने के बारे में सोचा (शायद पूर्व उन स्तरों के साथ उन विशेषताओं के प्रति पक्षपाती होगा)। क्या इस मुद्दे पर कोई संदर्भ हैं?
सुविधाओं की संख्या को कम करने के लिए कोई और क्या कर सकता है? मुझे समूह लसो के बारे में पता है, वह कुछ भी आसान नहीं सीख सका।