मेरे पास विरल विशेषताएं हैं जो भविष्य कहनेवाला हैं, साथ ही मेरे पास कुछ सघन विशेषताएं हैं जो भविष्य कहनेवाला हैं। मुझे क्लासिफायर के समग्र प्रदर्शन को बेहतर बनाने के लिए इन विशेषताओं को एक साथ जोड़ना होगा।
अब, बात यह है कि जब मैं इन्हें एक साथ मिलाने की कोशिश करता हूं, तो घने फीचर्स अधिक विरल सुविधाओं पर हावी हो जाते हैं, इसलिए केवल घने फीचर्स वाले मॉडल की तुलना में AUC में केवल 1% सुधार दिया जाता है।
क्या किसी को भी इसी तरह की समस्याएँ आई हैं? वास्तव में इनपुट की सराहना की, अटक की तरह। मैंने पहले ही अलग-अलग क्लासिफायर, क्लासीफायर के संयोजन, फीचर ट्रांसफॉर्मेशन और विभिन्न एल्गोरिदम के साथ प्रसंस्करण की बहुत कोशिश की है।
मदद के लिए अग्रिम धन्यवाद।
संपादित करें :
मैंने पहले से ही उन सुझावों की कोशिश की है जो टिप्पणियों में दिए गए हैं। मैंने जो देखा है, लगभग 45% डेटा के लिए, विरल सुविधाएँ वास्तव में अच्छा प्रदर्शन करती हैं, मुझे लगभग 0.9 के एयूके केवल विरल सुविधाओं के साथ मिलते हैं, लेकिन शेष लोगों के लिए घनीभूत विशेषताएं लगभग 0.75 के एयूसी के साथ अच्छा प्रदर्शन करती हैं। मैं इन डेटासेट को अलग करने की कोशिश करता हूं, लेकिन मुझे 0.6 का एयूसी मिलता है, इसलिए, मैं बस एक मॉडल को प्रशिक्षित नहीं कर सकता और यह तय कर सकता हूं कि कौन सी सुविधाओं का उपयोग करना है।
कोड स्निपेट के बारे में, मैंने बहुत सी चीजों को आज़माया है, मुझे यकीन नहीं है कि क्या साझा करना है :(