मैं लासो और रिज दोनों के साथ एक प्रतिगमन मॉडल चला रहा हूं (0-5 से भिन्न असतत परिणाम चर की भविष्यवाणी करने के लिए)। मॉडल को चलाने से पहले, मैं 250 से 25 तक सेट की गई सुविधा को कम करने SelectKBest
के scikit-learn
लिए विधि का उपयोग करता हूं । एक प्रारंभिक सुविधा के चयन के बिना, लैस्सो और रिज दोनों ही कम सटीकता स्कोर के लिए उपज देते हैं [जो कि छोटे नमूना आकार, 600 के कारण हो सकता है]। इसके अलावा, ध्यान दें कि कुछ विशेषताएं सहसंबद्ध हैं।
मॉडल को चलाने के बाद, मैं देखता हूं कि लसो और रिज के साथ भविष्यवाणी की सटीकता लगभग समान है। हालांकि, जब मैं गुणांक के पूर्ण मूल्य द्वारा उन्हें ऑर्डर करने के बाद पहले 10 विशेषताओं की जांच करता हूं, तो मैं देखता हूं कि अधिकांश% 50 ओवरलैप है।
यही है, यह देखते हुए कि प्रत्येक विधि द्वारा विशेषताओं के विभिन्न महत्व को सौंपा गया था, मेरे द्वारा चुने गए मॉडल पर मेरी पूरी तरह से अलग व्याख्या हो सकती है।
आम तौर पर, सुविधाएँ एक वेब साइट में उपयोगकर्ता व्यवहार के कुछ पहलुओं का प्रतिनिधित्व करती हैं। इसलिए, मैं सुविधाओं (उपयोगकर्ता व्यवहार) को मजबूत पूर्वानुमानात्मक क्षमता बनाम कमजोर सुविधाओं (उपयोगकर्ता व्यवहार) के साथ उजागर करके निष्कर्षों की व्याख्या करना चाहता हूं। हालांकि, मुझे नहीं पता कि इस बिंदु पर कैसे आगे बढ़ना है। मुझे मॉडल की व्याख्या करने के लिए कैसे दृष्टिकोण करना चाहिए? उदाहरण के लिए, दोनों को संयोजित करना चाहिए और ओवरलैपिंग को उजागर करना चाहिए, या क्या मुझे लस्सो के साथ जाना चाहिए क्योंकि यह अधिक व्याख्यात्मकता प्रदान करता है?
Normally, the features represent some aspects of user behavior in a web site. Therefore, I want to explain the findings by highlighting the features (user behaviors) with stronger predictive ability vs weaker features (user behaviors) .