मैंने एक लॉजिस्टिक रिग्रेशन क्लासिफ़ायर बनाया है जो मेरे डेटा पर बहुत सटीक है। अब मैं बेहतर तरीके से समझना चाहता हूं कि यह इतना अच्छा क्यों काम कर रहा है। विशेष रूप से, मैं रैंक करना चाहूंगा कि कौन सी सुविधाएँ सबसे बड़ा योगदान दे रही हैं (जो सुविधाएँ सबसे महत्वपूर्ण हैं) और, आदर्श रूप से, यह निर्दिष्ट करें कि प्रत्येक मॉडल समग्र मॉडल (या इस नस में कुछ) की सटीकता में कितना योगदान दे रहा है। मैं यह कैसे करु?
मेरा पहला विचार उन्हें उनके गुणांक के आधार पर रैंक करना था, लेकिन मुझे संदेह है कि यह सही नहीं हो सकता। अगर मेरे पास दो विशेषताएं हैं जो समान रूप से उपयोगी हैं, लेकिन पहले का प्रसार दूसरे की तुलना में दस गुना बड़ा है, तो मैं पहले को दूसरे की तुलना में कम गुणांक प्राप्त करने की उम्मीद करूंगा। क्या सुविधा के महत्व का मूल्यांकन करने का अधिक उचित तरीका है?
ध्यान दें कि मैं यह समझने की कोशिश नहीं कर रहा हूं कि फीचर में एक छोटा सा बदलाव परिणाम की संभावना को प्रभावित करता है। बल्कि, मैं यह समझने की कोशिश कर रहा हूं कि क्लासिफायर को सटीक बनाने के मामले में प्रत्येक सुविधा कितनी मूल्यवान है। इसके अलावा, मेरा लक्ष्य इतना नहीं है कि फीचर का चयन करें या कम सुविधाओं के साथ एक मॉडल का निर्माण करें, लेकिन सीखे हुए मॉडल के लिए कुछ "स्पष्टीकरण" प्रदान करने का प्रयास करें, इसलिए क्लासिफायर सिर्फ एक अपारदर्शी ब्लैक-बॉक्स नहीं है।