मैं शायद एक ऐसी समस्या से निपट रहा हूं जो शायद पहले सौ बार हल हो गई है, लेकिन मुझे यकीन नहीं है कि उत्तर कहां मिलेगा।
रसद प्रतिगमन का उपयोग करते समय, यह देखते हुए कई सुविधाओं और बाइनरी श्रेणीबद्ध मूल्य y की भविष्यवाणी करने की कोशिश कर रहा है, मैं उन विशेषताओं के सबसेट का चयन करने में दिलचस्पी रखता हूं जो वाई अच्छी तरह से भविष्यवाणी करता है ।
क्या लसो के समान एक प्रक्रिया है जिसका उपयोग किया जा सकता है? (मैंने केवल लेज़रों को रैखिक प्रतिगमन के लिए इस्तेमाल किया है।)
क्या अलग-अलग विशेषताओं के महत्व के संकेतित मॉडल के गुणांक को देख रहा है?
संपादित करें - कुछ उत्तरों को देखने के बाद स्पष्टीकरण:
जब मैं फिट किए गए गुणांक के परिमाण का उल्लेख करता हूं, तो मेरा मतलब उन लोगों से है जो सामान्यीकृत (मतलब 0 और विचरण 1) सुविधाओं से लैस हैं। अन्यथा, जैसा कि @probabilityislogic ने बताया है, 1000x x से कम महत्वपूर्ण दिखाई देगा।
मैं केवल सबसे अच्छा k- सबसेट (@ डेविड की पेशकश कर रहा था) खोजने में दिलचस्पी नहीं रखता, बल्कि एक दूसरे के सापेक्ष विभिन्न विशेषताओं के महत्व को मापता हूं। उदाहरण के लिए, एक विशेषता "आयु" और दूसरी विशेषता "आयु> 30" हो सकती है। उनका वृद्धिशील महत्व थोड़ा हो सकता है, लेकिन दोनों महत्वपूर्ण हो सकते हैं।