[इसी तरह का सवाल यहां कोई जवाब नहीं के साथ पूछा गया था ]
मैंने एल 1 नियमितीकरण (लास्सो लॉजिस्टिक रिग्रेशन) के साथ एक लॉजिस्टिक रिग्रेशन मॉडल फिट किया है और मैं महत्व के लिए फिट किए गए गुणांक का परीक्षण करना चाहता हूं और अपने पी-वैल्यू प्राप्त करना चाहता हूं। मुझे पता है कि वाल्ड के परीक्षण (उदाहरण के लिए) नियमितीकरण के बिना पूर्ण प्रतिगमन में व्यक्तिगत गुणांक के महत्व का परीक्षण करने का एक विकल्प है, लेकिन लास्सो के साथ मुझे लगता है कि आगे की समस्याएं उत्पन्न होती हैं जो सामान्य वाल्ड फॉर्मूला लागू करने की अनुमति नहीं देते हैं। उदाहरण के लिए, परीक्षण के लिए neded विचरण अनुमान सामान्य अभिव्यक्तियों का पालन नहीं करते हैं। मूल लैस्सो कागज
http://statweb.stanford.edu/~tibs/lasso/lasso.pdf
गुणांक विचरण का अनुमान लगाने के लिए एक बूटस्ट्रैप-आधारित प्रक्रिया का सुझाव देता है, जो (फिर से, मुझे लगता है) परीक्षणों के लिए आवश्यक हो सकता है (धारा 2.5, पृष्ठ 272 का अंतिम पैराग्राफ और 273 की शुरुआत):
बूटस्ट्रैप के माध्यम से एक दृष्टिकोण है: या तो को ठीक किया जा सकता है या हम प्रत्येक बूटस्ट्रैप नमूने के लिए टी पर अनुकूलन कर सकते हैं । फिक्सिंग टी सबसे अच्छा सबसेट ( सुविधाओं के ) का चयन करने के लिए अनुरूप है और फिर उस सबसेट के लिए कम से कम वर्ग मानक त्रुटि का उपयोग कर रहा है
मुझे जो समझ में आता है वह यह है: जब तक हम नियमितीकरण पैरामीटर (यह बूटस्ट्रैप का हिस्सा नहीं है) के लिए इष्टतम मूल्य नहीं पाते हैं, तब तक पूरे डेटासेट में एक लास्सो रिग्रेशन फिट होता है, और उसके बाद केवल लैसमो द्वारा चुनी गई सुविधाओं का उपयोग करके ओलासमैन को फिट किया जा सकता है डेटा और उन रजिस्टरों में से प्रत्येक से भिन्न की गणना करने के लिए सामान्य सूत्र लागू करें। (और फिर मुझे प्रत्येक गुणांक के उन सभी संस्करणों के साथ क्या करना चाहिए जो प्रत्येक गुणांक के अंतिम संस्करण का अनुमान प्राप्त करते हैं?)
इसके अलावा, क्या यह सामान्य महत्व परीक्षणों (उदाहरण के लिए वाल्ड्स टेस्ट जो अनुमानित बेट्स और वेरिएंस का उपयोग करता है) का उपयोग गुणांक और बूटस्ट्रैप-अनुमानित वेरिएंस के लास्सो अनुमानों के साथ करना सही है? मुझे पूरा यकीन है कि यह नहीं है, लेकिन किसी भी मदद (एक अलग परीक्षण का उपयोग करें, एक अधिक सरल दृष्टिकोण का उपयोग करें, जो भी हो ...) स्वागत से अधिक है।
यहाँ उत्तर के अनुसार मुझे संदेह है और पी-वैल्यूज़ को प्राप्त नहीं किया जा सकता है। मेरे मामले में, पी-वैल्यू एक बाहरी आवश्यकता है (हालांकि एल 1 नियमितीकरण का उपयोग मेरी पसंद था)।
बहुत बहुत धन्यवाद
EDIT क्या होगा यदि मैं ओएलएस लॉजिस्टिक रिग्रेशन को केवल लास्गो लॉजिस्टिक रिग्रेशन के पिछले रन द्वारा चुने गए चर का उपयोग करके फिट करूं? स्पष्ट रूप से ( यहां देखें ),
क्रॉस-वेलिडेशन करने के बाद मॉडल को फिर से चलाने की आवश्यकता नहीं है (आप बस cv.glmnet के आउटपुट से गुणांक प्राप्त करते हैं), और वास्तव में यदि आप बिना दंड के नए लॉजिस्टिक प्रतिगमन मॉडल को फिट करते हैं तो आप उपयोग करने के उद्देश्य को हरा रहे हैं कमंद
लेकिन क्या होगा अगर मैं चर के संख्या को कम रखते हुए पी-मूल्यों की गणना करने में सक्षम होने के एकमात्र उद्देश्य के साथ ऐसा करूं? क्या यह बहुत गंदा तरीका है? :-)