मुझे लगता है कि बूस्ट एसईपी को मजबूत करने के लिए सबसे अच्छा विकल्प होगा। यह संकोचन विधियों का उपयोग करते हुए कुछ लागू किए गए कार्यों में किया गया था, उदाहरण के लिए एक दंडित लॉजिस्टिक रिग्रेशन दृष्टिकोण (बीएमसी कार्यवाही 2009) का उपयोग करके उत्तर अमेरिकी संधिशोथ कंसोर्टियम डेटा का विश्लेषण । दंडित मॉडल, दंडित प्रतिगमन, मानक त्रुटियां और बेइज़ियन लासोस (बायेसियन विश्लेषण 2010 5 (2)) के साथ एसई संगणना पर कैसला से एक अच्छा पेपर भी है । लेकिन वे लासो और इलास्टिनेट दंड के साथ अधिक चिंतित हैं ।
मैंने हमेशा रिज रिग्रेशन के बारे में मानक ओएलएस की तुलना में बेहतर भविष्यवाणियां करने के तरीके के बारे में सोचा, जहां मॉडल आम तौर पर पंगु नहीं होता है। चर चयन के लिए, लैसो या elasticnet मापदंड अधिक उपयुक्त हैं, लेकिन तब यह एक बूटस्ट्रैप प्रक्रिया लागू करने के लिए (के बाद से चयनित चर दूसरे के नमूने से बदल जाएगा, और यहां तक कि आंतरिक में मुश्किल है का इस्तेमाल किया गुना पाश अनुकूलन करने के लिए / पैरामीटर); यह रिज प्रतिगमन के साथ ऐसा नहीं है, क्योंकि आप हमेशा सभी चर मानते हैं।कℓ1ℓ2
मुझे आर पैकेज के बारे में कोई जानकारी नहीं है जो यह जानकारी देगा। यह glmnet पैकेज में उपलब्ध नहीं लगता है (जेएसएस में फ्रीडमैन का पेपर देखें, कोर्डिनेट डिसेंट के माध्यम से सामान्यीकृत रैखिक मॉडल के लिए नियमितीकरण पथ )। हालांकि, Jelle Goeman जो लेखक दंडित पैकेज भी इस बिंदु पर चर्चा। वेब पर मूल पीडीएफ नहीं मिल सकता है, इसलिए मैं बस उनके शब्दों को उद्धृत करता हूं:
प्रतिगमन गुणांक या अन्य अनुमानित मात्रा के मानक त्रुटियों के लिए पूछना एक बहुत ही स्वाभाविक प्रश्न है। सिद्धांत रूप में ऐसी मानक त्रुटियों की गणना आसानी से की जा सकती है, उदाहरण के लिए बूटस्ट्रैप का उपयोग करना।
फिर भी, यह पैकेज जानबूझकर उन्हें प्रदान नहीं करता है। इसका कारण यह है कि दंडात्मक अनुमान विधियों से उत्पन्न होने वाले दृढ़ता से पक्षपाती अनुमानों के लिए मानक त्रुटियां बहुत सार्थक नहीं हैं। दंडित अनुमान एक ऐसी प्रक्रिया है जो पर्याप्त पूर्वाग्रह की शुरुआत करके अनुमानकर्ताओं के विचरण को कम करती है। इसलिए प्रत्येक अनुमानक का पूर्वाग्रह अपनी क्षुद्र त्रुटि का एक प्रमुख घटक है, जबकि इसका विचरण केवल एक छोटे से हिस्से में योगदान दे सकता है।
दुर्भाग्य से, दंडित प्रतिगमन के अधिकांश अनुप्रयोगों में पूर्वाग्रह का पर्याप्त सटीक अनुमान प्राप्त करना असंभव है। किसी भी बूटस्ट्रैप-आधारित कैल्स केवल अनुमानों के विचलन का आकलन दे सकते हैं। पूर्वाग्रह के विश्वसनीय अनुमान केवल उपलब्ध हैं यदि विश्वसनीय निष्पक्ष अनुमान उपलब्ध हैं, जो आमतौर पर उन परिस्थितियों में नहीं होता है जिनमें दंडित अनुमान का उपयोग किया जाता है।
एक दंडित अनुमान के मानक त्रुटि की रिपोर्ट करना इसलिए कहानी का केवल एक हिस्सा बताता है। यह पूर्वाग्रह के कारण होने वाली अशुद्धि को पूरी तरह से नजरअंदाज करते हुए, महान परिशुद्धता का गलत प्रभाव दे सकता है। यह निश्चित रूप से आत्मविश्वास बयान करने के लिए एक गलती है जो केवल अनुमानों के विचलन के आकलन पर आधारित है, जैसे कि बूटस्ट्रैप-आधारित आत्मविश्वास अंतराल करते हैं।