मैं पहले आपके तीसरे प्रश्न का उत्तर दूंगा और बाद में आपके अन्य दो को संबोधित करूंगा।
- आपको क्या लगता है कि जब "लास्सो (और संबंधित) ..." कहते हैं, लेकिन बाद के वितरण में नहीं है, तो उसका क्या मतलब है?
उनकी स्लाइड्स से यह पता चलता है कि उनका क्या मतलब है। पूर्व वितरण के रूप में लासो रेग्युलर को व्यक्त करने का मतलब है कि आपका पूर्व वितरण एक लाप्लासियन या डबल-एक्सपेंसेशनल वितरण का रूप लेगा । इस वितरण में औसतन एक विशिष्ट गैर-चिकनी चोटी है, जो कि विरल नियमितीकरण प्रभाव को प्राप्त करने के लिए 0 पर सेट है। एक लैस्सो नियमित परिणाम प्राप्त करने के लिए, आपको अपने पीछे के वितरण का तरीका अपनाना चाहिए।
चित्रा में, नीली धराशायी लाइन लाप्लासियन पूर्व वितरण का प्रतिनिधित्व करती है। ठोस काले रंग में पीछे का वितरण, कमजोर संभावना के साथ बाईं ओर 0 पर अपनी विधा है, जबकि एक मजबूत संभावना के साथ मोड दाईं ओर गैर-शून्य है।
हालाँकि, पूर्ण पीछे का वितरण विरल नहीं है, क्योंकि यदि आप इससे नमूना लेते हैं तो आपको केवल शायद ही कभी 0 के करीब कुछ मूल्य मिलेगा, और वास्तव में क्योंकि यह एक निरंतर वितरण है जो आपको कभी भी ठीक 0 नहीं मिलेगा।
एक लैस्सो दृष्टिकोण के साथ स्पार्सिटी प्राप्त करने के लिए, आपको आमतौर पर पीछे के मोड पर कुछ कटऑफ सीमा निर्धारित करनी होगी। आदर्श स्थिति यह है कि यदि आपका पोस्टीरियर मोड 0 के बराबर है, लेकिन आप इसे आराम कर सकते हैं और अपने वैरिएबल को समाप्त कर सकते हैं, अगर इसका पोस्टीरियर मोड निरपेक्ष मान लेने के बाद 0.2 से कम है।
लास्सो के तहत इस स्पार्सिफिकेशन को समाप्त करने और बनाए रखने वाले रजिस्टरों का एक विशेष सेट देता है, जो कि "एकल निर्णय" है जिसके बारे में रजिस्टरों को शामिल या बाहर रखा गया है।
चर चयन के लिए एक पूरी तरह से बायेसियन दृष्टिकोण, स्पाइक और स्लैब पूर्व, अनिश्चितता को बरकरार रखता है जिसके बारे में चर को शामिल किया जाना चाहिए या मॉडल के माध्यम से सभी तरह से बाहर रखा जाना चाहिए।
तो अपने पहले प्रश्न को संबोधित करने के लिए:
- क्या वे इस अर्थ में बेहतर हैं कि वे मूल रूप से शामिल करने के लिए प्रत्येक संभावित उपसमुच्चय के परीक्षण के लिए एक क्रूर बल दृष्टिकोण का उपयोग करते हैं?
यह एक गलतफहमी है, क्योंकि न तो विधि शामिल करने के लिए रजिस्टरों के सभी संभावित सबसेट का परीक्षण करती है।
- क्या ऐसा करने में कम्प्यूटेशन समय की कमी है?
यह भी एक गलतफहमी है, क्योंकि गणना समय ब्रिगेट बल द्वारा प्रतिसादकों के प्रत्येक संभावित सबसेट का परीक्षण करने के लिए हावी नहीं है।
स्कॉट के बिंदु को स्पष्ट करने के लिए, कुछ डेटा दिए गए हैं, यदि आप एक दंडित संभावना स्पार्सिफिकेशन दृष्टिकोण का उपयोग करते हैं, तो आपको बिल्कुल शामिल और बहिष्कृत रजिस्टरों का एक सेट मिलेगा। लेकिन यदि आप एक स्पाइक और स्लैब स्पार्सिफिकेशन दृष्टिकोण का उपयोग करते हैं, तो आपके पास प्रत्येक रजिस्ट्रार के लिए एक पूर्ण पोस्टीरियर वितरण है, प्रत्येक में शामिल होने या बाहर किए जाने की एक अलग संभावना है। कुछ रजिस्टरों में शामिल होने का 70% मौका हो सकता है, दूसरों को 25% मौका। यह कई अनुप्रयोगों में बेहतर हो सकता है, क्योंकि किसी एकल डेटासेट को देखते हुए हमें अभी भी अनिश्चितता होनी चाहिए कि कौन से रजिस्टर महत्वपूर्ण हैं या नहीं।
वास्तव में, एक स्पाइक और स्लैब पूर्व में लसो जैसे दंडित संभावना दृष्टिकोण की तुलना में शामिल / बहिष्कृत रजिस्टरों के बेहतर स्थान का प्रतिनिधित्व करता है।