बायेसियन स्पाइक और स्लैब बनाम दंडित तरीके

मैं BSTS R पैकेज के बारे में स्टीवन स्कॉट की स्लाइड्स पढ़ रहा हूं (आप उन्हें यहां पा सकते हैं: स्लाइड्स )।

किसी समय, जब संरचनात्मक समय श्रृंखला के मॉडल में कई रजिस्टरों को शामिल करने के बारे में बात की जाती है, तो वह प्रतिगमन गुणांकों के स्पाइक और स्लैब पादरियों का परिचय देता है और कहता है कि वे दंडित तरीकों की तुलना में बेहतर हैं।

स्कॉट कहते हैं, 100 भविष्यवक्ताओं के साथ डेटासेट के एक उदाहरण का जिक्र:

दंडित विधियाँ एक एकल निर्णय करती हैं जिसके बारे में चर शामिल / बहिष्कृत हैं, इसका मतलब है कि वे भविष्यवाणियों के एक सबसेट को तय करते हैं अर्थात संभव लोगों में से एक मॉडल । $2^{100}$
"लासो (और संबंधित) पुजारी विरल नहीं हैं, वे मोड पर विरलता पैदा करते हैं, लेकिन पीछे के हिस्से में नहीं"

इस बिंदु पर वह स्पाइक और स्लैब के पुजारियों का परिचय देता है।

मुझे लगता है कि मुझे अंतर्ज्ञान मिला है, लेकिन मैं इसके बारे में निश्चित होना चाहता हूं:

क्या वे इस अर्थ में बेहतर हैं कि वे मूल रूप से शामिल करने के लिए प्रत्येक संभावित उपसमुच्चय के परीक्षण के लिए एक क्रूर बल दृष्टिकोण का उपयोग करते हैं?
क्या ऐसा करने में कम्प्यूटेशन समय की कमी है?
आपको क्या लगता है कि जब "लास्सो (और संबंधित) ..." कहते हैं, लेकिन बाद के वितरण में नहीं है, तो उसका क्या मतलब है?

— टॉमसो गुरेरिनी
स्रोत

मैं पहले आपके तीसरे प्रश्न का उत्तर दूंगा और बाद में आपके अन्य दो को संबोधित करूंगा।

आपको क्या लगता है कि जब "लास्सो (और संबंधित) ..." कहते हैं, लेकिन बाद के वितरण में नहीं है, तो उसका क्या मतलब है?

उनकी स्लाइड्स से यह पता चलता है कि उनका क्या मतलब है। पूर्व वितरण के रूप में लासो रेग्युलर को व्यक्त करने का मतलब है कि आपका पूर्व वितरण एक लाप्लासियन या डबल-एक्सपेंसेशनल वितरण का रूप लेगा । इस वितरण में औसतन एक विशिष्ट गैर-चिकनी चोटी है, जो कि विरल नियमितीकरण प्रभाव को प्राप्त करने के लिए 0 पर सेट है। एक लैस्सो नियमित परिणाम प्राप्त करने के लिए, आपको अपने पीछे के वितरण का तरीका अपनाना चाहिए।

परीक्षा

चित्रा में, नीली धराशायी लाइन लाप्लासियन पूर्व वितरण का प्रतिनिधित्व करती है। ठोस काले रंग में पीछे का वितरण, कमजोर संभावना के साथ बाईं ओर 0 पर अपनी विधा है, जबकि एक मजबूत संभावना के साथ मोड दाईं ओर गैर-शून्य है।

हालाँकि, पूर्ण पीछे का वितरण विरल नहीं है, क्योंकि यदि आप इससे नमूना लेते हैं तो आपको केवल शायद ही कभी 0 के करीब कुछ मूल्य मिलेगा, और वास्तव में क्योंकि यह एक निरंतर वितरण है जो आपको कभी भी ठीक 0 नहीं मिलेगा।

एक लैस्सो दृष्टिकोण के साथ स्पार्सिटी प्राप्त करने के लिए, आपको आमतौर पर पीछे के मोड पर कुछ कटऑफ सीमा निर्धारित करनी होगी। आदर्श स्थिति यह है कि यदि आपका पोस्टीरियर मोड 0 के बराबर है, लेकिन आप इसे आराम कर सकते हैं और अपने वैरिएबल को समाप्त कर सकते हैं, अगर इसका पोस्टीरियर मोड निरपेक्ष मान लेने के बाद 0.2 से कम है।

लास्सो के तहत इस स्पार्सिफिकेशन को समाप्त करने और बनाए रखने वाले रजिस्टरों का एक विशेष सेट देता है, जो कि "एकल निर्णय" है जिसके बारे में रजिस्टरों को शामिल या बाहर रखा गया है।

चर चयन के लिए एक पूरी तरह से बायेसियन दृष्टिकोण, स्पाइक और स्लैब पूर्व, अनिश्चितता को बरकरार रखता है जिसके बारे में चर को शामिल किया जाना चाहिए या मॉडल के माध्यम से सभी तरह से बाहर रखा जाना चाहिए।

तो अपने पहले प्रश्न को संबोधित करने के लिए:

क्या वे इस अर्थ में बेहतर हैं कि वे मूल रूप से शामिल करने के लिए प्रत्येक संभावित उपसमुच्चय के परीक्षण के लिए एक क्रूर बल दृष्टिकोण का उपयोग करते हैं?

यह एक गलतफहमी है, क्योंकि न तो विधि शामिल करने के लिए रजिस्टरों के सभी संभावित सबसेट का परीक्षण करती है।

क्या ऐसा करने में कम्प्यूटेशन समय की कमी है?

यह भी एक गलतफहमी है, क्योंकि गणना समय ब्रिगेट बल द्वारा प्रतिसादकों के प्रत्येक संभावित सबसेट का परीक्षण करने के लिए हावी नहीं है।

स्कॉट के बिंदु को स्पष्ट करने के लिए, कुछ डेटा दिए गए हैं, यदि आप एक दंडित संभावना स्पार्सिफिकेशन दृष्टिकोण का उपयोग करते हैं, तो आपको बिल्कुल शामिल और बहिष्कृत रजिस्टरों का एक सेट मिलेगा। लेकिन यदि आप एक स्पाइक और स्लैब स्पार्सिफिकेशन दृष्टिकोण का उपयोग करते हैं, तो आपके पास प्रत्येक रजिस्ट्रार के लिए एक पूर्ण पोस्टीरियर वितरण है, प्रत्येक में शामिल होने या बाहर किए जाने की एक अलग संभावना है। कुछ रजिस्टरों में शामिल होने का 70% मौका हो सकता है, दूसरों को 25% मौका। यह कई अनुप्रयोगों में बेहतर हो सकता है, क्योंकि किसी एकल डेटासेट को देखते हुए हमें अभी भी अनिश्चितता होनी चाहिए कि कौन से रजिस्टर महत्वपूर्ण हैं या नहीं।

वास्तव में, एक स्पाइक और स्लैब पूर्व में लसो जैसे दंडित संभावना दृष्टिकोण की तुलना में शामिल / बहिष्कृत रजिस्टरों के बेहतर स्थान का प्रतिनिधित्व करता है।

— सौंदर्य-विज्ञान का मतावलंबी
स्रोत

आपका बहुत बहुत धन्यवाद! स्कॉट की स्लाइड्स के बारे में मेरी समझ इतनी सतही और आंशिक रूप से निशान से दूर थी, आपने इसे स्पष्ट कर दिया!

— टॉमासो गुरेरिनी