LASSO / LARS बनाम सामान्य से विशिष्ट (GETS) विधि

मैं सोच रहा था, क्यों LASSO और LARS मॉडल चयन के तरीके इतने लोकप्रिय हैं, भले ही वे मूल रूप से सौतेले वार फॉरवर्ड सिलेक्शन के भिन्नरूप हैं (और इस तरह पथ निर्भरता से पीड़ित हैं)?

इसी तरह, मॉडल चयन के लिए जनरल टू स्पेसिफिक (GETS) के तरीकों को ज्यादातर अनदेखा क्यों किया जाता है, भले ही वे LARS / LASSO से बेहतर करते हैं क्योंकि वे चरण-वार प्रतिगमन समस्या से पीड़ित नहीं हैं? (जीईटीएस का मूल संदर्भ: http://www.federalreserve.gov/pubs/ifdp/2005/838/ifdp838.pdf - इसमें नया एल्गोरिथ्म एक व्यापक मॉडल और ट्री खोज से शुरू होता है जो पथ निर्भरता से बचा जाता है, और इसे दिखाया गया है अक्सर LASSO / LARS से बेहतर करते हैं)।

यह सिर्फ अजीब लगता है, LARS / LASSO को लगता है कि सामान्य से ज्यादा एक्सपोजर और सिचुएशन हैं (GETS), किसी को भी कोई विचार है?

एक गरमागरम बहस शुरू करने की कोशिश नहीं कर रहा है, इसके लिए एक तर्कसंगत स्पष्टीकरण की तलाश में है कि साहित्य GETS के बजाय LASSO / LARS पर ध्यान केंद्रित क्यों करता है और कुछ लोग वास्तव में LASSO / LARS की कमियों को इंगित करते हैं।

— टॉर्टिला
स्रोत

यहाँ निर्भर मार्ग से आपका क्या अभिप्राय है ? इसके अलावा, क्या आप GETS के लिए कुछ और आधिकारिक संदर्भ दे सकते हैं? मैं इससे परिचित नहीं हूं।

— कार्डिनल

यहाँ एक बेहतर, अधिक "आधिकारिक" संदर्भ है जिसमें लस्सो का भी उल्लेख है: degruyter.com/view/j/jtse.2011.3.3.1/jtse.2011.3.1.1097/… ।

— tortilla

जोड़ने वाला था, मेरा क्या मतलब था: इसलिए आप एक-एक करके महत्वपूर्ण रजिस्टरों को जोड़ते हैं, लेकिन यह दृष्टिकोण आपको एक को छोड़ने की अनुमति नहीं देता है यदि रजिस्टरों के बीच संबंध के आधार पर एक महत्वहीन हो सकता है। इस प्रकार, एक बार जोड़ने पर पथ निर्भरता होती है कि यह प्रतिगामी अब सेट हो गया है और इसे गिराया नहीं जा सकता है। क्या यह मामला नहीं है?

— tortilla

यदि इसके गुणांक मार्ग शून्य के साथ पार कर लेते हैं, तो चर के लिए लैस्सो के बीच में उतरना संभव है। क्या आप Efron et al से परिचित हैं। LARS पर मूल लेख? यह एक अच्छा ज्यामितीय स्वाद के साथ काफी विस्तार से बताता है।

— कार्डिनल

मुझे लगता है कि लासो लोकप्रिय है क्योंकि यह प्रभावी ढंग से एक परिकल्पना परीक्षण से एक पैरामीटर के आकलन के मॉडल चयन समस्या को फिर से कास्ट करता है।

— probabilityislogic

जवाबों:

अस्वीकरण: मैं केवल अन्य लोगों के बीच डेविड एफ हेंड्री द्वारा मॉडल चयन पर काम से दूर से परिचित हूं। हालाँकि, मैं जानता हूँ कि सम्मानित सहयोगियों से कि Hendry ने अर्थमिति के भीतर मॉडल चयन की समस्याओं पर बहुत दिलचस्प प्रगति की है। यह निर्धारित करने के लिए कि क्या मॉडल चयन पर उनके काम पर सांख्यिकीय साहित्य पर्याप्त ध्यान नहीं दे रहा है, मेरे हिस्से के लिए बहुत अधिक काम की आवश्यकता होगी।

हालांकि, यह समझने की कोशिश करना दिलचस्प है कि एक विधि या विचार दूसरों की तुलना में बहुत अधिक गतिविधि क्यों उत्पन्न करता है। इसमें कोई शक नहीं कि विज्ञान में भी फैशन के पहलू हैं। जैसा कि मैं इसे देखता हूं, लैस्सो (और दोस्तों) को बहुत आसानी से व्यक्त अनुकूलन समस्या का समाधान होने का एक बड़ा फायदा है। यह समाधान की विस्तृत सैद्धांतिक समझ और विकसित किए गए कुशल एल्गोरिदम की कुंजी है। बुहल्मन एंड वैन डी गीर की हालिया पुस्तक, सांख्यिकी के लिए उच्च-आयामी डेटा , यह दर्शाता है कि पहले से ही लासो के बारे में कितना जाना जाता है।

आप अंतहीन सिमुलेशन अध्ययन कर सकते हैं और आप निश्चित रूप से उन तरीकों को लागू कर सकते हैं जो आपको किसी विशेष एप्लिकेशन के लिए सबसे अधिक प्रासंगिक और उपयुक्त लगते हैं, लेकिन सांख्यिकीय साहित्य के कुछ हिस्सों के लिए पर्याप्त सैद्धांतिक परिणाम भी प्राप्त होने चाहिए। उस लास्सो ने बहुत सारी गतिविधि उत्पन्न की है, यह दर्शाता है कि सैद्धांतिक प्रश्न हैं जो वास्तव में संपर्क किए जा सकते हैं और उनके पास दिलचस्प समाधान हैं।

एक और बिंदु यह है कि लास्सो या रूपांतर कई मामलों में अच्छा प्रदर्शन करते हैं। मुझे बस इस बात पर यकीन नहीं हो रहा है कि यह सही है कि ओएस के सुझाव के अनुसार लास्सो अन्य तरीकों से इतनी आसानी से आउटपरफॉर्म होता है। हो सकता है कि कृत्रिम (कृत्रिम) मॉडल के चयन के संदर्भ में लेकिन भविष्य कहनेवाला प्रदर्शन के संदर्भ में नहीं। उल्लेख किए गए संदर्भों में से कोई भी वास्तव में गेट्स और लासो की तुलना नहीं करता है।

— NRH
स्रोत

LASSO और LARS मॉडल चयन विधियां इतनी लोकप्रिय क्यों हैं, भले ही वे मूल रूप से केवल चरण-वार फॉरवर्ड चयन के रूपांतर हैं

LASSO और (GETS) सब्मिट चयन में अंतर होता है: LASSO गुणांक को डेटा-निर्भर तरीके से शून्य की ओर सिकोड़ता है जबकि (GETS) सब्मिट चयन नहीं करता है। ऐसा लगता है कि LASSO ओवर (GETS) सबसेट चयन का एक फायदा है, भले ही कभी-कभी यह विफल हो सकता है (इसे पैरामीटर ट्यूनिंग की आवश्यकता होती है, जिसे सामान्य रूप से क्रॉस सत्यापन के माध्यम से किया जाता है, और कभी-कभी हम खराब ट्यून करने के लिए हो सकते हैं)।

(GETS) के तरीके <...> LARS / LASSO से बेहतर करते हैं

GETS का प्रदर्शन LASSO के लिए तुलनीय गुणवत्ता का प्रतीत होता है जब निष्पक्ष (?) शोधकर्ताओं द्वारा किया जाता है (हालांकि जरूरी नहीं कि कागजात में जहां GETS का एक नया संस्करण प्रस्तावित हो - लेकिन वही होगा जो आप उम्मीद करेंगे); इस धागे में कुछ संदर्भ देखें ।

शायद सर हेन्ड्री एंड कंपनी अपने अनुप्रयोगों (ज्यादातर मैक्रोइकॉनॉमिक टाइम मॉडलिंग) की बारीकियों के कारण जीईटीएस का उपयोग करके अच्छे परिणाम प्राप्त कर रहे हैं? लेकिन ऐसा क्यों हो सकता है? यह है एक अलग प्रश्न है ।

— रिचर्ड हार्डी
स्रोत