LASSO प्रतिगमन शून्य की ओर गुणांक सिकुड़ता है, इस प्रकार प्रभावी रूप से मॉडल चयन प्रदान करता है। मेरा मानना है कि मेरे डेटा में नाममात्र और निरंतर कोवरिएट्स के बीच सार्थक बातचीत हैं। हालांकि, जरूरी नहीं कि वे सच्चे मॉडल के 'मुख्य प्रभाव' सार्थक (गैर-शून्य) हों। निश्चित रूप से मुझे यह नहीं पता है कि चूंकि सच्चा मॉडल अज्ञात है। मेरा उद्देश्य सच्चे मॉडल को ढूंढना है और यथासंभव परिणाम का अनुमान लगाना है।
मैंने सीखा है कि मॉडल निर्माण के लिए शास्त्रीय दृष्टिकोण हमेशा एक बातचीत में शामिल करने से पहले एक मुख्य प्रभाव शामिल करेगा। इस प्रकार दो covariates और मुख्य प्रभाव के बिना कोई मॉडल नहीं हो सकता है यदि एक ही मॉडल में covariates का इंटरैक्शन हो । में समारोह ध्यान फलस्वरूप चयन मॉडल शर्तों (जैसे पिछड़े या आगे AIC के आधार पर) इस नियम के पालन।जेड एक्स * जेडstep
R
LASSO अलग तरह से काम करता है। चूंकि सभी मापदंडों को दंडित किया जाता है, इसलिए यह संदेह के बिना हो सकता है कि एक मुख्य प्रभाव शून्य से सिकुड़ गया है, जबकि सबसे अच्छा (जैसे क्रॉस-वैलिडेटेड) मॉडल की बातचीत गैर-शून्य है। यह मैं का उपयोग करते समय अपने डेटा के लिए विशेष रूप से लगता है R
के glmnet
पैकेज।
ऊपर उद्धृत पहले नियम के आधार पर मुझे आलोचना मिली, अर्थात मेरे अंतिम क्रॉस-वैरिफाइड लास्सो मॉडल में कुछ गैर-शून्य इंटरैक्शन के संबंधित मुख्य प्रभाव शब्द शामिल नहीं हैं। हालाँकि यह नियम इस संदर्भ में कुछ अजीब लगता है। क्या यह नीचे आता है यह सवाल है कि क्या सच्चे मॉडल में पैरामीटर शून्य है। मान लें कि यह है, लेकिन बातचीत गैर-शून्य है, तो LASSO शायद इसकी पहचान करेगा, इस प्रकार सही मॉडल ढूंढेगा। वास्तव में ऐसा लगता है कि इस मॉडल से भविष्यवाणियां अधिक सटीक होंगी क्योंकि मॉडल में सही-शून्य मुख्य प्रभाव नहीं है, जो प्रभावी रूप से एक शोर चर है।
क्या मैं इस आधार पर आलोचना का खंडन कर सकता हूं या क्या मुझे किसी तरह से पूर्व सावधानी बरतनी चाहिए कि LASSO बातचीत अवधि से पहले मुख्य प्रभाव शामिल करता है?