LASSO प्रतिगमन की मेरी समझ यह है कि प्रतिगमन गुणांक को कम करने की समस्या को हल करने के लिए चुना जाता है:
व्यवहार में यह एक लैगेंज गुणक का उपयोग करके किया जाता है, जिससे समस्या को हल किया जा सकता है
और t के बीच क्या संबंध है ? विकिपीडिया अनजाने में केवल "डेटा आश्रित" है।
मुझे क्यों परवाह है? सबसे पहले बौद्धिक जिज्ञासा के लिए। लेकिन मैं क्रॉस- द्वारा \ lambda के चयन के परिणामों के बारे में भी चिंतित हूं ।
विशेष रूप से, अगर मैं n- गुना क्रॉस सत्यापन कर रहा हूं, तो मैं अपने प्रशिक्षण डेटा के अलग-अलग विभाजन के लिए अलग-अलग मॉडल फिट करता हूं। मैं फिर किसी दिए गए लैम्ब्डा के अप्रयुक्त डेटा पर प्रत्येक मॉडल की सटीकता की तुलना करता हूं । लेकिन समान अर्थ है कि डेटा के विभिन्न सबसेट के लिए एक अलग बाधा ( ) है (यानी, "डेटा निर्भर")।
क्या क्रॉस सत्यापन समस्या नहीं है जो मैं वास्तव में सबसे अच्छा पूर्वाग्रह-सटीकता व्यापार बंद करने वाले टी को खोजने के लिए हल करना चाहता हूं ?
मैं प्रत्येक क्रॉस-मान्यता विभाजन और \ lambda के लिए और परिणामी वितरण को देखकर \ _ \ _ \ _ | _1 की गणना करके अभ्यास में इस आशय के आकार का एक मोटा विचार प्राप्त कर सकता हूं । कुछ मामलों में निहित बाधा ( टी ) मेरे क्रॉस-वैरिफिकेशन सबसेट में पर्याप्त रूप से शांत हो सकती है। जहाँ पर्याप्त रूप से मेरा तात्पर्य t >> 0 में भिन्नता के गुणांक से है ।