Lambda और बीच LASSO संबंध


10

LASSO प्रतिगमन की मेरी समझ यह है कि प्रतिगमन गुणांक को कम करने की समस्या को हल करने के लिए चुना जाता है:

minβyXβ22 s.t.β1t

व्यवहार में यह एक लैगेंज गुणक का उपयोग करके किया जाता है, जिससे समस्या को हल किया जा सकता है

minβyXβ22+λβ1

λ और t के बीच क्या संबंध हैt ? विकिपीडिया अनजाने में केवल "डेटा आश्रित" है।

मुझे क्यों परवाह है? सबसे पहले बौद्धिक जिज्ञासा के लिए। लेकिन मैं क्रॉस- λ द्वारा \ lambda के चयन के परिणामों के बारे में भी चिंतित हूं ।

विशेष रूप से, अगर मैं n- गुना क्रॉस सत्यापन कर रहा हूं, तो मैं अपने प्रशिक्षण डेटा के अलग-अलग विभाजन के लिए अलग-अलग मॉडल फिट करता हूं। मैं फिर किसी दिए गए लैम्ब्डा के अप्रयुक्त डेटा पर प्रत्येक मॉडल की सटीकता की तुलना करता हूं λ। लेकिन समान λ अर्थ है कि डेटा के विभिन्न सबसेट के लिए एक अलग बाधा ( t ) है (यानी, t=f(λ) "डेटा निर्भर")।

क्या क्रॉस सत्यापन समस्या नहीं है जो मैं वास्तव में सबसे अच्छा पूर्वाग्रह-सटीकता व्यापार बंद करने वाले टी को खोजने के लिए हल करना चाहता हूं t?

मैं प्रत्येक क्रॉस-मान्यता विभाजन और \ lambda के लिए और परिणामी वितरण को देखकर \ _ \ _ \ _ | _1 की गणना करके अभ्यास में इस आशय के आकार का एक मोटा विचार प्राप्त कर सकता हूं । कुछ मामलों में निहित बाधा ( टी ) मेरे क्रॉस-वैरिफिकेशन सबसेट में पर्याप्त रूप से शांत हो सकती है। जहाँ पर्याप्त रूप से मेरा तात्पर्य t >> 0 में भिन्नता के गुणांक से है ।β1λtt>>0


5
अस्पष्टीकृत डाउनवोट को रद्द करने के लिए अपवोट करना। मेरी विशेषज्ञता के बाहर प्रश्न अच्छी तरह से है लेकिन यह यथोचित रूप से तैयार है।
mkt -

जवाबों:


2

यह रिज प्रतिगमन के लिए मानक समाधान है :

β=(XX+λI)1Xy

हम यह भी जानते हैं कि , इसलिए यह सच होना चाहिएβ=t

(XX+λI)1Xy=t

जो लिए हल करना आसान नहीं है ।λ

गणना: आपका सबसे अच्छा शर्त सिर्फ आप क्या कर रहे कर रखना है एकाधिक भर में डेटा का एक ही उप नमूने पर मूल्यों।tλ

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.