"वर्णक्रमीय अपघटन" के माध्यम से रिज प्रतिगमन का उपयोग करने वाले गुणांक के सिकुड़ने का प्रमाण


20

मैंने समझा है कि रिज रिग्रेशन गुणांक को शून्य ज्यामितीय रूप से कैसे सिकोड़ता है। इसके अलावा मुझे पता है कि विशेष "ऑर्थोनॉमिक केस" में यह कैसे साबित किया जाए, लेकिन मैं भ्रमित हूं कि यह सामान्य मामले में "स्पेक्ट्रल अपघटन" के माध्यम से कैसे काम करता है।


4
आपने कहा है कि आप भ्रमित हैं, लेकिन आपका सवाल क्या है?
whuber

जवाबों:


30

यह प्रश्न एक प्रदर्शन के लिए पूछता है कि रिज प्रतिगमन एक वर्णक्रमीय विघटन का उपयोग करके शून्य की ओर गुणांक अनुमानों को सिकोड़ता है। वर्णक्रमीय विघटन को एकवचन मूल्य अपघटन (SVD) के एक आसान परिणाम के रूप में समझा जा सकता है । इसलिए, यह पोस्ट SVD से शुरू होती है। यह इसे सरल शब्दों में समझाता है और फिर इसे महत्वपूर्ण अनुप्रयोगों के साथ दिखाता है। फिर यह अनुरोधित (बीजगणितीय) प्रदर्शन प्रदान करता है। (बीजगणित, निश्चित रूप से, ज्यामितीय प्रदर्शन के समान है; यह केवल एक अलग भाषा में लिखा गया है।)

इस उत्तर का मूल स्रोत मेरे प्रतिगमन पाठ्यक्रम नोट्स में पाया जा सकता है । यह संस्करण कुछ छोटी त्रुटियों को ठीक करता है।


एसवीडी क्या है

किसी भी मैट्रिक्स एक्स , के साथ पी n , लिखा जा सकता है एक्स = यू डी वी ' जहांn×pXpn

X=UDV
  1. एक n × p मैट्रिक्स है।Un×p

    • कॉलम की लंबाई 1 हैU1
    • कॉलम परस्पर ओर्थोगोनल हैं।U
    • वे कहा जाता है प्रिंसिपल घटकों की X
  2. एक p × p मैट्रिक्स है।Vp×p

    • कॉलम की लंबाई 1 हैV1
    • कॉलम परस्पर ओर्थोगोनल हैं।V
    • इस बनाता है एक रोटेशन के आर पीVRp
  3. एकविकर्ण p × p मैट्रिक्स है।D p×p

    • विकर्ण तत्व ऋणात्मक नहीं हैं। ये एक्स के विलक्षण मूल्य हैं ।d11,d22,,dppX
    • यदि हम चाहें, तो हम उन्हें सबसे बड़े से लेकर छोटे तक का ऑर्डर दे सकते हैं।

मानदंड (1) और (2) ज़ोर है कि दोनों और वी कर रहे हैं orthonormal मैट्रिक्स। उन्हें शर्तों के द्वारा बड़े करीने से संक्षेप में प्रस्तुत किया जा सकता हैUV

UU=1p, VV=1p.

एक परिणाम (है कि के रूप में एक रोटेशन का प्रतिनिधित्व करता है), वी वी ' = 1 पी भी। यह नीचे रिज रिजरेशन व्युत्पत्ति में उपयोग किया जाएगा।VVV=1p

यह हमारे लिए क्या करता है

यह सूत्रों को सरल बना सकता है। यह बीजगणितीय और वैचारिक दोनों तरह से काम करता है। यहाँ कुछ उदाहरण हैं।

सामान्य समीकरण

प्रतिगमन पर विचार करें जहां, हमेशा की तरह, ident स्वतंत्र और पहचान के अनुसार एक कानून के अनुसार वितरित किया जाता है जिसमें शून्य उम्मीद और परिमित संस्करण σ 2 होता है । सामान्य समीकरण के माध्यम से कम से कम वर्गों समाधान है β = ( एक्स ' एक्स ) - 1 एक्स ' y एसवीडी को लागू करना और परिणामस्वरूप बीजीय गड़बड़ी को सरल करना (जो आसान है) एक अच्छा अंतर्दृष्टि प्रदान करता है:y=Xβ+εεσ2

β^=(XX)1Xy.

(XX)1X=((UDV)(UDV))1(UDV)=(VDUUDV)1(VDU)=VD2VVDU=VD1U.

इस और के बीच फर्क सिर्फ इतना है के तत्वों के reciprocals है डी इस्तेमाल कर रहे हैं! दूसरे शब्दों में, "समीकरण" y = एक्स β द्वारा "inverting" हल किया जाता है एक्स : इस छद्म उलट नाश कर देती रोटेशन यू और वी ' (केवल उन्हें transposing द्वारा) और नाश कर देती गुणा (द्वारा प्रतिनिधित्व डी ) प्रत्येक प्रिंसिपल में अलग-अलग दिशा।X=VDUDy=XβXUVD

भविष्य में संदर्भ के लिए, सूचना है कि "घुमाया" अनुमान β "घुमाया" प्रतिक्रियाओं के रैखिक संयोजन कर रहे हैं यू ' y । गुणांकों के (सकारात्मक) विकर्ण तत्वों के प्रतिलोम हैं डी , के बराबर - 1 मैं मैंVβ^UyDdii1

गुणांक अनुमानों का सहसंयोजक

याद रखें कि अनुमान के सहप्रसरण है SVD का उपयोग करना, यह हो जाता है σ 2 ( वी डी 2 वी ' ) - 1 = σ 2 वी डी - 2 वी ' दूसरे शब्दों में, सहप्रसरण की तरह कार्य करता है कश्मीर orthogonal चर, प्रसरण के साथ प्रत्येक d 2 मैं मैं

Cov(β^)=σ2(XX)1.
σ2(VD2V)1=σ2VD2V.
k dii2, में घुमाया कि किया गया है Rk

टोपी मैट्रिक्स

टोपी मैट्रिक्स है पूर्ववर्ती परिणाम के माध्यम से हम के रूप में यह फिर से लिखने सकता है एच = ( यू डी वी ' ) ( वी डी - 1 यू ' ) = यू यू 'सरल!

H=X(XX)1X.
H=(UDV)(VD1U)=UU.

ईजेननालिसिस (वर्णक्रमीय अपघटन)

XX=VDUUDV=VD2V
XX=UDVVDU=UD2U,
  • XXXX
  • VXX
  • UXX

एसवीडी कोलेजनिटी समस्याओं का निदान और समाधान कर सकता है।

रजिस्ट्रियों के बारे में बताना

UDVUy

रिज रिग्रेशन

XyXλ>0

β^R=(XX+λ)1Xy=(VD2V+λ1p)1VDUy=(VD2V+λVV)1VDUy=(V(D2+λ)V)1VDUy=V(D2+λ)1VVDUy=V(D2+λ)1DUy.

β^D1=D2D(D2+λ)1DD2/(D2+λ)λ>0


Vβ^RUydii1dii2/(dii2+λ)λβ^R

dii1


1
@Glen_b यह एक अच्छा बिंदु है: मुझे इस बारे में स्पष्ट होने की आवश्यकता है कि मैं किस अंश पर विचार कर रहा था! मैं ठीक कर दूँगा।
whuber

1
UU=1pU1। (२)VV=1=1VV=1pVV1(V1)(V1)=1pV1=VVV=(V)V=1p

1
@ विमल आपको अच्छे सुझाव के लिए धन्यवाद। मैंने अब "सामान्य समीकरण" अनुभाग में एक स्पष्टीकरण शामिल किया है जहां प्रतिगमन मॉडल पेश किया गया है।
whuber

1
X
VDU=X=X=UDV.
U=VX

1
y^
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.