यह प्रश्न एक प्रदर्शन के लिए पूछता है कि रिज प्रतिगमन एक वर्णक्रमीय विघटन का उपयोग करके शून्य की ओर गुणांक अनुमानों को सिकोड़ता है। वर्णक्रमीय विघटन को एकवचन मूल्य अपघटन (SVD) के एक आसान परिणाम के रूप में समझा जा सकता है । इसलिए, यह पोस्ट SVD से शुरू होती है। यह इसे सरल शब्दों में समझाता है और फिर इसे महत्वपूर्ण अनुप्रयोगों के साथ दिखाता है। फिर यह अनुरोधित (बीजगणितीय) प्रदर्शन प्रदान करता है। (बीजगणित, निश्चित रूप से, ज्यामितीय प्रदर्शन के समान है; यह केवल एक अलग भाषा में लिखा गया है।)
इस उत्तर का मूल स्रोत मेरे प्रतिगमन पाठ्यक्रम नोट्स में पाया जा सकता है । यह संस्करण कुछ छोटी त्रुटियों को ठीक करता है।
एसवीडी क्या है
किसी भी मैट्रिक्स एक्स , के साथ पी ≤ n , लिखा जा सकता है एक्स = यू डी वी ' जहांn×pXp≤n
X=UDV′
एक n × p मैट्रिक्स है।Un×p
- कॉलम की लंबाई 1 है ।U1
- कॉलम परस्पर ओर्थोगोनल हैं।U
- वे कहा जाता है प्रिंसिपल घटकों की ।X
एक p × p मैट्रिक्स है।Vp×p
- कॉलम की लंबाई 1 है ।V1
- कॉलम परस्पर ओर्थोगोनल हैं।V
- इस बनाता है एक रोटेशन के आर पी ।VRp
एकविकर्ण p × p मैट्रिक्स है।D p×p
- विकर्ण तत्व ऋणात्मक नहीं हैं। ये एक्स के विलक्षण मूल्य हैं ।d11,d22,…,dppX
- यदि हम चाहें, तो हम उन्हें सबसे बड़े से लेकर छोटे तक का ऑर्डर दे सकते हैं।
मानदंड (1) और (2) ज़ोर है कि दोनों और वी कर रहे हैं orthonormal मैट्रिक्स। उन्हें शर्तों के द्वारा बड़े करीने से संक्षेप में प्रस्तुत किया जा सकता हैUV
U′U=1p, V′V=1p.
एक परिणाम (है कि के रूप में एक रोटेशन का प्रतिनिधित्व करता है), वी वी ' = 1 पी भी। यह नीचे रिज रिजरेशन व्युत्पत्ति में उपयोग किया जाएगा।VVV′=1p
यह हमारे लिए क्या करता है
यह सूत्रों को सरल बना सकता है। यह बीजगणितीय और वैचारिक दोनों तरह से काम करता है। यहाँ कुछ उदाहरण हैं।
सामान्य समीकरण
प्रतिगमन पर विचार करें जहां, हमेशा की तरह, ident स्वतंत्र और पहचान के अनुसार एक कानून के अनुसार वितरित किया जाता है जिसमें शून्य उम्मीद और परिमित संस्करण σ 2 होता है । सामान्य समीकरण के माध्यम से कम से कम वर्गों समाधान है β = ( एक्स ' एक्स ) - 1 एक्स ' y । एसवीडी को लागू करना और परिणामस्वरूप बीजीय गड़बड़ी को सरल करना (जो आसान है) एक अच्छा अंतर्दृष्टि प्रदान करता है:y=Xβ+εεσ2
β^=(X′X)−1X′y.
(X′X)−1X′=((UDV′)′(UDV′))−1(UDV′)′=(VDU′UDV′)−1(VDU′)=VD−2V′VDU′=VD−1U′.
इस और के बीच फर्क सिर्फ इतना है के तत्वों के reciprocals है डी इस्तेमाल कर रहे हैं! दूसरे शब्दों में, "समीकरण" y = एक्स β द्वारा "inverting" हल किया जाता है एक्स : इस छद्म उलट नाश कर देती रोटेशन यू और वी ' (केवल उन्हें transposing द्वारा) और नाश कर देती गुणा (द्वारा प्रतिनिधित्व डी ) प्रत्येक प्रिंसिपल में अलग-अलग दिशा।X′=VDU′Dy=XβXUV′D
भविष्य में संदर्भ के लिए, सूचना है कि "घुमाया" अनुमान β "घुमाया" प्रतिक्रियाओं के रैखिक संयोजन कर रहे हैं यू ' y । गुणांकों के (सकारात्मक) विकर्ण तत्वों के प्रतिलोम हैं डी , के बराबर घ - 1 मैं मैं ।V′β^U′yDd−1ii
गुणांक अनुमानों का सहसंयोजक
याद रखें कि अनुमान के सहप्रसरण है SVD का उपयोग करना, यह हो जाता है σ 2 ( वी डी 2 वी ' ) - 1 = σ 2 वी डी - 2 वी ' । दूसरे शब्दों में, सहप्रसरण की तरह कार्य करता है कश्मीर orthogonal चर, प्रसरण के साथ प्रत्येक d 2 मैं मैं
Cov(β^)=σ2(X′X)−1.
σ2(VD2V′)−1=σ2VD−2V′.
k d2ii, में घुमाया कि किया गया है
।
Rk
टोपी मैट्रिक्स
टोपी मैट्रिक्स है पूर्ववर्ती परिणाम के माध्यम से हम के रूप में यह फिर से लिखने सकता है एच = ( यू डी वी ' ) ( वी डी - 1 यू ' ) = यू यू ' । सरल!
H=X(X′X)−1X′.
H=(UDV′)(VD−1U′)=UU′.
ईजेननालिसिस (वर्णक्रमीय अपघटन)
X′X=VDU′UDV′=VD2V′
XX′=UDV′VDU′=UD2U′,
- X′XXX′
- VX′X
- UXX′
एसवीडी कोलेजनिटी समस्याओं का निदान और समाधान कर सकता है।
रजिस्ट्रियों के बारे में बताना
UDV′Uy
रिज रिग्रेशन
XyXλ>0
β^R=(X′X+λ)−1X′y=(VD2V′+λ1p)−1VDU′y=(VD2V′+λVV′)−1VDU′y=(V(D2+λ)V′)−1VDU′y=V(D2+λ)−1V′VDU′y=V(D2+λ)−1DU′y.
β^D−1=D−2D(D2+λ)−1DD2/(D2+λ)λ>0
V′β^RU′yd−1iid2ii/(d2ii+λ)λβ^R
d−1ii