जवाबों:
यह दंड को जोड़कर नुकसान फ़ंक्शन को संशोधित करने के लिए पर्याप्त है। मैट्रिक्स के संदर्भ में, प्रारंभिक द्विघात हानि समारोह बन जाता है संबंध में जानकारी सामान्य समीकरण ओर ले जाती है, जो रिज अनुमानक की ओर जाता है।β एक्स टी वाई = ( एक्स टी एक्स + λ मैं ) β
आइए हम जो जानते हैं उस पर निर्माण करते हैं, जो यह है कि जब भी मॉडल मैट्रिक्स , तो प्रतिक्रिया -vector , और पैरामीटर -vector , उद्देश्य फ़ंक्शन हैएक्स एन वाई पी β
(जो अवशिष्टों के वर्गों का योग है) को कम किया जाता है जब सामान्य समीकरणों को हल करता है
रिज रिग्रेशन ऑब्जेक्टिव फंक्शन में एक और शब्द जोड़ता है (आमतौर पर सभी वेरिएबल्स को मानकीकृत करने के बाद उन्हें एक सामान्य पायदान पर रखने के लिए), न्यूनतम करने के लिए कहता है
कुछ गैर-नकारात्मक निरंतर । यह अवशिष्टों के वर्गों का योग है और गुणांक के वर्गों के योग का गुणक है (यह स्पष्ट है कि यह एक वैश्विक न्यूनतम है)। क्योंकि , इसमें एक सकारात्मक वर्गमूल ।
पर विचार करें मैट्रिक्स पंक्तियों के लिए इसी के साथ संवर्धित बार पहचान मैट्रिक्स :
जब वेक्टर को इसी तरह zeros के साथ के अंत में विस्तारित किया जाता है , तो उद्देश्य फ़ंक्शन में मैट्रिक्स उत्पाद अतिरिक्त शर्तें जोड़ता है मूल उद्देश्य के लिए। इसलिये
बाएं हाथ की अभिव्यक्ति के रूप से यह तात्कालिक है कि सामान्य समीकरण हैं
क्योंकि हमने शून्य को के अंत तक , दाहिने हाथ की तरफ । बाएं हाथ की ओर को मूल में जोड़ा जाता है । इसलिए नए सामान्य समीकरण सरल करते हैंν 2 मैं = λ मैं एक्स ' एक्स
वैचारिक रूप से किफायती होने के अलावा - इस परिणाम को प्राप्त करने के लिए नए हेरफेर की आवश्यकता होती है - यह कम्प्यूटेशनल रूप से किफायती भी है: साधारण कम से कम वर्गों को करने के लिए आपका सॉफ़्टवेयर भी बिना किसी परिवर्तन के रिज रिग्रेशन करेगा। (यह फिर भी, उपयोग इस उद्देश्य के लिए डिज़ाइन किए गए सॉफ़्टवेयर के लिए बड़े समस्याओं में सहायक हो सकता है क्योंकि यह की विशेष संरचना का फायदा उठाने होगा के एक घनी दूरी अंतराल के लिए कुशलता से परिणाम प्राप्त करने के , पता लगाने के लिए कैसे जवाब अलग-अलग हो आप को सक्षम करने के with ।)
चीजों को देखने के इस तरीके की एक और सुंदरता यह है कि यह रिज रिग्रेशन को समझने में हमारी मदद कैसे कर सकता है। जब हम वास्तव में प्रतिगमन को समझना चाहते हैं, तो यह लगभग हमेशा ज्यामितीय रूप से सोचने में मदद करता है: के स्तंभ आयाम एक वास्तविक वेक्टर अंतरिक्ष में वैक्टर का गठन करते हैं । आसपास के द्वारा करने के लिए , जिससे उन लोगों से समय को बढ़ाने -vectors को -vectors, हम एम्बेड कर रहे हैं एक बड़ा अंतरिक्ष में शामिल करके "काल्पनिक", पारस्परिक रूप से रूढ़िवादी दिशाएं। का पहला कॉलमआकार का एक छोटा सा काल्पनिक घटक दिया जाता है , जिससे यह लंबा है और यह मूल द्वारा उत्पन्न अंतरिक्ष से बाहर जाने कॉलम। दूसरा, तीसरा, ..., कॉलम समान रूप से लंबा और एक ही राशि - द्वारा मूल स्थान से बाहर चला गया है - लेकिन सभी अलग-अलग नई दिशाओं में। नतीजतन, मूल कॉलम में मौजूद किसी भी कोलिनियरिटी को तुरंत हल किया जाएगा। इसके अलावा, जितना बड़ा हो जाता है, उतने अधिक नए वैक्टर व्यक्तिगत पास पहुंच जाते हैंकाल्पनिक दिशाएँ: वे अधिक से अधिक अलंकारिक बन जाती हैं। नतीजतन, सामान्य समीकरणों का हल तुरंत संभव हो जाएगा और यह से बढ़ता रूप में तेजी से संख्यात्मक रूप से स्थिर हो जाएगा ।
इस प्रक्रिया का वर्णन कुछ उपन्यास और रचनात्मक दृष्टिकोण से पता चलता है कि समस्याओं को संबोधित करने के लिए रिज रिग्रेशन को संभालने के लिए डिज़ाइन किया गया था। उदाहरण के लिए, किसी भी तरह से (जैसे कि बेल्सली, कुह और वैल्श द्वारा वर्णित प्रतिगमन निदान , अध्याय 3) पर वर्णित विचरण अपघटन का उपयोग करते हुए , आप के लगभग कोलिन कॉलम के उपसमूह की पहचान करने में सक्षम हो सकते हैं , जहां प्रत्येक उपसमूह। किसी भी अन्य के लिए लगभग रूढ़िवादी है। आप केवल करने के लिए कई पंक्तियों के रूप में जुड़ा होना जरूरत है (और करने के लिए शून्य दूर अपने भाई-बहनों से एक समूह के प्रत्येक तत्व को विस्थापित करने के लिए एक नया "काल्पनिक" आयाम समर्पित) के रूप में वहाँ सबसे बड़े समूह में तत्व हैं,: आप की जरूरत नहीं है काल्पनिक ऐसा करने के लिए आयाम।
मैं हाल ही में पी-स्प्लिंस के संदर्भ में एक ही सवाल पर अड़ गया हूं और जैसा कि अवधारणा है वही मैं रिज अनुमानक की व्युत्पत्ति पर अधिक विस्तृत जवाब देना चाहता हूं।
हम एक अंतिम मानदंड फ़ंक्शन के साथ शुरू करते हैं जो अंतिम योग में क्लासिक ओएलएस-मानदंड फ़ंक्शन से अलग होता है:
कहा पे
हम मैट्रिक्स-संकेतन में इस मानदंड को फिर से लिख सकते हैं और आगे इसे तोड़ सकते हैं:
साथ पहचान मैट्रिक्स रहा
अब हम हमारे मानदंड को कम करने वाले खोज करते हैं । अन्य लोगों के बीच हम मैट्रिक्स भेदभाव नियम का उपयोग कर सकते हैं - हम कर सकते हैं यहाँ :
कुछ महत्वपूर्ण चीजें हैं जो दिए गए उत्तरों में गायब हैं।
लिए समाधान प्रथम-क्रम आवश्यक स्थिति से लिया गया है: जो पैदावार । लेकिन क्या यह पर्याप्त है? यही है, समाधान केवल एक वैश्विक न्यूनतम है अगर सख्ती से उत्तल है। यह सच दिखाया जा सकता है।∂ च आर मैं घ जी ई ( बीटा , λ )बीटा=(एक्सटीएक्स+λमैं)-1एक्सटीवाईचआरमैंघजीई(बीटा,λ)
समस्या को देखने का एक और तरीका है और बीच समानता देखना। कंस्ट्रेन्ड को । OLS का मतलब ऑर्डिनरी लेस्टर स्क्वेयर है। इस दृष्टिकोण से सिर्फ लाग्रंगियन उत्तल ऑब्जेक्टिव समारोह के वैश्विक न्यूनतम खोजने के लिए इस्तेमाल किया समारोह है उत्तल समारोह के साथ विवश ।
इन बिंदुओं की एक अच्छी व्याख्या और की व्युत्पत्ति इन बढ़िया व्याख्यान नोट्स में पाई जा सकती है: http://math.bu.edu/people/cgineste/classes/ma575/p/w14_1.pdf