समीकरणों की एक पूर्व निर्धारित प्रणाली के लिए रिज प्रतिगमन लागू करना?


9

जब , तो कम से कम वर्गों की समस्या जो के मान पर एक गोलाकार प्रतिबंध लगाती है, उसे लिखा जा सकता है एक अतिव्यापी प्रणाली के लिए। \ | \ cdot \ | _2 एक वेक्टर का यूक्लिडियन मानदंड है।y=Xβ+eδβ

min yXβ22s.t.  β22δ2
2

β का संगत समाधान \ start

β^=(XTX+λI)1XTy ,
जो लैग्रेग मल्टीप्लायरों की विधि से प्राप्त किया जा सकता है ( λ गुणक है):
L(β,λ)=yXβ22+λ(β22δ2)

मैं समझता हूं कि एक ऐसी संपत्ति है जो

(XTX+λI)1XT=XT(XXT+λI)1 .
दायां हाथ पक्ष अंडरट्रैमराइज्ड केस में रजिस्ट्रर मैट्रिक्स एक्स के छद्म-व्युत्क्रम जैसा दिखता है X(अतिरिक्त नियमितीकरण पैरामीटर, λ )। क्या इसका मतलब यह है कि एक ही अभिव्यक्ति का इस्तेमाल दलित मामले के लिए अनुमानित β लिए किया जा सकता है ? दलित मामले में संबंधित अभिव्यक्ति के लिए एक अलग व्युत्पत्ति है, जैसे कि गोलाकार प्रतिबंध बाधा उद्देश्य फ़ंक्शन (न्यूनतम बीटा का न्यूनतम मानदंड β) के साथ बेमानी है :

min. β2s.t. Xβ=y .

जवाबों:


12

के रूप में रिज प्रतिगमन समस्या के गठन के साथ शुरू

minXβy22+λx22

आप इस समस्या को लिख सकते हैं

minAβb22

कहाँ पे

A=[XλI]

तथा

b=[y0].

मैट्रिक्स में पूर्ण कॉलम रैंक है क्योंकि भाग है। इस प्रकार एक अद्वितीय समाधान के रूप में कम से कम वर्गों की समस्याAλI

β^=(ATA)1ATb

इसे और संदर्भ में लिखना , और 0 में से बहुत सारे को सरल बनाना, हम प्राप्त करते हैंXy

β^=(XTX+λI)1XTy

इस व्युत्पत्ति में कुछ भी इस बात पर निर्भर नहीं करता है कि में अधिक पंक्तियाँ या स्तंभ हैं, या यहाँ तक कि पास पूर्ण रैंक है या नहीं। यह सूत्र इस प्रकार अनिर्धारित मामले पर लागू होता है। XX

यह एक बीजगणितीय तथ्य है जो कि ,λ>0

(XTX+λI)1XT=XT(XXT+λI)1

इस प्रकार हमारे पास उपयोग करने का विकल्प भी है

β^=XT(XXT+λI)1y

अपने विशिष्ट प्रश्नों के उत्तर देने के लिए:

  1. हां, दोनों सूत्र अनिर्धारित मामले के साथ-साथ ओवर निर्धारित मामले के लिए भी काम करते हैं। उन्होंने यह भी काम करता है, तो पंक्तियों और के स्तंभों की संख्या कम से कम से कम है । दूसरा संस्करण उन समस्याओं के लिए अधिक कुशल हो सकता है जो अनिर्धारित हैं क्योंकि उस मामले में से छोटा है । rank(X)XXXTXTX

  2. मैं सूत्र के वैकल्पिक संस्करण के किसी भी व्युत्पत्ति से अवगत नहीं हूं जो कुछ अन्य कम से कम वर्गों की समस्या से शुरू होता है और सामान्य समीकरणों का उपयोग करता है। किसी भी मामले में आप इसे बीजगणित के एक बिट का उपयोग करके सीधे आगे फैशन में प्राप्त कर सकते हैं।

यह संभव है कि आप फॉर्म में रिज रिग्रेशन समस्या के बारे में सोच रहे हों

minβ22

का विषय है

Xβy22ϵ.

हालाँकि, रिज प्रतिगमन समस्या का यह संस्करण केवल एक ही कम से कम वर्गों की समस्या की ओर जाता है ।minXβy22+λβ22


2
यह ध्यान देने योग्य है कि सीमा में क्या होता है जैसे कि 0 पर जाता है यदि में पूर्ण पंक्ति रैंक या पूर्ण स्तंभ रैंक है। यदि में पूर्ण स्तंभ रैंक है, तो सीमा में, आपको pseudoinverse । इसी प्रकार, यदि में पूर्ण पंक्ति रैंक है, तो सीमा में आपको pseudoinverse । तो, यह उम्मीद के मुताबिक काम करता है। λXX(XTX)1XTXXT(XXT)1
ब्रायन बॉर्कर्स

यह एक अभूतपूर्व व्यापक उत्तर है और संवर्धित सरणियों से व्युत्पन्न (प्लस बीजगणित जो मैंने याद किया) बहुत संतोषजनक है। मैं उस रिज रिग्रेशन की समस्या के बारे में नहीं सोच रहा था जो आप अंत में प्रस्तुत करते हैं, लेकिन यह देखना दिलचस्प है कि यह उसी उद्देश्य फ़ंक्शन की ओर जाता है। एक बड़ा धन्यवाद!
हैमेट्रिक्स

1
धन्यवाद। मैं यहाँ एक बेशर्म प्लग डालूँगा- आप इसे (और संबंधित सामग्री के बहुत सारे) पाठ्यपुस्तक में पैरामीटर आकलन और उलटा समस्याओं पर पा सकते हैं, जो मैंने रिक एस्टर और क्लिफ थर्बर के साथ किया था।
ब्रायन बॉर्कर्स

1
मुझे यह भी जोड़ने दें कि वास्तव में इस मैट्रिक्स व्युत्क्रम की गणना आमतौर पर इस सूत्र का उपयोग करने का सबसे अच्छा तरीका नहीं है। के आकार और संभावित स्पार्सिटी के आधार पर आप एक पुनरावृत्ति योजना का उपयोग करके या केवल मैट्रिक्स के चोल्स्की कारक के उपयोग से बहुत बेहतर हो सकते हैं । XXTX+λI
ब्रायन बॉर्चर्स

आपके सुझाव के लिए धन्यवाद! मैं आपकी पुस्तक के संदर्भ की सराहना करता हूं क्योंकि मुझे इस सामग्री पर टेक्सबुक खोजने में परेशानी हुई है। हमारे डेटा का आकार वास्तव में बहुत बड़ा नहीं है (केवल यह है कि हमें इसे कई बार अलग-अलग डेटा सेटों पर लागू करना पड़ सकता है), इसलिए सीधे उलटा करने के लिए उत्तरदायी हो सकता है, लेकिन अतिरिक्त संकेत के लिए धन्यवाद!
हैमेट्रिक्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.