"इकाई-विचरण" रिज प्रतिगमन अनुमानक की सीमा जब


21

एक अतिरिक्त अवरोध के साथ रिज प्रतिगमन पर विचार करें, जिसमें आवश्यक है कि में यूनिट योग है वर्गों (समकक्ष, इकाई विचरण); यदि आवश्यक हो, तो कोई मान सकता है कि पास इकाई राशि का योग है:y^y

β^λ=argmin{yXβ2+λβ2}s.t.Xβ2=1.

\ _ {सुनार \ _}} की सीमा क्या है? _ \ _ लैम्ब्डा ^ *β^λ जब λ ?


यहाँ कुछ कथन दिए गए हैं जो मुझे विश्वास है कि सच हैं:

  1. जब λ=0 , तो एक साफ सुथरा समाधान होता है: OLS आकलनकर्ता β^0=(XX)1Xy और इसे सामान्य करने के लिए बाधा को संतुष्ट करने के लिए (एक Lagrange गुणक और विभेदक जोड़कर इसे देख सकते हैं):

    β^0=β^0/Xβ^0.
  2. सामान्य तौर पर, समाधान

    β^λ=((1+μ)XX+λI)1Xywith μ needed to satisfy the constraint.
    मैं एक बंद प्रपत्र समाधान नहीं देखता जब λ>0 । ऐसा लगता है कि समाधान सामान्य आरआर अनुमानक के बराबर है जो कुछ \ lambda ^ * के साथ है λजो बाधा को संतुष्ट करने के लिए सामान्यीकृत है, लेकिन मुझे \ _ lambda ^ * के लिए एक बंद सूत्र नहीं दिखता है λ
  3. जब λ , सामान्य आरआर अनुमानक

    β^λ=(XX+λI)1Xy
    स्पष्ट रूप से शून्य में परिवर्तित हो जाता है, लेकिन इसकी दिशा \ टोपी {\ boldsymbol \ beta} _ \ lambda \ big / \ | \ hat {\ boldsymbol \ Beta} _ \ lambda \ \ mathbf X ^ \ top \ mathbf yβ^λ/β^λ की दिशा में Xy , उर्फ पहले आंशिक कम से कम वर्ग (PLS) घटक।

कथन (2) और (3) मिलकर मुझे लगता है कि शायद β^λ भी उचित रूप से सामान्यीकृत \ mathbf X ^ \ top \ mathbf y में परिवर्तित हो जाता है Xy, लेकिन मुझे यकीन नहीं है कि अगर यह सही है और मैं किसी भी तरह से खुद को समझाने में कामयाब नहीं हुआ हूं।

जवाबों:


17

एक ज्यामितीय व्याख्या

प्रश्न में वर्णित अनुमानक निम्न अनुकूलन समस्या के बराबर लैग्रेंज गुणक है:

minimize f(β) subject to g(β)t and h(β)=1 

f(β)=yXβ2g(β)=β2h(β)=Xβ2

जिसे सबसे छोटे दीर्घवृत्तीय रूप में देखा जा सकता है, जो कि गोले और प्रतिपदार्थ के प्रतिच्छेदन को स्पर्श करता है।f(β)=RSS g(β)=th(β)=1


मानक रिज प्रतिगमन दृश्य की तुलना

एक ज्यामितीय दृश्य के संदर्भ में यह उस बिंदु के पुराने दृश्य (मानक रिज प्रतिगमन के लिए) को बदलता है जहां एक गोलाकार (त्रुटियां) और गोला ( ) स्पर्श होता हैβ2=t । एक नए दृश्य में जहां हम उस बिंदु की तलाश करते हैं जहां गोलाकार (त्रुटियां) एक वक्र को छूती है (बीटा का मानदंड )Xβ2=1 । एक गोले (बाईं छवि में नीला) बाधा के साथ चौराहे के कारण निचले आयाम की आकृति में बदल जाता है ।Xβ=1

दो आयामी मामले में यह देखने के लिए सरल है।

ज्यामितीय दृश्य

जब हम पैरामीटर ट्यून करते हैं तो हम नीले / लाल क्षेत्रों की सापेक्ष लंबाई या और के सापेक्ष आकार को बदलते हैं (लैग्रैजियन मल्टीप्लायरों के सिद्धांत में औपचारिक रूप से एक साफ तरीका है और ठीक से वर्णन करें कि इसका मतलब यह है कि प्रत्येक के लिए फ़ंक्शन के रूप में , या उलटा, एक नीरस फ़ंक्शन है। लेकिन मैं कल्पना करता हूं कि आप सहज रूप से देख सकते हैं कि स्क्वेर्ड अवशिष्टों का योग केवल तब बढ़ता है जब हम घटते हैं । ( )।tf(β)g(β) tλ||β||

समाधान for है जैसा कि आपने 0 और बीच की रेखा पर तर्क दिया हैβλλ=0βLS

पहले प्रिंसिपल कंपोनेंट के लोडिंग में लिए समाधान है (वास्तव में जैसा कि आपने टिप्पणी की थी)। यह वह बिंदु है जहां लिए सबसे छोटा है । यह वह बिंदु है जहाँ वृत्त एक बिंदु में दीर्घवृत्त को स्पर्श करता है ।βλλβ2βX2=1β2=t|Xβ|=1

इस 2-घ में गोलक के चौराहे के किनारों को देखें और गोलाकार अंक हैं। कई आयामों में ये वक्र होंगेβ2=tβX2=1

(मैंने पहले सोचा था कि ये घटता दीर्घवृत्त होंगे, लेकिन वे अधिक जटिल हैं। आप कल्पना कर सकते हैं दीर्घवृत्त गेंद द्वारा प्रतिच्छेदित किया जा रहा जैसा कि कुछ है। एलिपोसिड फ्रुम की तरह लेकिन किनारों के साथ जो एक सरल एलिप्स नहीं हैं)Xβ2=1β2t


सीमाλ

पहले (पिछले संपादन) में मैंने लिखा था कि ऊपर कुछ सीमित जिसके सभी समाधान समान हैं (और वे बिंदु )। लेकिन ऐसा नहीं हैλlimβ

एक लार्स एल्गोरिथ्म या ढाल वंश के रूप में अनुकूलन पर विचार करें। किसी भी बिंदु के लिए तो एक जिस दिशा में हम बदल सकते हैं नहीं है ऐसी है कि दंड अवधि बढ़ जाती है एसएसआर अवधि की तुलना में कम कम हो जाती है तो आप कम से कम में नहीं हैं ।ββ|β|2|yXβ|2

  • में सामान्य रिज प्रतिगमन आप के लिए एक शून्य ढलान (सभी दिशाओं में) है बिंदु में । तो सभी परिमित लिए समाधान नहीं हो सकता है (चूंकि एक असीम कदम दंड को बढ़ाए बिना चुकता अवशिष्ट के योग को कम करने के लिए बनाया जा सकता है)।|β|2β=0λβ=0
  • LASSO के लिए यह समान नहीं है: पेनल्टी (इसलिए यह शून्य ढलान के साथ द्विघात नहीं है)। उस कारण से LASSO के पास कुछ सीमित मान जिसके ऊपर सभी समाधान शून्य हैं क्योंकि पेनल्टी टर्म (गुणा करके ) से वर्ग के अवशिष्ट योग की तुलना में अधिक घट जाएगी।|β|1λlimλ
  • विवश रिज के लिए आपको नियमित रिज रिग्रेशन के समान ही मिलता है। आप को बदलते हैं से शुरू तो यह परिवर्तन किया जाएगा सीधा करने के लिए ( दीर्घवृत्त की सतह पर लम्ब है ) और को दंड अवधि को बदलने के बिना एक infinitesimal कदम से बदला जा सकता है लेकिन चुकता अवशिष्ट के योग को कम कर सकता है। इस प्रकार किसी भी परिमित लिए बिंदु समाधान नहीं हो सकता है।ββββ|Xβ|=1βλβ

सीमा से आगे के नोट्सλ

अनंत के लिए लिए सामान्य रिज प्रतिगमन सीमा विवश रिज प्रतिगमन में एक अलग बिंदु से मेल खाती है। यह 'पुरानी' सीमा उस बिंदु से मेल खाती है, जहां -1 के बराबर है। फिर सामान्यीकृत समस्या में लैगरेंज फ़ंक्शन का व्युत्पन्नλμ

2(1+μ)XTXβ+2XTy+2λβ
मानक समस्या में Lagrange फ़ंक्शन के व्युत्पन्न के लिए एक समाधान से मेल खाती है

2XTXβ+2XTy+2λ(1+μ)βwith β=(1+μ)β


StackExchangeStrike द्वारा लिखित


+1। बहुत बहुत धन्यवाद, यह सुपर सहायक है! मुझे इसके माध्यम से सोचने के लिए कुछ समय की आवश्यकता होगी।
अमीबा का कहना है कि मोनिका

यह इंगित करने योग्य है कि लाल और काले दीर्घवृत्तों का आकार समान है: यही कारण है कि बिंदु जहां वे अपने केंद्रों को जोड़ने वाली रेखा पर झूठ को छूते हैं। मेरे प्रश्न में बिंदु # 1 का अच्छा चित्रमय प्रमाण।
अमीबा का कहना है कि

मैं यह समझने की कोशिश कर रहा हूं कि आपके ड्राइंग में वह बीटा कहां है जो अनंत लैम्ब्डा के साथ रिज आकलनकर्ता के साथ मेल खाता है, जो काले दीर्घवृत्त पर झूठ बोलने के लिए सामान्यीकृत है। मुझे लगता है कि यह कहीं न कहीं और (मेरी संकेतन का उपयोग करके) के बीच है - दो बिंदु जो आपके ड्राइंग पर काले खुले सर्कल के साथ चिह्नित हैं। इसलिए यदि हम रिज रिग्रेशन करते हैं और समाधान को सामान्य करते हैं और लैम्ब्डा को 0 से बढ़ाकर अनंत तक कर देते हैं, तो यह संभवतः हमें एक ही चाप के साथ ले जाता है, लेकिन पीसी 1 तक पूरे तरीके से नहीं। इसके बजाय, में डालना स्पष्ट रूप से, समाधान सभी तरह से PC1 तक जाता है। β0βXβ=1
अमीबा का कहना है कि मोनिका

+5 (मैंने एक इनाम शुरू किया है कि मैं खुशी से आपके जवाब के लिए पुरस्कार दूंगा)। मैंने अपना स्वयं का उत्तर भी पोस्ट किया है क्योंकि मैंने कुछ बीजीय व्युत्पन्न किए हैं और प्रश्न को जोड़ना बहुत अधिक था। मैं आपके निष्कर्ष से आश्वस्त नहीं हूं कि कुछ परिमित होगा, जिसके बाद समाधान अब नहीं बदलेगा और PC1 द्वारा दिया जाएगा। मैं इसे बीजगणितीय रूप से नहीं देखता हूं, और मुझे आपके तर्क को समझ में नहीं आता कि यह क्यों होना चाहिए। आइए इसे जानने की कोशिश करें। λlim
अमीबा का कहना है कि मोनिका

@amoeba, आप परिमित बारे में सही थे मौजूदा नहीं। मैंने बहुत सहजता से तर्क दिया और नियमित रिज रिग्रेशन के लिए विवश रिग रिग्रेशन के लिए एक विशेष स्थिति से जल्दी से कूद गया। नियमित आरआर में शून्य ढलान (सभी दिशाओं में) के लिए में बिंदु । मैंने सोचा था कि (क्योंकि ) आपको विवश प्रतिगमन के साथ यह नहीं मिलता है। हालाँकि, क्योंकि को दीर्घवृत्त के लिए विवश किया जाता है आप सभी दिशाओं में ' ' नहीं ले जा सकते । λlim|β|2β=0β0β|Xβ|=1β
सेक्सटस एम्पिरिकस

10

यह @ मार्टिज़न के सुंदर ज्यामितीय उत्तर के लिए एक बीजीय समकक्ष है।

सबसे पहले, जब बहुत है प्राप्त करने के लिए सरल: सीमा में, नुकसान फ़ंक्शन में पहला शब्द नगण्य हो जाता है और इस तरह से अवहेलना की जा सकती है। अनुकूलन समस्या जो का पहला प्रमुख घटक है

β^λ=argmin{yXβ2+λβ2}s.t.Xβ2=1
λ
limλβ^λ=β^=argminXβ2=1β2argmaxβ2=1Xβ2,
X(उचित रूप से छोटा)। यह सवाल का जवाब देता है।

अब हम में से किसी भी मूल्य के लिए समाधान पर विचार करते हैं है कि मैं अपने प्रश्न के बिंदु # 2 में निर्दिष्ट। हानि फ़ंक्शन को जोड़ना Lagrange गुणक और विभेदित करने पर, हम प्राप्त करते हैंλμ(Xβ21)

β^λ=((1+μ)XX+λI)1Xywith μ needed to satisfy the constraint.

इस समाधान व्यवहार कैसे जब करता है अनंत को शून्य से बढ़ता है?λ

  • जब , तो हम OLS समाधान का एक छोटा संस्करण प्राप्त करते हैं:λ=0

    β^0β^0.
  • के सकारात्मक लेकिन छोटे मूल्यों के लिए :, समाधान कुछ रिज आकलनकर्ता के एक बढ़ाया संस्करण हैλ

    β^λβ^λ.
  • जब, का मान बाधा को पूरा करने के लिए आवश्यक है । इसका मतलब है कि समाधान पहले PLS घटक का एक छोटा संस्करण है (जिसका अर्थ है कि संबंधित ):λ=XXy(1+μ)0λ

    β^XXyXy.
  • जब उससे बड़ा हो जाता है, तो आवश्यक शब्द नकारात्मक हो जाता है। अब से, समाधान नकारात्मक नियमितीकरण पैरामीटर ( नकारात्मक रिज ) के साथ छद्म-रिज अनुमानक का एक छोटा संस्करण है । दिशाओं के संदर्भ में, अब हम अनंत लंबोदर के साथ पिछले रिज प्रतिगमन हैं।λ(1+μ)

  • जब , शब्द शून्य (या विचलन) पर जाएगा अनन्तता) जब तक जहां का सबसे बड़ा विलक्षण मान है । यह परिमित करेगा और पहले प्रमुख अक्ष । हमें बाधा को संतुष्ट करने के लिए करना होगा। इस प्रकार, हम उसλ((1+μ)XX+λI)1μ=λ/smax2+αsmaxX=USVβ^λV1μ=λ/smax2+U1y1

    β^V1.

कुल मिलाकर, हम देखते हैं कि यह विवश न्यूनतम समस्या निम्नलिखित स्पेक्ट्रम पर ओएलएस, आरआर, पीएलएस और पीसीए के इकाई-विचरण संस्करणों को शामिल करती है:

OLSRRPLSnegative RRPCA

यह एक अस्पष्ट (?) Chemometrics रूपरेखा "सातत्य प्रतिगमन" (देखें बुलाया के बराबर हो रहा है https://scholar.google.de/scholar?q="continuum+regression " , विशेष रूप से स्टोन और ब्रूक्स 1990, Sundberg 1993 में Björkström & Sundberg 1999, आदि) जो एक तदर्थ मानदंड को अधिकतम करके उसी एकीकरण की अनुमति देता है।यह स्पष्ट रूप से पैदावार ओएलएस जब , पीएलएस जब , पीसीए जब , और पैदावार दिखाया जा सकता है पैदावार के लिए दिखाया गया है

T=corr2(y,Xβ)Varγ(Xβ)s.t.β=1.
γ=0γ=1γ0<γ<11<γ< , सुंदरबर्ग 1993 देखें।

आरआर / पीएलएस / पीसीए / आदि के साथ काफी अनुभव होने के बावजूद, मुझे स्वीकार करना होगा कि मैंने पहले कभी "निरंतरता प्रतिगमन" के बारे में नहीं सुना है। मुझे यह भी कहना चाहिए कि मैं इस शब्द को नापसंद करता हूं।


एक योजनाबद्ध जो मैंने @ मार्टिज़न एक पर आधारित थी:

इकाई-विचरण रिज प्रतिगमन

अपडेट: चित्रा नकारात्मक रिज पथ के साथ अद्यतन, यह कैसे दिखना चाहिए यह सुझाव देने के लिए @Martijn के लिए बहुत धन्यवाद। अधिक विवरण के लिए नकारात्मक रिज प्रतिगमन को समझने में मेरा उत्तर देखें।


"सातत्य प्रतिगमन" एक आम ढांचे के भीतर पीएलएस और पीसीए को एकीकृत करने के उद्देश्य से आश्चर्यजनक रूप से व्यापक श्रेणी की तकनीकों में से एक है। मैंने इसके बारे में कभी नहीं सुना था, संयोग से, जब तक कि नकारात्मक रिज पर शोध नहीं किया जाता (मैं Bjorkstron & Sundberg, 1999 का एक लिंक प्रदान करता हूं, तो नकारात्मक रिज प्रश्न की पहली टिप्पणी में आप जिस लिंक से लिंक करते हैं), हालांकि यह व्यापक रूप से चर्चा में लगता है रसायन विज्ञान साहित्य। ऐसा कुछ ऐतिहासिक कारण होना चाहिए कि यह सांख्यिकी के अन्य क्षेत्रों से अलग-थलग क्यों विकसित हुआ है। (1/3)
रयान सीमन्स

एक पेपर जिसे आप पढ़ना चाहते हैं वह है डे जोंग एट अल। (2001) । "कैनोनिकल पीएलएस" का उनका निरूपण आपके समतुल्य होने की एक त्वरित झलक पर लगता है, हालांकि मैं मानता हूं कि मैंने अभी तक गणित की तुलना में कड़ाई नहीं की है (वे एक ही नस में कई अन्य पीएलएस-पीसीए सामान्यीकरण की समीक्षा भी प्रदान करते हैं)। लेकिन यह देखना सुखद हो सकता है कि उन्होंने इस समस्या को कैसे समझा। (२/३)
रयान सीमन्स

मामले में जो लिंक मर जाता है, पूर्ण उद्धरण है: सिजमैन डी जोंग, बैरी एम। वाइज, एन। लॉरेंस रिकर। "कैनोनिकल आंशिक कम से कम वर्ग और सातत्य शक्ति प्रतिगमन।" केमोमेट्रिक्स जर्नल, 2001; 15: 85-100। doi.org/10.1002/… (3/3)
रयान सीमन्स

1
आह, ठीक है, तो और करने के लिए जाना अनंत लेकिन उनके अनुपात अवशेष । किसी भी स्थिति में, नकारात्मक रिज प्रतिगमन पथ पीएलएस और पीसीए वैक्टर के बीच (नकारात्मक) क्षेत्र में होना चाहिए जैसे कि दीर्घवृत्त पर उनका प्रक्षेपणबिंदु PLS और PCA के बीच है। (इन्फिनिटी के लिए जाने वाला मान समझ में आता है क्योंकि अनंत तक भी जाता है, इसलिए यह मार्ग निचले दाएं तरफ शुरू होता है, शुरू में नकारात्मक, PLS और अंततः PCA के लिए स्पर्श करता है) 1 + μ * ± रों 2 मीटर एक एक्स | एक्स β = 1 | μλ1+μ±smax2|Xβ=1|μ
Sextus Empiricus

1
यह विज़ुअलाइज़ेशन में जोड़ देगा। मुझे लगता है कि वर्तमान तीन आरआर पथ बिंदु (जहां वृत्त और दीर्घवृत्त स्पर्श) नीचे की ओर दाईं ओर और अंत में अनंत तक जारी है, वृत्त और दीर्घवृत्त को उस स्थान की दिशा में 'स्पर्श' करना चाहिए जहां सर्कल है ellipsoid को स्पर्श करता है | एक्स ( β - β ) | 2 = आर एस एस | β | 2 = टी पी सी | एक्स β | 2 = 1|β|2=t|X(ββ^)|2=RSS|β|2=tpca|Xβ|2=1
Sextus Ciricus
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.