कैसे पुल प्रतिगमन और लोचदार जाल अलग-अलग एक आकर्षक प्रश्न है, उनके समान दिखने वाले दंड दिए गए हैं। यहाँ एक संभव दृष्टिकोण है। मान लीजिए हम पुल प्रतिगमन समस्या को हल करते हैं। हम फिर पूछ सकते हैं कि लोचदार शुद्ध समाधान कैसे भिन्न होगा। दो नुकसान कार्यों के ग्रेडिएंट को देखकर हमें इस बारे में कुछ बता सकते हैं।
ब्रिज रिग्रेशन
Say स्वतंत्र मैट्रिक्स के मानों वाला एक मैट्रिक्स है ( अंक x आयाम), एक वेक्टर है जिसमें आश्रित चर के मान हैं, और वेट वेक्टर है।एन डी वाई डब्ल्यूXndyw
नुकसान फ़ंक्शन , परिमाण साथ वजन के मानदंड को दंडित करता है :λ बीℓqλb
Lb(w)=∥y−Xw∥22+λb∥w∥qq
नुकसान समारोह की ढाल है:
∇wLb(w)=−2XT(y−Xw)+λbq|w|∘(q−1)sgn(w)
मैं वी सी मैं sgn ( डब्ल्यू ) डब्ल्यू क्षv∘c Hadamard (अर्थात तत्व-वार) शक्ति को दर्शाता है, जो एक वेक्टर देता है जिसका th तत्व । साइन फंक्शन ( प्रत्येक तत्व पर लागू ) है। कुछ मानों के लिए शून्य पर अपरिभाषित हो सकता है ।ivcisgn(w)wq
लोचदार जाल
नुकसान समारोह है:
Le(w)=∥y−Xw∥22+λ1∥w∥1+λ2∥w∥22
यह penalizes परिमाण के साथ वजन के आदर्श और परिमाण के साथ आदर्श । इस नुकसान को कम करने के लिए लोचदार नेट पेपर कॉल 'भोले लोचदार जाल' का कार्य करता है क्योंकि यह वजन को दोगुना कम करता है। वे एक बेहतर प्रक्रिया का वर्णन करते हैं जहां वजन बाद में दोहरे संकोचन के लिए क्षतिपूर्ति करने के लिए फिर से शुरू किया जाता है, लेकिन मैं सिर्फ भोले संस्करण का विश्लेषण करने जा रहा हूं। यह ध्यान में रखने के लिए एक चेतावनी है।λ 1 ℓ 2 λ 2ℓ1λ1ℓ2λ2
नुकसान समारोह की ढाल है:
∇wLe(w)=−2XT(y−Xw)+λ1sgn(w)+2λ2w
शून्य पर अपरिभाषित है जब क्योंकि पेनल्टी में निरपेक्ष मूल्य वहाँ नहीं है।ℓ 1λ1>0ℓ1
पहुंच
मान लें कि हम वज़न चुनते हैं जो ब्रिज रिग्रेशन समस्या का समाधान करता है। इसका मतलब है कि इस बिंदु पर पुल प्रतिगमन ढाल शून्य है:w∗
∇wLb(w∗)=−2XT(y−Xw∗)+λbq|w∗|∘(q−1)sgn(w∗)=0⃗
इसलिए:
2XT(y−Xw∗)=λbq|w∗|∘(q−1)sgn(w∗)
हम इसे लोचदार नेट ग्रेडिएंट में प्रतिस्थापित कर सकते हैं, पर लोचदार नेट ग्रेडिएंट के लिए एक अभिव्यक्ति प्राप्त कर सकते हैं । सौभाग्य से, यह अब सीधे डेटा पर निर्भर नहीं करता है:w∗
∇wLe(w∗)=λ1sgn(w∗)+2λ2w∗−λbq|w∗|∘(q−1)sgn(w∗)
पर इलास्टिक नेट ग्रेडिएंट को देखते हुए हमें बताता है: यह देखते हुए कि ब्रिज रिग्रेशन वज़न परिवर्तित हो गया है, इलास्टिक नेट इन वेट को कैसे बदलना चाहेंगे?डब्ल्यू *w∗w∗
यह हमें वांछित परिवर्तन की स्थानीय दिशा और परिमाण प्रदान करता है, क्योंकि ढाल के आरोही की दिशा में ढाल बिंदु और नुकसान का कार्य घट जाएगा क्योंकि हम ढाल के विपरीत दिशा में आगे बढ़ते हैं। ढाल सीधे लोचदार शुद्ध समाधान की ओर इशारा नहीं कर सकता है। लेकिन, क्योंकि लोचदार शुद्ध हानि फ़ंक्शन उत्तल है, स्थानीय दिशा / परिमाण इस बारे में कुछ जानकारी देता है कि लोचदार शुद्ध समाधान पुल प्रतिगमन समाधान से कैसे भिन्न होगा।
केस 1: स्वच्छता जांच
(( )। इस मामले में ब्रिज रिग्रेशन साधारण न्यूनतम वर्गों (ओएलएस) के बराबर है, क्योंकि जुर्माना परिमाण शून्य है। लोचदार जाल बराबर रिज प्रतिगमन है, क्योंकि केवल मानदंड दंडित किया गया है। निम्नलिखित भूखंड विभिन्न पुल प्रतिगमन समाधान दिखाते हैं और प्रत्येक के लिए लोचदार शुद्ध ढाल कैसे व्यवहार करता है।ℓ 2λb=0,λ1=0,λ2=1ℓ2
वाम कथानक: प्रत्येक आयाम के साथ लोचदार शुद्ध ढाल बनाम पुल प्रतिगमन वजन
X अक्ष, पुल प्रतिगमन द्वारा चुने गए भार सेट के एक घटक का प्रतिनिधित्व करता है । Y अक्ष लोचदार नेट ग्रेडिएंट के संबंधित घटक को दर्शाता है, जिसका मूल्यांकन । ध्यान दें कि वज़न बहुआयामी है, लेकिन हम केवल एक ही आयाम के साथ वज़न / ग्रेडिएंट देख रहे हैं।डब्ल्यू *w∗w∗
सही भूखंड: पुल प्रतिगमन वजन (2d) के लिए लोचदार शुद्ध परिवर्तन
प्रत्येक बिंदु पुल प्रतिगमन द्वारा चयनित 2d वजन एक सेट का प्रतिनिधित्व करता है । की प्रत्येक पसंद के लिए , वेक्टर को लोचदार नेट ग्रेडिएंट के विपरीत दिशा में इंगित किया जाता है, जो कि ग्रेडिएंट के समानुपाती के साथ होता है। यही है, प्लॉट किए गए वैक्टर बताते हैं कि लोचदार जाल पुल प्रतिगमन समाधान को कैसे बदलना चाहता है।डब्ल्यू *w∗w∗
ये प्लॉट दर्शाते हैं कि, ब्रिज रिग्रेशन (इस मामले में ओएलएस) की तुलना में, लोचदार नेट (इस मामले में रिज रिग्रेशन) शून्य की ओर वज़न कम करना चाहता है। भार की मात्रा के साथ संकोचन की वांछित मात्रा बढ़ जाती है। यदि वजन शून्य है, तो समाधान समान हैं। व्याख्या यह है कि हम नुकसान को कम करने के लिए ढाल के विपरीत दिशा में आगे बढ़ना चाहते हैं। उदाहरण के लिए, मान लें कि पुल प्रतिगमन एक वज़न के लिए एक सकारात्मक मूल्य में परिवर्तित हो गया। इस बिंदु पर लोचदार शुद्ध ढाल सकारात्मक है, इसलिए लोचदार जाल इस वजन को कम करना चाहता है। यदि ढाल वंश का उपयोग करते हुए, हम आकार में ढाल के अनुपात में कदम उठाएंगे (बेशक, हम शून्य पर गैर-भिन्नता के कारण लोचदार नेट को हल करने के लिए तकनीकी रूप से ढाल वंश का उपयोग नहीं कर सकते हैं)
केस 2: मैचिंग ब्रिज और इलास्टिक नेट
( )। मैंने सवाल से उदाहरण के लिए पुल पेनल्टी पैरामीटर चुना। मैंने सबसे अच्छा मिलान लोचदार शुद्ध जुर्माना देने के लिए लोचदार शुद्ध मापदंडों को चुना। यहां, सर्वोत्तम-मिलान साधनों को, वज़न के एक विशेष वितरण को देखते हुए, हम लोचदार शुद्ध दंड मापदंडों को पाते हैं जो पुल और लोचदार शुद्ध दंड के बीच अपेक्षित चुकता अंतर को कम करते हैं:q=1.4,λb=1,λ1=0.629,λ2=0.355
minλ1,λ2E[(λ1∥w∥1+λ2∥w∥22−λb∥w∥qq)2]
यहाँ, मैंने (यानी मूल में केंद्रित हाइपरक्यूब के भीतर पर समान वितरण से खींची गई सभी प्रविष्टियों के साथ वजन पर विचार किया । सर्वश्रेष्ठ-मिलान लोचदार शुद्ध पैरामीटर 2 से 1000 आयामों के लिए समान थे। यद्यपि वे आयामीता के प्रति संवेदनशील नहीं दिखते हैं, सबसे अच्छा-मिलान पैरामीटर वितरण के पैमाने पर निर्भर करता है।[−2,2]
दंड की सतह
यहाँ पुल प्रतिगमन ( ) द्वारा लगाए गए कुल जुर्माने का एक समोच्च कथानक है और वज़न के 2d मामले के लिए फ़ंक्शन के रूप में सर्वोत्तम-मिलान लोचदार जाल ( ) है। ):q=1.4,λb=100λ1=0.629,λ2=0.355
धीरे-धीरे व्यवहार
हम निम्नलिखित देख सकते हैं:
- चलो आयाम में चुना पुल प्रतिगमन वजन होना ।w∗jj
- If , लोचदार नेट शून्य की ओर भार को सिकोड़ना चाहता है।|w∗j|<0.25
- अगर , पुल प्रतिगमन और लोचदार शुद्ध समाधान समान हैं। लेकिन, अगर वजन थोड़ा भी अलग हो तो इलास्टिक नेट दूर जाना चाहता है।|w∗j|≈0.25
- यदि , लोचदार नेट वजन बढ़ाना चाहता है।0.25<|w∗j|<1.31
- अगर , पुल प्रतिगमन और लोचदार शुद्ध समाधान समान हैं। इलास्टिक नेट आस-पास के भार से इस बिंदु की ओर बढ़ना चाहता है।|w∗j|≈1.31
- अगर , लोचदार नेट वजन कम करना चाहता है।|w∗j|>1.31
यदि हम और / या के मान को बदलते हैं, तो परिणाम गुणात्मक रूप से समान होते हैं और संबंधित सर्वश्रेष्ठ । वे बिंदु जहाँ पुल और इलास्टिक नेट सॉल्यूशन में थोड़ा परिवर्तन होता है, लेकिन ग्रेडिएंट्स का व्यवहार अन्यथा समान होता है।qλbλ1,λ2
केस 3: बेमेल पुल और लोचदार जाल
(q=1.8,λb=1,λ1=0.765,λ2=0.225) । इस शासन में, पुल प्रतिगमन रिज प्रतिगमन के समान व्यवहार करता है। मैं सबसे अधिक मेल खाने पाया , लेकिन फिर उन्हें इतना है कि लोचदार शुद्ध बर्ताव अधिक लैसो (तरह बदली से दंड अधिक से अधिक दंड)।λ1,λ2ℓ1ℓ2
पुल प्रतिगमन के सापेक्ष, लोचदार नेट शून्य की ओर छोटे भार को सिकोड़ना और बड़े वजन को बढ़ाना चाहता है। प्रत्येक क्वाड्रेंट में वेट का एक सेट होता है जहाँ ब्रिज रिग्रेशन और इलास्टिक नेट सॉल्यूशन मेल खाते हैं, लेकिन इलास्टिक नेट इस पॉइंट से दूर जाना चाहते हैं अगर वेट थोड़ा अलग भी हो।
(q=1.2,λb=1,λ1=173,λ2=0.816) । इस शासन में, पुल जुर्माना एक दंड के समान है (हालांकि पुल प्रतिगमन साथ विरल समाधान का उत्पादन नहीं कर सकता है , जैसा कि लोचदार शुद्ध कागज में वर्णित है)। मैं सबसे अधिक मेल खाने पाया , लेकिन फिर उन्हें इतनी बदली है कि और अधिक रिज प्रतिगमन की तरह लोचदार शुद्ध बर्ताव करता है ( से दंड अधिक से अधिक दंड)।ℓ1q>1λ1,λ2ℓ2ℓ1
पुल प्रतिगमन के सापेक्ष, लोचदार नेट छोटे वजन को बढ़ाना और बड़े वजन को छोटा करना चाहता है। प्रत्येक क्वाड्रंट में एक बिंदु होता है जहां पुल प्रतिगमन और लोचदार शुद्ध समाधान संयोग करते हैं, और लोचदार नेट पड़ोसी बिंदुओं से इन भार की ओर बढ़ना चाहते हैं।