क्या L1 नियमितीकरण के साथ प्रतिगमन Lasso के समान है, और L2 नियमितीकरण के साथ रिज प्रतिगमन के समान है? और "लासो" कैसे लिखें?


33

मैं एक सॉफ्टवेयर इंजीनियर लर्निंग मशीन लर्निंग हूं, खासकर एंड्रयू एनजी के मशीन लर्निंग कोर्स के जरिए । नियमितीकरण के साथ रैखिक प्रतिगमन का अध्ययन करते समय , मुझे ऐसे शब्द मिले हैं जो भ्रामक हैं:

  • एल 1 नियमितीकरण या एल 2 नियमितीकरण के साथ प्रतिगमन
  • LASSO
  • रिज रिग्रेशन

तो मेरे सवाल:

  1. क्या L1 नियमितीकरण के साथ प्रतिगमन LASSO के समान है?

  2. L2 नियमितीकरण के साथ प्रतिगमन रिज रिज्रेशन के समान ही है?

  3. लेखन में "LASSO" का उपयोग कैसे किया जाता है? क्या यह "LASSO प्रतिगमन" होना चाहिए? मैंने देखा है जैसे " लसो अधिक उपयुक्त है "।

यदि उत्तर 1 और 2 से ऊपर के लिए "हां" है, तो इन दो शब्दों के लिए अलग-अलग नाम क्यों हैं? क्या "L1" और "L2" कंप्यूटर विज्ञान / गणित, और "LASSO" और "रिज" आँकड़ों से आते हैं?

जब मैं पोस्ट देखता हूं तो इन शब्दों का उपयोग भ्रामक है:

" L1 और L2 नियमितीकरण में क्या अंतर है? " (Quora.com)

" मुझे लस्सो बनाम रिज का उपयोग कब करना चाहिए? " (सांख्यिकी.stackexchange.com)


हालांकि मैं देर से जवाब दे रहा हूं। रैखिक, रिज और लास्सो रिग्रेशन के लिए इस व्यापक शुरुआती गाइड से शुरुआती लोगों को इन शर्तों को स्पष्ट रूप से समझने में मदद मिलेगी। यहाँ
शिक्षार्थी

जवाबों:


34
  1. हाँ।

  2. हाँ।

  3. LASSO वास्तव में एक संक्षिप्त (कम निरपेक्ष संकोचन और चयन ऑपरेटर) है, इसलिए इसे पूंजीकृत होना चाहिए, लेकिन आधुनिक लेखन मैड मैक्स के शाब्दिक समकक्ष है । दूसरी ओर, अमीबा लिखती है कि यहां तक ​​कि सांख्यिकीविदों ने जो LASSO शब्द गढ़ा था, अब लोअर-केस रेंडरिंग का उपयोग करते हैं (हैस्टी, तिब्शीरानी और वेनराइट, सांख्यिकीय लर्निंग विद स्पार्सिटी )। कोई केवल स्विच के लिए प्रेरणा के रूप में अटकलें लगा सकता है। यदि आप एक अकादमिक प्रेस के लिए लिख रहे हैं, तो उनके पास आमतौर पर इस तरह की शैली के लिए एक स्टाइल गाइड है। यदि आप इस मंच पर लिख रहे हैं, तो या तो ठीक है, और मुझे संदेह है कि वास्तव में किसी को परवाह है।

अंकन मिंकोवस्की मानदंडों और के लिए एक संदर्भ है एल पी रिक्त स्थान। ये सिर्फ करने के लिए टेक्सी और इयूक्लिडियन दूरी की धारणा सामान्य पी > 0 निम्नलिखित अभिव्यक्ति में: एक्स पी = ( | एक्स 1 | पी + | एक्स 2 | पी + + | X n | पी ) 1एलएलपीपी>0 महत्वपूर्ण रूप से, केवलpdef1एक मीट्रिक दूरी को परिभाषित करता है; 0<p<1त्रिकोण असमानता को संतुष्ट नहीं करता है, इसलिए यह अधिकांश परिभाषाओं से दूरी नहीं है।

एक्सपी=(|एक्स1|पी+|एक्स2|पी++|एक्सn|पी)1पी
पी10<पी<1

मुझे यकीन नहीं है कि जब रिज और LASSO के बीच संबंध का एहसास हुआ था।

सी


6
+1। स्पार्सिटी पाठ्यपुस्तक, हस्ती, टिब्शिरानी और वेनराइट के साथ हाल ही के सांख्यिकीय लर्निंग में हर जगह सभी-लोअर-केस "लैस्सो" का उपयोग करते हैं और निम्नलिखित भी लिखते हैं (पेज 8 पर पाद लेख): "एक लैस्सो एक नोज के साथ एक लंबी रस्सी है अंत में, घोड़ों और मवेशियों को पकड़ने के लिए इस्तेमाल किया जाता है। एक आलंकारिक अर्थ में, विधि "लास्सो" मॉडल का गुणांक है। मूल लास्सो पेपर (तिब्शीरानी 1996) में, "लास्सो" नाम भी "कम से कम" के लिए एक परिचित के रूप में था। चयन और संकोचन संचालक। "" (CC to @ stackoverflowuser2010।)
अमीबा का कहना है कि मोनिका

3
और वे जारी रखते हैं: "उच्चारण: अमेरिका में" lasso "का उच्चारण" lass-oh "(ओह बकरी के रूप में), जबकि यूके में" lass-oo "किया जाता है। OED में (दूसरा संस्करण, 1965:" लसो का उपयोग करने वालों द्वारा लसो का उच्चारण किया जाता है, और अधिकांश अंग्रेजी लोगों द्वारा भी। "" :-)
अमीबा का कहना है कि मोनिका

4
(+1) जैसा कि उचित है (शब्दों के रूप में स्पष्ट किए गए संक्षिप्तीकरण) मुद्रा प्राप्त करें उनका पूंजीकरण बोर्ड द्वारा जाने के लिए जाता है। मुझे 'RADAR' या 'LASER' देखे हुए कुछ समय हो गया है।
Scortchi - को पुनः स्थापित मोनिका

2
@Scortchi SCUBA भी। इस बीच हमारे पास STATA और MATLAB लिखने वाले लोग हैं जैसे कि वे परिवर्णी हैं।
छायाकार

2
@ssdecontrol: "एनोवा" को "अनोवा" होना चाहिए?
Scortchi - को पुनः स्थापित मोनिका
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.