वे वास्तव में समतुल्य हैं क्योंकि आप हमेशा _ (@ व्हिबर की टिप्पणी भी देख सकते हैं) को पुनः प्राप्त कर सकते हैं । सैद्धांतिक दृष्टिकोण से, यह सुविधा की बात है लेकिन जहां तक मुझे पता है कि यह आवश्यक नहीं है। कम्प्यूटेशनल दृष्टिकोण से, मुझे वास्तव में काफी कष्टप्रद लगता है, इसलिए मैं आमतौर पर पहले सूत्रीकरण का उपयोग करता हूं अगर मैं एक एल्गोरिथ्म डिजाइन कर रहा हूं जो नियमितीकरण का उपयोग करता है।λ1/(2n)
थोड़ा बैकस्टोरी: जब मैंने पहली बार दंडात्मक तरीकों के बारे में सीखना शुरू किया, तो मुझे अपने काम में हर जगह ले जाने पर गुस्सा आया, इसलिए मैंने इसे अनदेखा करना पसंद किया - इसने मेरी कुछ गणनाओं को भी सरल कर दिया। उस समय मेरा काम मुख्य रूप से कम्प्यूटेशनल था। हाल ही में मैं सैद्धांतिक काम कर रहा हूं, और मुझे अपरिहार्य (यहां तक कि बनाम, ) मिला है।1/(2n)1/(2n)1/n
अधिक विवरण: जब आप नमूना आकार कार्य के रूप में लासो के व्यवहार का विश्लेषण करने का प्रयास करते हैं , तो आपको अक्सर iid यादृच्छिक चर के योगों से निपटना पड़ता है, और व्यवहार में आमतौर पर द्वारा सामान्य होने के बाद इस तरह के योगों का विश्लेषण करना अधिक सुविधाजनक होता है - बड़ी संख्या / केंद्रीय सीमा प्रमेय का कानून (या यदि आप कल्पना, माप की एकाग्रता और अनुभवजन्य प्रक्रिया सिद्धांत प्राप्त करना चाहते हैं)। यदि आपके पास नुकसान के सामने अवधि नहीं है , तो आप अंत में विश्लेषण के अंत में कुछ rescaling करते हैं, इसलिए आमतौर पर इसे शुरू करने के लिए वहाँ होना अच्छा है। सुविधाजनक है क्योंकि इसके बारे में कुछ कष्टप्रद कारकों बाहर रद्दnn1/n1/22 विश्लेषण में (उदाहरण के लिए जब आप चुकता हानि अवधि के व्युत्पन्न लेते हैं)।
इसके बारे में सोचने का एक और तरीका यह है कि सिद्धांत करते समय, हम आम तौर पर रूप में समाधान के व्यवहार में रुचि रखते हैं - अर्थात, कुछ निश्चित मात्रा नहीं है। व्यवहार में, जब हम कुछ निश्चित डेटासेट पर लास्सो चलाते हैं, तो वास्तव में एल्गोरिथ्म / अभिकलन के दृष्टिकोण से तय होता है। तो अतिरिक्त सामान्यीकरण कारक को सामने रखने से वह सब मददगार नहीं होता है।nnn
ये सुविधा के कष्टप्रद मामलों की तरह लग सकते हैं, लेकिन इन प्रकार की असमानताओं में हेरफेर करने के लिए पर्याप्त समय बिताने के बाद, मैंने से प्यार करना सीख लिया है ।1/(2n)