मानदंड क्या हैं और वे नियमितीकरण के लिए कैसे प्रासंगिक हैं?


12

मैं विरल निरूपण पर हाल ही में बहुत सारे कागज देख रहा हूं, और उनमें से अधिकांश मानदंड का उपयोग करते हैं और कुछ कम से कम करते हैं। मेरा प्रश्न यह है कि, मानदंड क्या है , और मिश्रित मानदंड है? और वे नियमितीकरण के लिए कैसे प्रासंगिक हैं?ppp,q

धन्यवाद

जवाबों:


13

p मानदंड वे कार्य हैं जो वैक्टर लेते हैं और नंबर लौटाते हैं। वे रूप में परिभाषित किए गए हैं मामले में जहां p = 2 , यह है यूक्लिडियन मानदंड कहा जाता है। आप यूक्लिडियन दूरी को \ | \ vec x - \ vec y \ | _2 के रूप में परिभाषित कर सकते हैं । जब p = \ infty , इसका मतलब सिर्फ \ _। Vec x \ | _ \ infty = \ sup_i x_i (या \ max_i x_i ) है। कड़ाई से बोलते हुए, p को कम से कम एक के लिए होना चाहिए \ _ \ vec x \ | _p एक आदर्श होने के लिए । अगर 0 <p <1 , तो \ _ \ _ vec x \ | _p

xp=(i=1d|xi|p)1/p
p=2xy2p=x=supiximaxixipxp0<p<1xp वास्तव में एक मानक नहीं है, क्योंकि मानदंडों को त्रिकोण असमानता को पूरा करना चाहिए।

( मानदंड भी हैं, जिन्हें से परिभाषित किया गया है, केवल वैक्टर या अनुक्रम के बजाय कार्यों को छोड़कर - वास्तव में यह एक ही बात है, क्योंकि वैक्टर परिमित डोमेन के साथ कार्य करते हैं।)Lp

मैं मशीन लर्निंग एप्लिकेशन में एक मानक के लिए किसी भी उपयोग के बारे में नहीं जानता , जहां , जहां को छोड़कर । आमतौर पर आप या , या कभी-कभी जहां आप मामले को आराम करना चाहते हैं ; कड़ाई से में उत्तल नहीं होता है , लेकिन लिए है । यह कुछ मामलों में समाधान को "आसान" बना सकता है।p>2p=p=2p=11<p<2p=1x1xxp1<p<

नियमितिकरण के संदर्भ में, यदि आप अपने उद्देश्य फ़ंक्शन में जोड़ते हैं, तो आप जो कह रहे हैं, वह यह है कि आप को विरल होने की उम्मीद करते हैं , अर्थात ज्यादातर शून्य से बना है। यह थोड़ा तकनीकी है, लेकिन मूल रूप से, अगर घने समाधान है, तो एक ही मानक के साथ एक विरल समाधान होने की संभावना है। यदि आप अपने समाधान के सघन होने की उम्मीद करते हैं, तो आप अपने उद्देश्य में जोड़ सकते हैं , क्योंकि तब इसके व्युत्पन्न के साथ काम करना बहुत आसान है। दोनों बहुत अधिक वजन होने से समाधान रखने के उद्देश्य से सेवा करते हैं।x1xx22

मिश्रित मानदंड तब आता है जब आप कई स्रोतों को एकीकृत करने की कोशिश कर रहे होते हैं। मूल रूप से आप चाहते हैं कि सॉल्यूशन वेक्टर कई टुकड़ों , जहाँ किसी स्रोत का सूचकांक है। आदर्श बस है सभी की -norm एक सदिश में एकत्र -norms। Ie,xjjp,qqp

xp,q=(j=1m(i=1d|xij|p)q/p)1/q

इसका उद्देश्य समाधानों के एक सेट को "ओवरस्पर्शिफाई" करना नहीं है, का उपयोग करके कहें । अलग-अलग टुकड़े विरल हैं, लेकिन आप सभी समाधानों का -norm लेकर संपूर्ण सॉल्यूशन वेक्टर को देखने का जोखिम नहीं उठाते हैं। इसलिए आप इसके बजाय -norm का उपयोग बाहर की तरफ करें।x1,212

उम्मीद है की वो मदद करदे।

देखें इस पत्र अधिक जानकारी के लिए।


1
मिश्रित मानदंडों की व्याख्या के लिए +1। मैंने उन्हें कभी खुद नहीं समझा।
सुरेश वेंकटसुब्रमण्यन जू।

(+1) अच्छा जवाब। CrossValidated, जॉन में आपका स्वागत है!
मॉन्सट जूल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.