स्टोकेस्टिक मैट्रिस के लिए स्पार्सिटी-उत्प्रेरण नियमितिकरण


10

यह अच्छी तरह से जाना जाता है (उदाहरण के लिए संपीड़ित संवेदन के क्षेत्र में) कि मानदंड "स्पार्सिटी-उत्प्रेरण" है, इस अर्थ में कि यदि हम कार्यात्मक (निश्चित मैट्रिक्स और वेक्टर ) बड़ा पर्याप्त के लिए \ lambda> 0 , हम A , \ vec {b} के कई विकल्पों के लिए संभावित हैं , और \ lambda के परिणामस्वरूप \ vec {x} में कई बिल्कुल-शून्य प्रविष्टियाँ हैं ।L1Ab

fA,b(x)=Axb22+λx1
λ>0Abλx

लेकिन अगर हम fA,b को इस शर्त के अधीन करते हैं कि \ vec {x} की प्रविष्टियां xसकारात्मक और 1 के योग हैं 1, तो L1 शब्द का कोई प्रभाव नहीं पड़ता (क्योंकि x1=1 fiat द्वारा)। क्या इस मामले में काम करने वाले एक अनुरूप L1 नियमित रूप से काम करने वाला है जो यह प्रोत्साहित करने के लिए काम करता है कि परिणामस्वरूप x विरल है?


क्या आप "फिर L1 शब्द का कोई प्रभाव नहीं है (क्योंकि ||x||1=1 fiat द्वारा) पर विस्तार से बता सकते हैं ?"
Cam.Davidson.Pilon

2
@ Cam.Davidson.Pilon: xi0 और ixi=1 का तात्पर्य \ _ x \ _ _1 = 1x1=1 । :)
कार्डिनल

1
जस्टिन: कुछ और विवरण उपयोगी उत्तर पर बेहतर मौका दे सकते हैं। यहाँ कुछ प्रश्न हैं जो आपके विवरण को पढ़ने पर तुरंत उठते हैं: ( 1 ) इस सब में "स्टोचस्टिक मैट्रिक्स" कहाँ है? आप केवल एक स्टोकेस्टिक वेक्टर से युक्त स्थिति का वर्णन करते हैं । ये आपके स्टोचस्टिक मैट्रिक्स की अलग-अलग पंक्तियाँ हो सकती हैं, या अधिक विवरण मौजूद होने पर अन्य संरचना स्पष्ट हो सकती है। ( ) आप चाहते हैं कि संभावनाएँ स्वयं विरल हों, या शायद, कुछ उपयुक्त आधारों में विरलता हो? यदि पहले, क्यों? (यह एक भारित (विरल) ग्राफ़ पर कुछ यादृच्छिक चलना है?)
कार्डिनल

तुम क्यों की कि प्रविष्टियों की आवश्यकता होती है कर रहे हैं रहे सकारात्मक ? क्या आपको इसके बजाय यह अपेक्षा करनी चाहिए कि वे अप्रतिष्ठित हों ? इसके अलावा, क्या आपने बाधा को खत्म करने के लिए पुन: मापदंडों पर विचार किया है (यह मानते हुए कि आप गैर-नकारात्मक हैं)? दूसरे शब्दों में,xxi=exp(wi)jexp(wj)
jrennie

1
@ जेनी: संदर्भ को देखते हुए, सकारात्मक जस्टिन द्वारा निश्चित रूप से गैर- सकारात्मक था ।
कार्डिनल

जवाबों:


2

विरल समाधान बनाने के लिए एक सामान्य विधि एक अज्ञात विचरण के साथ सामान्य शून्य से पहले एमएपी अनुमान के माध्यम से है।

p(xi|σi2)N(0,σi2)

यदि आप पहले को एक पूर्व असाइन करते हैं जिसमें शून्य पर एक मोड होता है तो पोस्टीरियर मोड आमतौर पर विरल होता है। एक घातीय मिश्रण वितरण लेने के द्वारा इस दृष्टिकोण से उठता है।σi2L1

p(σi2|λ)Expo(λ22)

फिर आप प्राप्त करें

log[p(xi|λ)]=λ|xi|+log[λ2]

कुछ विकल्प सामान्यीकृत डबल पेरेटो, आधा कॉची, उल्टे बीटा हैं। कुछ अर्थों में ये लस्सो से बेहतर हैं क्योंकि ये बड़े मूल्यों को सिकोड़ते नहीं हैं। वास्तव में मुझे पूरा यकीन है कि सामान्यीकृत डबल पेरेटो को घातांक के मिश्रण के रूप में लिखा जा सकता है। यही कारण है कि हम और फिर एक गामा पूर्व । हमें मिला:λ=λip(λi|αβ)

p(xi|αβ)=α2β(1+|xi|β)(α+1)

ध्यान दें कि मैंने स्थिरांक को सामान्य बनाना शामिल किया है, क्योंकि वे अच्छे वैश्विक मापदंडों को चुनने में मदद करते हैं। अब यदि हम सीमा प्रतिबंध लागू करते हैं तो हमारे पास एक अधिक जटिल समस्या है, क्योंकि हमें सिंप्लेक्स पर पुन: गणना करने की आवश्यकता है।

जुर्माने की एक और सामान्य विशेषता यह है कि वे शून्य पर भिन्न नहीं हैं। आमतौर पर ऐसा इसलिए होता है क्योंकि बाईं और दाईं सीमाएं विपरीत संकेत की होती हैं।

यह निकोलस पॉल्सन और जेम्स स्कॉट के शानदार काम पर आधारित है, जिसका मतलब है कि मिक्स प्रतिनिधित्व का उपयोग, जो वे TIRLS को विकसित करने के लिए करते हैं - हानि-दंड संयोजनों के एक बहुत बड़े वर्ग के लिए कम से कम वर्गों का एक विशाल विस्तार।

एक विकल्प के रूप में आप एक पूर्व का उपयोग कर सकते हैं जो सिम्प्लेक्स पर परिभाषित किया गया है, लेकिन शून्य पर सीमांत वितरण में मोड हैं। एक उदाहरण 0 और 1 के बीच सभी मापदंडों के साथ डिरिचलेट वितरण है। निहित जुर्माना इस तरह लगेगा:

i=1n1(ai1)log(xi)(an1)log(1i=1n1xi)

जहां । हालाँकि आपको संख्यात्मक रूप से अनुकूलन करने में सावधानी बरतने की आवश्यकता होगी क्योंकि दंड में विलक्षणता है। एक और अधिक मजबूत अनुमान प्रक्रिया पश्च माध्य का उपयोग करना है। यद्यपि आप सटीक विरलता खो देते हैं, लेकिन आपको कई पोस्टीरियर साधन मिलेंगे जो शून्य के करीब हैं0<ai<1


यह एक बहुत ही दिलचस्प विचार लगता है, हालांकि हम विवरण को समझने के लिए काफी सुसज्जित नहीं हैं! अगर मैं सही ढंग से समझता हूं, तो विचार यह है कि पूर्व एक धारणा से आता है कि चर 0. के बारे में एक घातांक वितरण का अनुसरण करते हैं, इसलिए हमें 0 पर केंद्रित एक वितरण की आवश्यकता है जो हमारे चर के लिए बेहतर काम करता है। लेकिन, कोई स्पष्ट विजेता नहीं है, है ना? क्या "पॉजिटिव वेरिएबल्स पर वितरण होता है जो कि 1 तक होता है"? आपकी सहायताके लिए धन्यवाद! L1
जस्टिन सोलोमन

स्पार्सिटी पाने के लिए आपको शून्य पर एक मोड के साथ एक वितरण की आवश्यकता होती है। और डाइरिक्लेट वितरण सिम्प्लेक्स के ऊपर है, जो कि ठीक से उन वितरणों का योग है, जो कि 1. के बराबर है। एक अन्य सामान्य वर्ग लॉजिस्टिक-सामान्य या लॉजिस्टिक टी है, जहां आपके पास लिए एक सामान्य / t वितरण हैlog[xixn]
संभाव्यता

आह, Dirichlet काफी दिलचस्प लगता है कि यह हमारे द्वारा बताए गए सिंपलेक्स पर है! ऐसा लगता है कि अन्य दो जो आप उल्लेख करते हैं वे पर कुछ विषमता का परिचय दे सकते हैं , है ना? मेरे सहयोगी और मैं कल Dirichlet द्वारा निहित ऊर्जा समारोह के माध्यम से काम करेंगे और वापस रिपोर्ट करेंगे! आपके रोगी की मदद के लिए बहुत धन्यवाद इस प्रकार दूर - यह हमारे सामान्य क्षेत्र से बहुत दूर है लेकिन अगर हम इसे काम कर सकते हैं तो परिणाम ज्यामिति प्रसंस्करण में काफी आगे कदम प्रदान कर सकते हैं! [और निश्चित रूप से हम आपको उचित श्रेय प्रदान करेंगे!]xn
जस्टिन सोलोमन

1

दो विकल्प:

  1. पर दंड का उपयोग करें । स्पष्ट दोष यह है कि यह गैर-संवेदी है और इसलिए इसे अनुकूलित करना मुश्किल है।L0x
  2. , और नए (प्राकृतिक) पैरामीटर वेक्टर पर एक दंड का उपयोग करें,। यह घटनाओं को समान रूप से संभव होने के लिए प्रोत्साहित करेगा जब तक कि उनके न होने का एक अच्छा कारण है।xi=exp(wi)jexp(wj)w

क्या आप बता सकते हैं कि आपका पुनर्मूल्यांकन स्पार्सिटी को कैसे प्रोत्साहित करता है? बल्कि यह काफी विपरीत गारंटी देता है।
कार्डिनल

यह में स्पार्सिटी को प्रोत्साहित करता है जो समान मान रखने के लिए की विभिन्न प्रविष्टियों को प्रोत्साहित करने से मेल खाता है । wx
०४ पर ग्रेनी

हां मैं समझता हूं। लेकिन, वे मूल्य शून्य नहीं होंगे। यदि हम ओपी को शाब्दिक रूप से लेते हैं, तो यह मदद नहीं करेगा और वास्तव में "चोट" (एक अर्थ में) होगा। लेकिन, यह संभव है कि ओपी कुछ अन्य आधारों के संबंध में विरलता में रुचि रखते हैं, इस मामले में, यह उनमें से एक होगा। :)
कार्डिनल

इसीलिए मैंने अपने उत्तर में दो विकल्प प्रदान किए --- मुझे लगता है कि जीरो को में प्रोत्साहित करने के लिए गैर-दंड दंड की आवश्यकता होगी । जैसा कि आपने उल्लेख किया है, जस्टिन की संभावना का शाब्दिक अर्थ नहीं है कि उन्होंने क्या कहा। x
jrennie

हां, दुर्भाग्य से हमें पहचान के आधार पर विरलता की आवश्यकता है। तो इस मामले में हम बराबरी के लिए जितना संभव हो उतना चाहते हैं । wi
जस्टिन सोलोमन

1

प्रश्न का आधार केवल आंशिक रूप से सही है। हालांकि यह सच है कि -norm एक अड़चन के तहत एक स्थिर है, बाधा अनुकूलन समस्या बहुत अच्छी तरह से एक विरल समाधान हो सकता है।L1

हालाँकि, यह समाधान की पसंद से अप्रभावित है , इसलिए या तो एक विरल समाधान है या नहीं। एक और सवाल यह है कि वास्तव में समाधान कैसे खोजना है। रैखिक बाधाओं के तहत एक मानक द्विघात अनुकूलक, निश्चित रूप से इस्तेमाल किया जा सकता है, लेकिन लोकप्रिय समन्वित वंश एल्गोरिदम का उपयोग नहीं किया जा सकता है।λ

एक सुझाव एक सकारात्मकता निरोधक के तहत अलग-अलग लिए अनुकूलन करने के लिए हो सकता है , और फिर का समाधान करने के लिए इसका बदलें बाधा।λL1


0

मैं तीन तरीके सोच सकता हूं।

  • बायेसियन विधि: मापदंडों और हाइपर मापदंडों का अनुमान लगाने के लिए शून्य-माध्य पूर्व वितरण और प्रकार II संभावना का उपयोग करें।

  • का प्रयोग करें बजाय नियमितीकरण के रूप में। हालांकि यह अलग नहीं है। आप इसे अनुमानित करने के लिए एक उच्च-क्रम मानदंड का उपयोग कर सकते हैं।

  • का प्रयोग करें ।i=1logxi

वास्तव में, पहले और तीसरे तरीके समान हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.