लुका, एक साल बीत जाने के बाद, आपने शायद अपने खुद के जवाब पर शोध किया है। मैं आपके कुछ सवालों के जवाब यहां सिर्फ रिकॉर्ड के लिए दे रहा हूं। मैं आपके द्वारा बताई गई समस्याओं के लिए कुछ Lagrangian-Relaxing एल्गोरिदम की समीक्षा करता हूं, और सीखने के लिए कनेक्शन स्केच करता हूं (विशेष रूप से, विशेषज्ञ की सलाह के बाद)। मैं यहाँ SDP एल्गोरिदम पर टिप्पणी नहीं करता।
ध्यान दें कि आपके द्वारा उल्लिखित विशेष एल्गोरिदम लगभग रैखिक समय में नहीं चलते हैं। ( स्पष्ट रूप से दी गई पैकिंग या कवरिंग समस्याओं के लिए लगभग रैखिक समय का एल्गोरिथ्म
है। फ्रैक्शनल पैकिंग और कवरिंग प्रोग्राम्स के लिए बीटिंग सिम्प्लेक्स देखें
।) आपके पास मौजूद एल्गोरिदम में आमतौर पर ऐसे वेरिएंट होते हैं जो लगभग रैखिक संख्या में पुनरावृत्तियों में चलते हैं , लेकिन प्रत्येक पुनरावृत्ति के लिए आमतौर पर कम से कम रैखिक समय की आवश्यकता होती है। मैं इनमें से कुछ एल्गोरिदम के बारे में नीचे चर्चा करता हूं।
कुछ उपयोगी कार्य
yLmax(y)ln∑iexp(yi)maxiyi
maxiyi ≤ Lmax(y) ≤ maxiyi+lnm.
Lmin(y)−Lmax(−y)miniyi
इस प्रकार की सुविधा के लिए, हम के ग्रेडिएंट को दर्शाने के लिए का उपयोग करते हैं । हम के ग्रेडिएंट को दर्शाने के लिए का उपयोग करते हैं ।g(y)∇Lmin(y)G(y)∇Lmax(y)
स्पष्ट रूप से, is
जबकि is ।gi(y)exp(−yi)/∑i′exp(−yi′)Gi(y)exp(yi)/∑i′exp(yi′)
Lmin और Lmax निम्नलिखित अर्थों में सुचारू हैं : किसी भी वैक्टर और ,
और
d∈[0,ε]ny∈Rn
Lmin(y+d) ≥ Lmin(y) + (1−O(ε))d⋅g(y)
Lmax(y+d) ≤ Lmax(y) + (1+O(ε))d⋅G(y).
ध्यान दें कि दोनों ग्रेडिएंट्स का 1-मान 1: बराबर है
। (हम पूरे उपयोग करते हैं -1-मान को निरूपित करने के लिए।)|G(y)|=|g(y)|=1|z|
यह भी ध्यान दें कि, एक मैट्रिक्स के लिए , समारोह की ढाल के संबंध में
है (श्रृंखला शासन द्वारा) । अधिक स्पष्ट रूप से, सम्मान के साथ समारोह का आंशिक व्युत्पन्न को
है । इसी तरह, Lmax का आंशिक व्युत्पन्न
सम्मान के साथ करने के लिए है ।Ax↦Lmin(Ax)x(g(Ax))TAxj∑iAijexp(−Aix)/∑iexp(−Aix)(Ax)xj∑iAijexp(Aix)/∑iexp(Aix)
आंशिक सेट कवर
सेट-कवर आवृत्ति को ठीक करें। आइए तत्व को निर्धारित करें / घटना मैट्रिक्स सेट करें। इस प्रकार, यदि , और 0, और वह सीमा है जिसमें आंशिक कवर तत्व को कवर करता है ।AAes=1e∈sAexxe
एल.पी. । दिए गए , एल्गोरिथ्म हैmin{|x|:Ax≥1;x≥0}ε∈(0,1)
- सभी प्रारंभ करें । चलो । xs=0N=log(n)/ε
दोहराएं जब तक : mineAex≥N
2.1। चुनें lmin का आंशिक व्युत्पन्न को अधिकतम wrt ।
(स्पष्ट रूप से, चुनें अधिकतम ।) s(Ax)xs
s∑e∈sexp(−∑s′∋exs′)
2.2। को बढ़ाएं । xsε
वापसी ।x/mineAex
एल्गोरिथ्म एक में अनुमानित समाधान देता है पुनरावृत्तियों, जहां तत्वों की संख्या है और इष्टतम है? आंशिक सेट कवर (तुच्छ रूप से )। (एक समान एल्गोरिथ्म का उल्लेख चंद्रा के कागज में दिखाई देता है । वर्टेक्स कवर निश्चित रूप से एक विशेष मामला है।)(1+O(ε))O(|x∗|log(n)/ε2)nx∗|x∗|≤n
( टिप्पणी: ध्यान दें कि बाउंड्रीज बाउंड सेट की संख्या पर निर्भर नहीं करता है, बस तत्वों की संख्या है। इस प्रकार, एल्गोरिथ्म को एक निहित परिभाषित सेट सिस्टम के साथ इस्तेमाल किया जा सकता है, जब तक कि तत्वों पर भार दिया जाता है, कोई कुशलता से कर सकता है। अधिकतम वजन (या निकट-अधिकतम) कुल वजन का एक सेट खोजें। इस तरह का एक प्रकार का अलंकार है, जो अंडाकार एल्गोरिथ्म को दोहरी समस्या पर लागू करने के लिए आवश्यक जुदाई के लिए है। सेट की पैकिंग जैसी समस्याओं के लिए, आपको एक दाना चाहिए। तत्वों पर दिए गए भार, कुल वजन को कम करने वाला एक सेट लौटाता है । बहु-वस्तु प्रवाह जैसी समस्याओं के लिए, उदाहरण के लिए, आपको कुछ दिए गए किनारे के भार के योग को कम करने के लिए एक मार्ग खोजने की आवश्यकता होगी।)
यहां प्रदर्शन गारंटी के प्रमाण का एक स्केच है। प्रत्येक पुनरावृत्ति में, आंशिक व्युत्पन्न wrt चुना हुआ
कम से कम, जहां इष्टतम आंशिक सेट कवर है।s1/|x∗|x∗
(क्यों देखने के लिए, याद है कि lmin की ढाल के संबंध में है अगर हम एक सेट का चयन करने के लिए गए थे। वितरण से यादृच्छिक पर संबंध में आंशिक व्युत्पन्न का अपेक्षित मूल्य
इस प्रकार होगा | चूंकि , यह कम से कम है । के बाद से , इस कम से कम है । कुछ इस प्रकार, वहाँ मौजूद होना चाहिए कम से कम आंशिक व्युत्पन्न दे रही है | चूंकि एल्गोरिथ्म चुनता है(Ax)x(g(Ax))TAs′x∗/|x∗|xs′(g(Ax))TAx∗/|x∗|Ax∗≥1|g(Ax)|/|x∗||g(Ax)|=11/|x∗|s1/|x∗|xs
आंशिक व्युत्पन्न को अधिकतम करने के लिए प्रत्येक पुनरावृत्ति में , यह कम से कम का आंशिक व्युत्पन्न प्राप्त करता है।)1/|x∗|
फिर, चरण आकार को केवल इतना छोटा चुना जाता है कि का कोई समन्वय से अधिक न बढ़े । इस प्रकार, Lmin की चिकनाई के कारण,
को बढ़ाने से कम से कम बढ़ जाता है
।εAxεxsxs+εLmin(Ax)(1−O(ε))ε/|x∗|
इस तरह, एल्गोरिथ्म अपरिवर्तनीय बनाए रखता है
(ध्यान दें कि Lmin बराबर ।)
Lmin(Ax)≥(1−O(ε))|x|/|x∗|−lnn.
(0¯¯¯)lnn
समाप्ति के समय, इनवेरिएंट में, टर्म बार-बार बाईं ओर होता है, इसलिए गणना के द्वारा एक को। एल्गोरिथ्म की अंतिम पंक्ति में सामान्यीकरण के बाद, इसका तात्पर्य है।lnnO(ε)mineAex≥(1−O(ε))|x|/|x∗||x|≤(1+O(ε))|x∗|
एफडब्ल्यूआईडब्ल्यू, आक्रमणकारी साबित करने में शामिल असमानताएं अनिवार्य रूप से वही हैं जो चेर्नॉफ बाध्य साबित करने में शामिल हैं। (वास्तव में, इस एल्गोरिथ्म एक यादृच्छिक-गोलाई योजना को सशर्त संभावनाओं की विधि लगाने से प्राप्त किया जा सकता है कि बार-बार वितरण से नमूने सेट
(प्रतिस्थापन के साथ), बढ़ती प्रत्येक नमूना सेट के लिए । इसका व्युत्पन्न एल्गोरिथ्म देता है: अंतर्निहित अपरिवर्तनीय बस यह है कि निराशावादी अनुमानक नीचे रहता है। निराशावादी अनुमानक में घातांक दंड गोलाई योजना के विश्लेषण में बंधे चेरनॉफ का उपयोग करने से आता है। इस मूल विचार को आगे समझाया गया है। में कागज चंद्र उल्लेख किया ।)x∗/|x∗|xss
आंशिक भारित सेट कवर (और सामान्य आंशिक आवरण)
भारित सेट कवर जैसी समस्याओं को कुशलतापूर्वक संभालने के लिए , हम गैर-समान वेतन वृद्धि ( गर्ग और कोनेमैन के कारण एक विचार ) का उपयोग करने के लिए एल्गोरिदम को संशोधित करते हैं ।
एल.पी. है , जहां तत्वों से अधिक श्रृंखला, गैर सेट पर होती है, और सभी चर रहे हैं -नकारात्मक। एल्गोरिथ्म को पेश करने के लिए, पहले समस्या को सामान्य कवरिंग समस्या के रूप में फिर से लिखें। आज्ञा दें कि लिए और अन्यथा। तब (चर के परिवर्तन के साथ, द्वारा प्रत्येक को ), LP , जिसे हम सामान्य कवरिंग LP के रूप में देख सकते हैं। यहाँ एल्गोरिथ्म है:min{c⋅x:(∀e)∑s∋exs≥1}esAes=1/cse∈sAes=0xscsmin{|x|:Ax≥1;x≥0}
सभी प्रारंभ करें । चलो ।xs=0N=log(n)/ε
तब तक दोहराएं जब तक कि सभी कवरिंग बाधाओं को हटा नहीं दिया गया हो:
2.1। चुनें lmin का आंशिक व्युत्पन्न को अधिकतम wrt ।
(स्पष्ट रूप से, चुनें अधिकतम ।)s(Ax)xs
s∑e∈sexp(−∑s′∋exs′)/cs
2.2। को बढ़ाएं , जहां को अधिकतम रूप से चुना जाता है, जैसे कि हर शेष कवरिंग बाधा , में वृद्धि अधिकांश ।xsδδeAe⋅xε
2.3 सभी हटाएं कवर की कमी है कि इस तरह ।eAe⋅x≥N
वापसी ।x/mineAe⋅x
एल्गोरिथ्म पुनरावृत्तियों में एक -approximate समाधान लौटाता है , जहां को कवर करने की संख्या में कमी है। (प्रत्येक पुनरावृत्ति कुछ शेष को ; यह नष्ट होने से पहले केवल एक बाधा के लिए बार ही हो सकता है ।) शुद्धता का प्रमाण अनिवार्य रूप से सेट कवर के समान ही अपरिवर्तनीय है।(1+O(ε))O(nlog(n)/ε2)nAexεN/ε
भारित वर्टेक्स कवर एक विशेष मामला है।
अधिकतम भिन्नात्मक द्विदलीय मिलान
ग्राफ को देखते हुए समस्या के लिए प्राकृतिक LP ।G=(U,W,E)max{|x|:∀v.∑e∋vxe≤1}
मैट्रिक्स प्रतिनिधित्व में, यह एक पैकिंग एलपी
गुणांक के साथ ( अगर )। इस तरह की समस्याओं के लिए गैर-समान वेतन वृद्धि की आवश्यकता नहीं होती है, इसलिए अनलिमिटेड सेट कवर एल्गोरिथ्म (लेकिन पैकिंग के लिए) के अनुरूप एक सरल एल्गोरिथ्म होगा:max{|x|:Ax≤1;x≥0}Ave=1v∈e
- सभी प्रारंभ करें । चलो ।xe=0N=log(n)/ε
जबकि :Ax<N
2.1। Lmax wrt के आंशिक व्युत्पन्न को कम करने के लिए चुनें ।
(स्पष्ट रूप से, को ।)e(Ax)xe
e∑v∈eexp(∑e′∋vxe′)
2.2। को बढ़ाएं । xeε
वापसी ।x/maxvAvx
एल्गोरिथ्म पुनरावृत्तियों में -approximate समाधान देता है । (ऐसा इसलिए है क्योंकि प्रत्येक पुनरावृत्ति बढ़ती है by , और अंत में, सामान्य होने से पहले ।)(1−O(ε))O(nlog(n)/ε2)|x|ε|x|=O(Nn)
बस मज़े के लिए, यहाँ परफेक्ट बिपर्टाइट मैचिंग के लिए एक जिज्ञासु वैकल्पिक एल्गोरिदम है। याद है कि । चलो।G=(U,W,E)n=|U|=|W|
- सभी प्रारंभ करें । आज्ञा देना । xe=0N=4ln(n)/ε
दोहराएँ बार:nN
2.1। चुनें से यादृच्छिक पर समान रूप से ।
2.2। ऐसे चुनें कम करके ।
2.3। द्वारा बढ़ाएँ । uU
w(u,w)∈E∑e∋wxe
xuwε
वापसी ।x/N
यदि का पूर्ण मिलान होता है, तो एल्गोरिथ्म एक लौटाता है जैसे कि , और, उच्च संभावना के साथ, सभी कोने , , और सभी कोने में , । यदि आप प्रमाण के विवरण में रुचि रखते हैं, तो कृपया पूछें ...Gx|x|=nu∈U1−O(ε)≤∑e∋uxe≤1+O(ε)w∈W∑e∋wxe≤1+O(ε)
मिश्रित पैकिंग और कवरिंग
आपने एक मिश्रित पैकिंग और कवरिंग समस्या के उदाहरण के लिए द्विदलीय मिलान के बारे में पूछा हो सकता है , अर्थात फॉर्म
ऐसी समस्याओं के लिए एक एल्गोरिथ्म है। सबसे पहले, सामान्य करें ताकि और ।
∃x? Px≤p;Cx≥c;x≥0.
p=1¯¯¯c=1¯¯¯
आज्ञा देना की संख्या की कमी (पंक्तियों में प्लस पंक्तियों में )।mPC
- सभी प्रारंभ करें । चलो ।xj=0N=2ln(m)/ε
जबकि :Px<N
2.1। चुनें ताकि Lmax का आंशिक व्युत्पन्न के संबंध में ज्यादा से ज्यादा lmin का आंशिक व्युत्पन्न है के संबंध में । (स्पष्ट रूप से, चुनें जैसे किj(Px)xj(Cx)xjj
∑iPijexp(Pix)∑iexp(Pix)≤∑iCijexp(−Cix)∑iexp(−Cix).)
2.2। को बढ़ाएं , जहां को अधिकतम चुना जाता है जैसे कि कोई बाधा या शेष बाधा से अधिक नहीं बढ़ती है ।xjδδPixCixε
2.3। सभी को कवर बाधाओं को हटाना ऐसा है कि ।iCix≥N
वापसी ।x/maxiPix
दी गई समस्या को संभव मानते हुए, एल्गोरिथ्म एक लौटाता है जैसे कि
और । पुनरावृत्तियों की संख्या , क्योंकि प्रत्येक पुनरावृत्ति में द्वारा कुछ बाधाएँ बढ़ जाती हैं , और यह अधिकांश पर प्रत्येक बाधा के लिए हो सकता है ।xPx≤1Cx≥1−O(ε)O(mln(m)/ε2)εN
शुद्धता का प्रमाण अपरिवर्तनीय
अपरिवर्तनीय का तात्पर्य
समाप्ति पर बाईं ओर प्रदर्शन की गारंटी साबित करते हुए, ।
Lmax(Px)≤2ln(m)+(1+O(ε))Lmin(Cx).
maxPx≤2ln(m)+(1+O(ε))minCx.
Ω(log(m)/ε)
चरण 2.1 में, वांछित तब तक मौजूद होना चाहिए जब तक कि मूल समस्या संभव न हो। (यह इसलिए है, क्योंकि किसी भी व्यवहार्य , और किसी भी , अगर हम वितरण से एक यादृच्छिक चुनना चाहते थे, तो Lmax के आंशिक व्युत्पन्न का अपेक्षित मूल्य। संबंध
में अधिकतम (सेट कवर के पिछले प्रमाण देखें)। इसी तरह, संबंध में Lmin के आंशिक व्युत्पन्न का अपेक्षित मान।
कम से कम इस प्रकार, एकj x∗xj′x∗/|x∗|(Px)xj′1/|x∗|(Cx)xj′1/|x∗|jऐसे कि x_ संबंध में Lax
का आंशिक व्युत्पन्न, Lmin अधिकांश आंशिक व्युत्पन्न में है ।)(Px)xj′(Cx)
तब प्रत्येक पुनरावृत्ति में इनवेरिएंट बनाए रखा जाता है, क्योंकि और की पसंद से , और Lmin और Lmax की चिकनाई, को
बढ़ाकर Lmax
को सबसे अधिक
समय तक बढ़ा देता है Lmin में वृद्धि ।xjδxjxj+δ(Px)1+O(ε)(Cx)
सीखना (विशेषज्ञों का अनुसरण करना)
इस संबंध को समझने के लिए एक संदर्भ
एडाप्टिव गेम है , जो फ्रंड और शेपायर द्वारा गुणा वज़न का उपयोग करके खेला जाता है। तकनीकी विचार देने के लिए यहां एक त्वरित सारांश दिया गया है।
निम्नलिखित दोहराया खेल पर विचार करें। प्रत्येक दौर में : t
- आप ( तथाकथित विशेषज्ञों ) पर प्रायिकता वितरण चुनते हैं । pt[n]n
- जानने के बाद, विरोधी एक भुगतान वेक्टर का चयन करता है । ptat∈[0,1]n
- आप राउंड के लिए अदायगी प्राप्त करते हैं। pt⋅at
कुछ राउंड्स के बाद खेल रुक गया। अपने लक्ष्य किसी एक विशेषज्ञ (यानी, शुद्ध रणनीति) की तुलना में अपने अफसोस कम करने के लिए है । यही है, आपका लक्ष्य कम से कम ।i(maxi∑tati)−∑tpt⋅at
किसी भी ठीक करें । वेक्टर निरूपित करें , अर्थात,
, वेक्टर का भुगतान समय-समय पर वैक्टर के समय तक । स्मरण करो कि Lmax का ढाल है ।ε>0ytε∑s≤tasεtG(y)(y)
यहां हम मूल रणनीति का विश्लेषण करेंगे:
गोल , टू ।tptG(yt−1)
निरीक्षण से, यह आपको राउंड में का भुगतान करता ।at⋅G(yt−1)t
,
की चिकनाई गुण के कारण
अर्थात्, प्रत्येक दौर में, आपके भुगतान से अधिक बार से अधिक नहीं बढ़ सकता है । चूँकि , यह इस बात को बनाए रखता है कि
आपके कुल भुगतान समय में सबसे अधिक है , प्लस दूसरी ओर, सबसे अच्छा विशेषज्ञ की तुलना में आपके अफसोस।
है , यानी,F
Lmax(yt)≤Lmax(yt−1)+(1+O(ε))εat⋅G(yt−1).
Lmax(yt)ε(1+O(ε))Lmax(0¯¯¯)=lnnLmax(yt)ε(1+O(ε)ln(n)imaxi∑tatiε−1maxiyti, जो अधिकांश ।
ε−1Lmax(yt)
इस प्रकार, आपका पछतावा अधिकांश , प्लस आपके कुल भुगतान का होता है।ε−1ln(n)O(ε)
टिप्पणी: मुझे लगता है, जैसा कि फ्रायंड और शेपायर बताते हैं, एक "बूस्टिंग" एल्गोरिथम (सीखने के सिद्धांत में) भी इस विश्लेषण में निहित है। अधिक जानकारी के लिए उनका पेपर देखें।
कुल अदायगी न्यूनतम करना
आप सेटिंग के लिए एक समान रणनीति प्राप्त कर सकते हैं, जहां लक्ष्य अधिकतम भुगतान के बजाय, न्यूनतम करना है । आपका पछतावा, जिसे आप अभी भी कम करना चाहते हैं, is । उस स्थिति में, संबंधित रणनीति का ग्रेडिएंट होने के लिए को चुनना है । इस कार्यनीति के साथ आपका पछतावा पुन: अधिकांश
plus आपके कुल भुगतान का होता है।∑tpt⋅at−miniatiptLmin(yt)ε−1lnnO(ε)
Lagrangian- विश्राम एल्गोरिदम के लिए कनेक्शन
Lagrangian- रिलैक्सिंग एल्गोरिदम से कनेक्शन देखने के लिए, सेट-कवर इंस्टेंस को ठीक करें। खेल के उत्तरार्द्ध प्रकार, जहां विशेषज्ञों के तत्वों अनुरूप (कम से कम पैसे मिलते हैं के लक्ष्य के साथ) पर विचार करें अपने सेट प्रणाली की। प्रत्येक दौर में, ऊपर के रूप
में Lmin की प्रवणता होने के लिए प्रायिकता वितरण का चयन करें और विरोधी को poff वेक्टर रूप में कार्य के रूप में निम्नानुसार चुनें :
सेट अधिकतम , तो चलो यदि , और अन्यथा।ept(yt)atptst∑e∈spteate=1e∈state=0
सही स्टॉपिंग कंडीशन (नीचे चर्चा की गई) को देखते हुए, यह प्रक्रिया आपको शुरू में चर्चा की गई सेट-कवर एल्गोरिथ्म बिल्कुल प्रदान करती है।
एल्गोरिथ्म की प्रदर्शन गारंटी निम्नानुसार खेद बाउंड से होती है। चलो बार विरोधी सेट चुना की संख्या हो खेलने के दौरान। आज्ञा देना इष्टतम आंशिक सेट कवर हो। Letखेले जाने वाले राउंड की संख्या हो। अफसोस बाध्यता का तात्पर्य
Xssx∗T=|Xs|
∑tat⋅pt≤ε−1ln(m)+mine∑tate.
की परिभाषा का उपयोग करते हुए , th अदायगी ( बाईं ओर राशि में th शब्द) बराबर होती है । इस भुगतान को कम करने के लिए विरोधी ने को चुना । यदि विरोधी ने इसके बजाय वितरण से यादृच्छिक रूप से को चुना है की उम्मीद
(ऊपर हम सभी लिए उस करते हैं , और ) चूंकि प्रत्येक भुगतान कम से कम है।attt∑e∈stpteststx∗/|x∗|
∑sx∗s|x∗|∑e∈spte = 1|x∗|∑epte∑s∋ex∗s ≥ 1|x∗|∑epte = 1|x∗|.
∑s∋ex∗s≥1e|pt|=11/|x∗|पछतावा होने का तात्पर्य
की परिभाषा से , हमारे पास (प्रत्येक राउंड एक सेट चुनता है), और ,
हम उस प्रक्रिया को रोक देते हैं जब , तो फिर (शब्दों को पुन: व्यवस्थित करना)
अर्थात, को सामान्य करने से अधिकतम आकार का एक भिन्नात्मक सेट कवर मिलता है समय इष्टतम।
T|x∗|≤ε−1ln(m)+mine∑tate.
X|X|=T∑tate=∑e[e∈st]=∑s∋eXs|X||x∗|≤ε−1ln(m)+mine∑s∋eXs.
mine∑s∋eXs=Ω(ε−2lnm)|X|mine∑s∋eXs ≤ (1+O(ε)|x∗|.
X(1+O(ε))
टिप्पणी: एक अर्थ में, यह शिक्षण सिद्धांत व्याख्या एल्गोरिथम व्याख्या को सामान्य करता है। हालांकि, दक्षता के लिए आवश्यक कुछ एल्गोरिदम तकनीक (जैसे गैर-समान वेतन वृद्धि और संतुष्ट कवरिंग बाधाओं को छोड़ना) स्वाभाविक रूप से सीखने के सिद्धांत को स्थापित करने में सक्षम नहीं लगती हैं। इसी तरह, मिश्रित पैकिंग और एलपी को कवर करने के लिए एल्गोरिदम
(जैसे ये ) सीखने-सिद्धांत सेटिंग में प्राकृतिक एनालॉग नहीं लगते हैं।