लुका, एक साल बीत जाने के बाद, आपने शायद अपने खुद के जवाब पर शोध किया है। मैं आपके कुछ सवालों के जवाब यहां सिर्फ रिकॉर्ड के लिए दे रहा हूं। मैं आपके द्वारा बताई गई समस्याओं के लिए कुछ Lagrangian-Relaxing एल्गोरिदम की समीक्षा करता हूं, और सीखने के लिए कनेक्शन स्केच करता हूं (विशेष रूप से, विशेषज्ञ की सलाह के बाद)। मैं यहाँ SDP एल्गोरिदम पर टिप्पणी नहीं करता।
ध्यान दें कि आपके द्वारा उल्लिखित विशेष एल्गोरिदम लगभग रैखिक समय में नहीं चलते हैं। ( स्पष्ट रूप से दी गई पैकिंग या कवरिंग समस्याओं के लिए लगभग रैखिक समय का एल्गोरिथ्म
है। फ्रैक्शनल पैकिंग और कवरिंग प्रोग्राम्स के लिए बीटिंग सिम्प्लेक्स देखें
।) आपके पास मौजूद एल्गोरिदम में आमतौर पर ऐसे वेरिएंट होते हैं जो लगभग रैखिक संख्या में पुनरावृत्तियों में चलते हैं , लेकिन प्रत्येक पुनरावृत्ति के लिए आमतौर पर कम से कम रैखिक समय की आवश्यकता होती है। मैं इनमें से कुछ एल्गोरिदम के बारे में नीचे चर्चा करता हूं।
कुछ उपयोगी कार्य
yLmax(y)ln∑iexp(yi)maxiyimaxiyi ≤ Lmax(y) ≤ maxiyi+lnm.
Lmin(y)−Lmax(−y)miniyi
इस प्रकार की सुविधा के लिए, हम के ग्रेडिएंट को दर्शाने के लिए का उपयोग करते हैं । हम के ग्रेडिएंट को दर्शाने के लिए का उपयोग करते हैं ।g(y)∇Lmin(y)G(y)∇Lmax(y)
स्पष्ट रूप से, is
जबकि is ।gi(y)exp(−yi)/∑i′exp(−yi′)Gi(y)exp(yi)/∑i′exp(yi′)
Lmin और Lmax निम्नलिखित अर्थों में सुचारू हैं : किसी भी वैक्टर और ,
और
d∈[0,ε]ny∈RnLmin(y+d) ≥ Lmin(y) + (1−O(ε))d⋅g(y)
Lmax(y+d) ≤ Lmax(y) + (1+O(ε))d⋅G(y).
ध्यान दें कि दोनों ग्रेडिएंट्स का 1-मान 1: बराबर है
। (हम पूरे उपयोग करते हैं -1-मान को निरूपित करने के लिए।)|G(y)|=|g(y)|=1|z|
यह भी ध्यान दें कि, एक मैट्रिक्स के लिए , समारोह की ढाल के संबंध में
है (श्रृंखला शासन द्वारा) । अधिक स्पष्ट रूप से, सम्मान के साथ समारोह का आंशिक व्युत्पन्न को
है । इसी तरह, Lmax का आंशिक व्युत्पन्न
सम्मान के साथ करने के लिए है ।Ax↦Lmin(Ax)x(g(Ax))TAxj∑iAijexp(−Aix)/∑iexp(−Aix)(Ax)xj∑iAijexp(Aix)/∑iexp(Aix)
आंशिक सेट कवर
सेट-कवर आवृत्ति को ठीक करें। आइए तत्व को निर्धारित करें / घटना मैट्रिक्स सेट करें। इस प्रकार, यदि , और 0, और वह सीमा है जिसमें आंशिक कवर तत्व को कवर करता है ।AAes=1e∈sAexxe
एल.पी. । दिए गए , एल्गोरिथ्म हैmin{|x|:Ax≥1;x≥0}ε∈(0,1)
- सभी प्रारंभ करें । चलो । xs=0N=log(n)/ε
दोहराएं जब तक : mineAex≥N
2.1। चुनें lmin का आंशिक व्युत्पन्न को अधिकतम wrt ।
(स्पष्ट रूप से, चुनें अधिकतम ।) s(Ax)xs
s∑e∈sexp(−∑s′∋exs′)
2.2। को बढ़ाएं । xsε
वापसी ।x/mineAex
एल्गोरिथ्म एक में अनुमानित समाधान देता है पुनरावृत्तियों, जहां तत्वों की संख्या है और इष्टतम है? आंशिक सेट कवर (तुच्छ रूप से )। (एक समान एल्गोरिथ्म का उल्लेख चंद्रा के कागज में दिखाई देता है । वर्टेक्स कवर निश्चित रूप से एक विशेष मामला है।)(1+O(ε))O(|x∗|log(n)/ε2)nx∗|x∗|≤n
( टिप्पणी: ध्यान दें कि बाउंड्रीज बाउंड सेट की संख्या पर निर्भर नहीं करता है, बस तत्वों की संख्या है। इस प्रकार, एल्गोरिथ्म को एक निहित परिभाषित सेट सिस्टम के साथ इस्तेमाल किया जा सकता है, जब तक कि तत्वों पर भार दिया जाता है, कोई कुशलता से कर सकता है। अधिकतम वजन (या निकट-अधिकतम) कुल वजन का एक सेट खोजें। इस तरह का एक प्रकार का अलंकार है, जो अंडाकार एल्गोरिथ्म को दोहरी समस्या पर लागू करने के लिए आवश्यक जुदाई के लिए है। सेट की पैकिंग जैसी समस्याओं के लिए, आपको एक दाना चाहिए। तत्वों पर दिए गए भार, कुल वजन को कम करने वाला एक सेट लौटाता है । बहु-वस्तु प्रवाह जैसी समस्याओं के लिए, उदाहरण के लिए, आपको कुछ दिए गए किनारे के भार के योग को कम करने के लिए एक मार्ग खोजने की आवश्यकता होगी।)
यहां प्रदर्शन गारंटी के प्रमाण का एक स्केच है। प्रत्येक पुनरावृत्ति में, आंशिक व्युत्पन्न wrt चुना हुआ
कम से कम, जहां इष्टतम आंशिक सेट कवर है।s1/|x∗|x∗
(क्यों देखने के लिए, याद है कि lmin की ढाल के संबंध में है अगर हम एक सेट का चयन करने के लिए गए थे। वितरण से यादृच्छिक पर संबंध में आंशिक व्युत्पन्न का अपेक्षित मूल्य
इस प्रकार होगा | चूंकि , यह कम से कम है । के बाद से , इस कम से कम है । कुछ इस प्रकार, वहाँ मौजूद होना चाहिए कम से कम आंशिक व्युत्पन्न दे रही है | चूंकि एल्गोरिथ्म चुनता है(Ax)x(g(Ax))TAs′x∗/|x∗|xs′(g(Ax))TAx∗/|x∗|Ax∗≥1|g(Ax)|/|x∗||g(Ax)|=11/|x∗|s1/|x∗|xs
आंशिक व्युत्पन्न को अधिकतम करने के लिए प्रत्येक पुनरावृत्ति में , यह कम से कम का आंशिक व्युत्पन्न प्राप्त करता है।)1/|x∗|
फिर, चरण आकार को केवल इतना छोटा चुना जाता है कि का कोई समन्वय से अधिक न बढ़े । इस प्रकार, Lmin की चिकनाई के कारण,
को बढ़ाने से कम से कम बढ़ जाता है
।εAxεxsxs+εLmin(Ax)(1−O(ε))ε/|x∗|
इस तरह, एल्गोरिथ्म अपरिवर्तनीय बनाए रखता है
(ध्यान दें कि Lmin बराबर ।)Lmin(Ax)≥(1−O(ε))|x|/|x∗|−lnn.
(0¯¯¯)lnn
समाप्ति के समय, इनवेरिएंट में, टर्म बार-बार बाईं ओर होता है, इसलिए गणना के द्वारा एक को। एल्गोरिथ्म की अंतिम पंक्ति में सामान्यीकरण के बाद, इसका तात्पर्य है।lnnO(ε)mineAex≥(1−O(ε))|x|/|x∗||x|≤(1+O(ε))|x∗|
एफडब्ल्यूआईडब्ल्यू, आक्रमणकारी साबित करने में शामिल असमानताएं अनिवार्य रूप से वही हैं जो चेर्नॉफ बाध्य साबित करने में शामिल हैं। (वास्तव में, इस एल्गोरिथ्म एक यादृच्छिक-गोलाई योजना को सशर्त संभावनाओं की विधि लगाने से प्राप्त किया जा सकता है कि बार-बार वितरण से नमूने सेट
(प्रतिस्थापन के साथ), बढ़ती प्रत्येक नमूना सेट के लिए । इसका व्युत्पन्न एल्गोरिथ्म देता है: अंतर्निहित अपरिवर्तनीय बस यह है कि निराशावादी अनुमानक नीचे रहता है। निराशावादी अनुमानक में घातांक दंड गोलाई योजना के विश्लेषण में बंधे चेरनॉफ का उपयोग करने से आता है। इस मूल विचार को आगे समझाया गया है। में कागज चंद्र उल्लेख किया ।)x∗/|x∗|xss
आंशिक भारित सेट कवर (और सामान्य आंशिक आवरण)
भारित सेट कवर जैसी समस्याओं को कुशलतापूर्वक संभालने के लिए , हम गैर-समान वेतन वृद्धि ( गर्ग और कोनेमैन के कारण एक विचार ) का उपयोग करने के लिए एल्गोरिदम को संशोधित करते हैं ।
एल.पी. है , जहां तत्वों से अधिक श्रृंखला, गैर सेट पर होती है, और सभी चर रहे हैं -नकारात्मक। एल्गोरिथ्म को पेश करने के लिए, पहले समस्या को सामान्य कवरिंग समस्या के रूप में फिर से लिखें। आज्ञा दें कि लिए और अन्यथा। तब (चर के परिवर्तन के साथ, द्वारा प्रत्येक को ), LP , जिसे हम सामान्य कवरिंग LP के रूप में देख सकते हैं। यहाँ एल्गोरिथ्म है:min{c⋅x:(∀e)∑s∋exs≥1}esAes=1/cse∈sAes=0xscsmin{|x|:Ax≥1;x≥0}
सभी प्रारंभ करें । चलो ।xs=0N=log(n)/ε
तब तक दोहराएं जब तक कि सभी कवरिंग बाधाओं को हटा नहीं दिया गया हो:
2.1। चुनें lmin का आंशिक व्युत्पन्न को अधिकतम wrt ।
(स्पष्ट रूप से, चुनें अधिकतम ।)s(Ax)xs
s∑e∈sexp(−∑s′∋exs′)/cs
2.2। को बढ़ाएं , जहां को अधिकतम रूप से चुना जाता है, जैसे कि हर शेष कवरिंग बाधा , में वृद्धि अधिकांश ।xsδδeAe⋅xε
2.3 सभी हटाएं कवर की कमी है कि इस तरह ।eAe⋅x≥N
वापसी ।x/mineAe⋅x
एल्गोरिथ्म पुनरावृत्तियों में एक -approximate समाधान लौटाता है , जहां को कवर करने की संख्या में कमी है। (प्रत्येक पुनरावृत्ति कुछ शेष को ; यह नष्ट होने से पहले केवल एक बाधा के लिए बार ही हो सकता है ।) शुद्धता का प्रमाण अनिवार्य रूप से सेट कवर के समान ही अपरिवर्तनीय है।(1+O(ε))O(nlog(n)/ε2)nAexεN/ε
भारित वर्टेक्स कवर एक विशेष मामला है।
अधिकतम भिन्नात्मक द्विदलीय मिलान
ग्राफ को देखते हुए समस्या के लिए प्राकृतिक LP ।G=(U,W,E)max{|x|:∀v.∑e∋vxe≤1}
मैट्रिक्स प्रतिनिधित्व में, यह एक पैकिंग एलपी
गुणांक के साथ ( अगर )। इस तरह की समस्याओं के लिए गैर-समान वेतन वृद्धि की आवश्यकता नहीं होती है, इसलिए अनलिमिटेड सेट कवर एल्गोरिथ्म (लेकिन पैकिंग के लिए) के अनुरूप एक सरल एल्गोरिथ्म होगा:max{|x|:Ax≤1;x≥0}Ave=1v∈e
- सभी प्रारंभ करें । चलो ।xe=0N=log(n)/ε
जबकि :Ax<N
2.1। Lmax wrt के आंशिक व्युत्पन्न को कम करने के लिए चुनें ।
(स्पष्ट रूप से, को ।)e(Ax)xe
e∑v∈eexp(∑e′∋vxe′)
2.2। को बढ़ाएं । xeε
वापसी ।x/maxvAvx
एल्गोरिथ्म पुनरावृत्तियों में -approximate समाधान देता है । (ऐसा इसलिए है क्योंकि प्रत्येक पुनरावृत्ति बढ़ती है by , और अंत में, सामान्य होने से पहले ।)(1−O(ε))O(nlog(n)/ε2)|x|ε|x|=O(Nn)
बस मज़े के लिए, यहाँ परफेक्ट बिपर्टाइट मैचिंग के लिए एक जिज्ञासु वैकल्पिक एल्गोरिदम है। याद है कि । चलो।G=(U,W,E)n=|U|=|W|
- सभी प्रारंभ करें । आज्ञा देना । xe=0N=4ln(n)/ε
दोहराएँ बार:nN
2.1। चुनें से यादृच्छिक पर समान रूप से ।
2.2। ऐसे चुनें कम करके ।
2.3। द्वारा बढ़ाएँ । uU
w(u,w)∈E∑e∋wxe
xuwε
वापसी ।x/N
यदि का पूर्ण मिलान होता है, तो एल्गोरिथ्म एक लौटाता है जैसे कि , और, उच्च संभावना के साथ, सभी कोने , , और सभी कोने में , । यदि आप प्रमाण के विवरण में रुचि रखते हैं, तो कृपया पूछें ...Gx|x|=nu∈U1−O(ε)≤∑e∋uxe≤1+O(ε)w∈W∑e∋wxe≤1+O(ε)
मिश्रित पैकिंग और कवरिंग
आपने एक मिश्रित पैकिंग और कवरिंग समस्या के उदाहरण के लिए द्विदलीय मिलान के बारे में पूछा हो सकता है , अर्थात फॉर्म
ऐसी समस्याओं के लिए एक एल्गोरिथ्म है। सबसे पहले, सामान्य करें ताकि और ।∃x? Px≤p;Cx≥c;x≥0.
p=1¯¯¯c=1¯¯¯
आज्ञा देना की संख्या की कमी (पंक्तियों में प्लस पंक्तियों में )।mPC
- सभी प्रारंभ करें । चलो ।xj=0N=2ln(m)/ε
जबकि :Px<N
2.1। चुनें ताकि Lmax का आंशिक व्युत्पन्न के संबंध में ज्यादा से ज्यादा lmin का आंशिक व्युत्पन्न है के संबंध में । (स्पष्ट रूप से, चुनें जैसे किj(Px)xj(Cx)xjj∑iPijexp(Pix)∑iexp(Pix)≤∑iCijexp(−Cix)∑iexp(−Cix).)
2.2। को बढ़ाएं , जहां को अधिकतम चुना जाता है जैसे कि कोई बाधा या शेष बाधा से अधिक नहीं बढ़ती है ।xjδδPixCixε
2.3। सभी को कवर बाधाओं को हटाना ऐसा है कि ।iCix≥N
वापसी ।x/maxiPix
दी गई समस्या को संभव मानते हुए, एल्गोरिथ्म एक लौटाता है जैसे कि
और । पुनरावृत्तियों की संख्या , क्योंकि प्रत्येक पुनरावृत्ति में द्वारा कुछ बाधाएँ बढ़ जाती हैं , और यह अधिकांश पर प्रत्येक बाधा के लिए हो सकता है ।xPx≤1Cx≥1−O(ε)O(mln(m)/ε2)εN
शुद्धता का प्रमाण अपरिवर्तनीय
अपरिवर्तनीय का तात्पर्य
समाप्ति पर बाईं ओर प्रदर्शन की गारंटी साबित करते हुए, ।Lmax(Px)≤2ln(m)+(1+O(ε))Lmin(Cx).
maxPx≤2ln(m)+(1+O(ε))minCx.
Ω(log(m)/ε)
चरण 2.1 में, वांछित तब तक मौजूद होना चाहिए जब तक कि मूल समस्या संभव न हो। (यह इसलिए है, क्योंकि किसी भी व्यवहार्य , और किसी भी , अगर हम वितरण से एक यादृच्छिक चुनना चाहते थे, तो Lmax के आंशिक व्युत्पन्न का अपेक्षित मूल्य। संबंध
में अधिकतम (सेट कवर के पिछले प्रमाण देखें)। इसी तरह, संबंध में Lmin के आंशिक व्युत्पन्न का अपेक्षित मान।
कम से कम इस प्रकार, एकj x∗xj′x∗/|x∗|(Px)xj′1/|x∗|(Cx)xj′1/|x∗|jऐसे कि x_ संबंध में Lax
का आंशिक व्युत्पन्न, Lmin अधिकांश आंशिक व्युत्पन्न में है ।)(Px)xj′(Cx)
तब प्रत्येक पुनरावृत्ति में इनवेरिएंट बनाए रखा जाता है, क्योंकि और की पसंद से , और Lmin और Lmax की चिकनाई, को
बढ़ाकर Lmax
को सबसे अधिक
समय तक बढ़ा देता है Lmin में वृद्धि ।xjδxjxj+δ(Px)1+O(ε)(Cx)
सीखना (विशेषज्ञों का अनुसरण करना)
इस संबंध को समझने के लिए एक संदर्भ
एडाप्टिव गेम है , जो फ्रंड और शेपायर द्वारा गुणा वज़न का उपयोग करके खेला जाता है। तकनीकी विचार देने के लिए यहां एक त्वरित सारांश दिया गया है।
निम्नलिखित दोहराया खेल पर विचार करें। प्रत्येक दौर में : t
- आप ( तथाकथित विशेषज्ञों ) पर प्रायिकता वितरण चुनते हैं । pt[n]n
- जानने के बाद, विरोधी एक भुगतान वेक्टर का चयन करता है । ptat∈[0,1]n
- आप राउंड के लिए अदायगी प्राप्त करते हैं। pt⋅at
कुछ राउंड्स के बाद खेल रुक गया। अपने लक्ष्य किसी एक विशेषज्ञ (यानी, शुद्ध रणनीति) की तुलना में अपने अफसोस कम करने के लिए है । यही है, आपका लक्ष्य कम से कम ।i(maxi∑tati)−∑tpt⋅at
किसी भी ठीक करें । वेक्टर निरूपित करें , अर्थात,
, वेक्टर का भुगतान समय-समय पर वैक्टर के समय तक । स्मरण करो कि Lmax का ढाल है ।ε>0ytε∑s≤tasεtG(y)(y)
यहां हम मूल रणनीति का विश्लेषण करेंगे:
गोल , टू ।tptG(yt−1)
निरीक्षण से, यह आपको राउंड में का भुगतान करता ।at⋅G(yt−1)t
,
की चिकनाई गुण के कारण
अर्थात्, प्रत्येक दौर में, आपके भुगतान से अधिक बार से अधिक नहीं बढ़ सकता है । चूँकि , यह इस बात को बनाए रखता है कि
आपके कुल भुगतान समय में सबसे अधिक है , प्लस दूसरी ओर, सबसे अच्छा विशेषज्ञ की तुलना में आपके अफसोस।
है , यानी,FLmax(yt)≤Lmax(yt−1)+(1+O(ε))εat⋅G(yt−1).
Lmax(yt)ε(1+O(ε))Lmax(0¯¯¯)=lnnLmax(yt)ε(1+O(ε)ln(n)imaxi∑tatiε−1maxiyti, जो अधिकांश ।ε−1Lmax(yt)
इस प्रकार, आपका पछतावा अधिकांश , प्लस आपके कुल भुगतान का होता है।ε−1ln(n)O(ε)
टिप्पणी: मुझे लगता है, जैसा कि फ्रायंड और शेपायर बताते हैं, एक "बूस्टिंग" एल्गोरिथम (सीखने के सिद्धांत में) भी इस विश्लेषण में निहित है। अधिक जानकारी के लिए उनका पेपर देखें।
कुल अदायगी न्यूनतम करना
आप सेटिंग के लिए एक समान रणनीति प्राप्त कर सकते हैं, जहां लक्ष्य अधिकतम भुगतान के बजाय, न्यूनतम करना है । आपका पछतावा, जिसे आप अभी भी कम करना चाहते हैं, is । उस स्थिति में, संबंधित रणनीति का ग्रेडिएंट होने के लिए को चुनना है । इस कार्यनीति के साथ आपका पछतावा पुन: अधिकांश
plus आपके कुल भुगतान का होता है।∑tpt⋅at−miniatiptLmin(yt)ε−1lnnO(ε)
Lagrangian- विश्राम एल्गोरिदम के लिए कनेक्शन
Lagrangian- रिलैक्सिंग एल्गोरिदम से कनेक्शन देखने के लिए, सेट-कवर इंस्टेंस को ठीक करें। खेल के उत्तरार्द्ध प्रकार, जहां विशेषज्ञों के तत्वों अनुरूप (कम से कम पैसे मिलते हैं के लक्ष्य के साथ) पर विचार करें अपने सेट प्रणाली की। प्रत्येक दौर में, ऊपर के रूप
में Lmin की प्रवणता होने के लिए प्रायिकता वितरण का चयन करें और विरोधी को poff वेक्टर रूप में कार्य के रूप में निम्नानुसार चुनें :
सेट अधिकतम , तो चलो यदि , और अन्यथा।ept(yt)atptst∑e∈spteate=1e∈state=0
सही स्टॉपिंग कंडीशन (नीचे चर्चा की गई) को देखते हुए, यह प्रक्रिया आपको शुरू में चर्चा की गई सेट-कवर एल्गोरिथ्म बिल्कुल प्रदान करती है।
एल्गोरिथ्म की प्रदर्शन गारंटी निम्नानुसार खेद बाउंड से होती है। चलो बार विरोधी सेट चुना की संख्या हो खेलने के दौरान। आज्ञा देना इष्टतम आंशिक सेट कवर हो। Letखेले जाने वाले राउंड की संख्या हो। अफसोस बाध्यता का तात्पर्य
Xssx∗T=|Xs|∑tat⋅pt≤ε−1ln(m)+mine∑tate.
की परिभाषा का उपयोग करते हुए , th अदायगी ( बाईं ओर राशि में th शब्द) बराबर होती है । इस भुगतान को कम करने के लिए विरोधी ने को चुना । यदि विरोधी ने इसके बजाय वितरण से यादृच्छिक रूप से को चुना है की उम्मीद
(ऊपर हम सभी लिए उस करते हैं , और ) चूंकि प्रत्येक भुगतान कम से कम है।attt∑e∈stpteststx∗/|x∗|∑sx∗s|x∗|∑e∈spte = 1|x∗|∑epte∑s∋ex∗s ≥ 1|x∗|∑epte = 1|x∗|.
∑s∋ex∗s≥1e|pt|=11/|x∗|पछतावा होने का तात्पर्य
की परिभाषा से , हमारे पास (प्रत्येक राउंड एक सेट चुनता है), और ,
हम उस प्रक्रिया को रोक देते हैं जब , तो फिर (शब्दों को पुन: व्यवस्थित करना)
अर्थात, को सामान्य करने से अधिकतम आकार का एक भिन्नात्मक सेट कवर मिलता है समय इष्टतम।T|x∗|≤ε−1ln(m)+mine∑tate.
X|X|=T∑tate=∑e[e∈st]=∑s∋eXs|X||x∗|≤ε−1ln(m)+mine∑s∋eXs.
mine∑s∋eXs=Ω(ε−2lnm)|X|mine∑s∋eXs ≤ (1+O(ε)|x∗|.
X(1+O(ε))
टिप्पणी: एक अर्थ में, यह शिक्षण सिद्धांत व्याख्या एल्गोरिथम व्याख्या को सामान्य करता है। हालांकि, दक्षता के लिए आवश्यक कुछ एल्गोरिदम तकनीक (जैसे गैर-समान वेतन वृद्धि और संतुष्ट कवरिंग बाधाओं को छोड़ना) स्वाभाविक रूप से सीखने के सिद्धांत को स्थापित करने में सक्षम नहीं लगती हैं। इसी तरह, मिश्रित पैकिंग और एलपी को कवर करने के लिए एल्गोरिदम
(जैसे ये ) सीखने-सिद्धांत सेटिंग में प्राकृतिक एनालॉग नहीं लगते हैं।