ऑनलाइन उत्तल अनुकूलन में आंतरिक अफसोस


19

Zinkevich की "ऑनलाइन उत्तल अनुकूलन" ( http://www.cs.cmu.edu/~maz/publications/ICML03.pdf ) एक रैखिक सेटिंग्स से उत्तल सेटिंग में "अफसोस कम करने" सीखने के एल्गोरिदम को सामान्य करता है और अच्छा "बाहरी अफसोस" देता है । क्या आंतरिक अफसोस के लिए समान सामान्यीकरण है? (मुझे पूरी तरह से यकीन नहीं है कि वास्तव में इसका क्या मतलब होगा।)


क्या प्रश्न में आंतरिक पछतावा का संक्षिप्त विवरण जोड़ना संभव है?
मोरिट्ज़

आंतरिक अफसोस सेट करने वाले सामान्य "विशेषज्ञों" का मतलब होगा कि पूर्वव्यापी में आप एक कार्रवाई को दूसरे के साथ, पूरे इतिहास में लगातार स्विच नहीं करना चाहेंगे। ब्लम-मंसूर पेपर आंतरिक बनाम बाहरी अफसोस के लिए संभवतः सबसे अच्छा संदर्भ है: jmlr.csail.mit.edu/papers/volume8/blum07a/blum07a.pdf
नोम

जवाबों:


9

गॉर्डन, ग्रीनवल्ड और मार्क्स http://portal.acm.org/citation.cfm?id=1390202 द्वारा "नो-सॉरी सीखने में उत्तल खेल" का प्रयास करें । इसका अमूर्त लगता है जैसे यह शायद आपके प्रश्न का उत्तर देता है, या कम से कम उस प्रश्न का उत्तर देने वाला कोई भी व्यक्ति उस कागज का हवाला देगा या उद्धृत किया जाएगा।


0

यह एव्रीम ब्लम पेपर बाहरी और आंतरिक अफसोस के बीच संबंध को इंगित करता है। इसके सार के अनुसार, एक्सटर्ना पछतावा एक उपाय है कि एल्गोरिथ्म सबसे अच्छी निश्चित कार्रवाई की तुलना में कितना बुरा है, जबकि आंतरिक पछतावा उस विधि की सर्वोत्तम भिन्नता की तुलना करता है (आउटपुट का सर्वोत्तम निश्चित क्रमांकन, जैसे कि रिपोर्टिंग ए कक्षा जब भी मूल एल्गोरिथ्म की रिपोर्ट की जाती है। वर्ग बी)।


1
ब्लम-मंसूर पेपर "ऑनलाइन उत्तल अनुकूलन" सेटिंग में नहीं है, बल्कि रैखिक "विशेषज्ञों" सेटिंग में है। मेरा सवाल यह है कि क्या कुछ समान है, या कुछ अन्य प्रत्यक्ष आंतरिक अफसोस एल्गोरिथ्म उत्तल सेटिंग में लागू किया जा सकता है।
नोम
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.