संक्षिप्तता के लिए एलपी को दो-खिलाड़ी शून्य-सम गेम को हल करने के लिए विचार करें जहां प्रत्येक खिलाड़ी के पास क्रियाएं हैं। मान लीजिए कि भुगतान मैट्रिक्स की प्रत्येक प्रविष्टि निरपेक्ष मूल्य में अधिकतम 1 पर है। सादगी के लिए आइए कोई भी अनुमान न लगाएं।
मान लीजिए कि रनटाइम इस गेम के मूल्य को अनुमानित करने के लिए उपलब्ध है।
इस मान को अनुमानित करने के लिए एक तकनीक गुणक अद्यतन विधि है (इस संदर्भ में कोई पछतावा सीखने के रूप में जाना जाता है)। यह की एक त्रुटि देता है , जहां लॉग कारकों को छुपाता है।
मुझे नहीं पता कि सबसे अच्छी ज्ञात आंतरिक बिंदु विधि के लिए त्रुटि परिदृश्य कैसा दिखता है, लेकिन मैं अनुमान लगा रहा हूं कि त्रुटि कुछ ऐसी है जैसे ।
गुणक अद्यतन विधियाँ त्रुटि देती हैं जो में एक व्युत्क्रम बहुपद है । आंतरिक बिंदु विधियां त्रुटि देती हैं जो में तेजी से छोटी होती हैं । इसलिए दोनों में से सबसे अच्छी त्रुटि धीरे-धीरे कुछ समय के लिए कम हो जाती है जब तक कि आंतरिक बिंदु पकड़ नहीं लेता है, जिसके बाद त्रुटि अचानक एक चट्टान से गिर जाती है। मेरी वृत्ति इस तरह का व्यवहार करने वाले सर्वोत्तम संभव समय / त्रुटि ट्रेडऑफ़ के खिलाफ हैं।
मेरा सवाल :
क्या अनुमानित लीनियर प्रोग्रामिंग के लिए एक एल्गोरिथ्म है जो समय के कोने / त्रुटि ट्रेडऑफ़ वक्र को सुचारू करता है? यही है, एक एल्गोरिथ्म जो उपलब्ध समय पैरामीटर के किसी भी मूल्य के लिए कम से कम और साथ ही दोनों में से सबसे अच्छा करता है और इसमें अपेक्षाकृत चिकनी समय / त्रुटि ट्रेडऑफ़ है। आंतरिक-बिंदु और गुणात्मक अद्यतन तकनीकों को दो से बेहतर लेने की तुलना में संयोजन करने का एक अधिक बुद्धिमान तरीका एक ऐसा एल्गोरिथ्म प्राप्त करने का एक संभावित तरीका है।
संदर्भ :
सामान्य रूप में गुणक अद्यतन:
http://www.cs.princeton.edu/~arora/pubs/MWsurvey.pdf
शून्य-राशि के खेल के लिए गुणक अद्यतन:
http://dx.doi.org/10.1016/0167-6377(95)00032-0
कवर / पैकिंग एलपी के लिए गुणक अद्यतन:
http://arxiv.org/PS_cache/arxiv/pdf/0801/0801.1987v1.pdf
मूल आंतरिक बिंदु कागज:
http://math.stanford.edu/~lekheng/courses/302/classics/karmarkar.pdf
एक लागू गणित के नजरिए से आंतरिक-बिंदु:
बर्थसेकस नॉनलाइनियर प्रोग्रामिंग , खंड 4.1.1।