संख्यात्मक अनुकूलन विधियों का परीक्षण: रेनब्रुक बनाम वास्तविक परीक्षण कार्य


15

बिना व्युत्पन्न ऑप्टिमाइज़र के दो मुख्य प्रकार के परीक्षण कार्य प्रतीत होते हैं:

  • स्टार्ट-पॉइंट के साथ रोसेनब्रॉक फंक्शन ff जैसे वन-लाइनर्स
  • एक प्रक्षेपक के साथ वास्तविक डेटा बिंदुओं के सेट

क्या 10d रोसेनब्रोक की किसी भी वास्तविक 10 डी समस्याओं के साथ तुलना करना संभव है?
एक व्यक्ति विभिन्न तरीकों से तुलना कर सकता है: स्थानीय मिनीमा की संरचना का वर्णन करें,
या रोसेनब्रोक पर और कुछ वास्तविक समस्याओं पर ऑप्टिमाइज़र एबीसी चलाएं;
लेकिन ये दोनों मुश्किल लगते हैं।

(हो सकता है कि सिद्धांतकार और प्रयोग करने वाले सिर्फ दो अलग-अलग संस्कृतियाँ हैं, इसलिए मैं एक चिरेरा के लिए पूछ रहा हूँ?)

यह सभी देखें:


(सितम्बर 2014 में जोड़ा गया):
BOBYQA अमल SBPLX से: भूखंड नीचे 8d में 14 परीक्षण कार्यों पर 3 डीएफओ एल्गोरिदम 10 यादृच्छिक शुरू अंक से तुलना NLOpt
14 एन आयामी परीक्षण काम करता है, पायथन के तहत gist.github इस से मैटलैब ए द्वारा प्रत्येक फ़ंक्शन के बाउंडिंग बॉक्स में Hedar × 10 वर्दी-यादृच्छिक प्रारंभ बिंदु।×
×

उदाहरण के लिए, Ackley पर, शीर्ष पंक्ति बताती है कि SBPLX सबसे अच्छा है और PRAXIS भयानक है; Schwefel पर, नीचे दायां पैनल 5 वें रैंडम स्टार्ट पॉइंट पर SBPLX को न्यूनतम दिखाता है।

कुल मिलाकर, 13 परीक्षाओं में से 7 पर BOBYQA, 5 पर PRAXIS, और SBPLX (~ Nelder-Mead with restarts) सबसे अच्छा है। YMMV! विशेष रूप से, जॉनसन कहते हैं, "मैं आपको सलाह दूंगा कि वैश्विक अनुकूलन में फ़ंक्शन-वैल्यू (फूटोल) या पैरामीटर सहिष्णुता (xtol) का उपयोग न करें।"

निष्कर्ष: अपना सारा पैसा एक घोड़े पर, या एक परीक्षण कार्य पर न लगाएं।

यहां छवि विवरण दर्ज करें

जवाबों:


13

रोसेनब्रॉक जैसे सरल कार्यों का उपयोग नव लिखित एल्गोरिदम को डीबग और प्री-टेस्ट करने के लिए किया जाता है: वे लागू करने और निष्पादित करने के लिए तेज हैं, और एक विधि जो मानक समस्याओं को अच्छी तरह से हल नहीं कर सकती है वह वास्तविक जीवन की समस्याओं पर अच्छी तरह से काम करने की संभावना नहीं है।

महंगे कार्यों के लिए व्युत्पन्न-मुक्त तरीकों की हाल ही में तुलना के लिए, व्युत्पन्न-मुक्त अनुकूलन देखें: एल्गोरिदम की समीक्षा और सॉफ्टवेयर कार्यान्वयन की तुलना । LM Rios, NV साहिनिडिस - doi 10.1007 / s10898-012-9951-y जर्नल ऑफ़ ग्लोबल ऑप्टिमाइज़ेशन, 2012. (साथ में वेबपेज भी देखें: http://archimedes.cheme.cmu.su/?q=dfocomp )


प्रो। न्यूमैयर, क्या आप कुछ वास्तविक समस्याओं, सबूतों की ओर इशारा कर सकते हैं, "एक विधि जो मानक समस्याओं को अच्छी तरह से हल नहीं कर सकती है वह वास्तविक जीवन की समस्याओं पर अच्छी तरह से काम करने की संभावना नहीं है"? मुझे एहसास है कि यह आसान नहीं है। (मैं आपकी टिप्पणियों पर हूकर में दिलचस्पी लेता हूं।) इसके अलावा, आपके लिंक से सी मॉडल पर एक त्वरित रूप से दिखाता है कि प्रिंसटन को एलपीजीएल की आवश्यकता है, और source_convexmodels * .c सभी को एक लापता है ";" तुच्छ लेकिन - fscanf () के बाद
Denis

@ डेनिस: स्वचालित अनुकूलन के शुरुआती दिनों से रोसेनब्रोक स्टेम जैसी समस्याएं, जहां लोग साधारण प्रतिनिधि उदाहरणों में विशिष्ट कठिनाइयों को अलग कर देते हैं जिनका वास्तविक जीवन की समस्याओं के संख्यात्मक जटिलताओं के बिना अध्ययन किया जा सकता है। इस प्रकार वे वास्तव में कृत्रिम नहीं हैं, लेकिन वास्तविक कठिनाइयों के सरलीकृत मॉडल हैं। उदाहरण के लिए, रोसेनब्रोक मजबूत गैर-हीनता और हल्के बीमार स्थिति के संयुक्त प्रभाव को दर्शाता है।
अर्नोल्ड न्यूमैयर

AMPL साइट ampl.com , AMPL के लिए एक निःशुल्क छात्र संस्करण प्रदान करता है।
अर्नोल्ड न्यूमैयर

7

रोसेनब्रॉक फ़ंक्शन जैसे सिंथेटिक टेस्टकेस का लाभ यह है कि इसकी तुलना करने के लिए मौजूदा साहित्य है, और समुदाय में यह समझ है कि इस तरह के टेस्टकेस पर अच्छे तरीके कैसे व्यवहार करते हैं। अगर हर कोई अपने स्वयं के टेस्टकेस का उपयोग करता है, तो यह सर्वसम्मति के लिए बहुत कठिन होगा कि कौन से तरीके काम करते हैं और कौन से नहीं।


1

(मुझे आशा है कि इस चर्चा के अंत में मेरे व्यवहार से कोई आपत्ति नहीं है। मैं यहां नया हूं, इसलिए कृपया मुझे बताएं कि क्या मैंने स्थानांतरित किया है!)

विकासवादी एल्गोरिदम के लिए परीक्षण कार्य अब और अधिक जटिल हैं, जैसे कि वे 2 या 3 साल पहले भी थे, जैसा कि विकासवादी गणना पर कांग्रेस (हाल ही में) 2015 कांग्रेस जैसे सम्मेलनों में उपयोग किए गए सूट द्वारा देखा जा सकता है। देख:

http://www.cec2015.org/

ये परीक्षण सूट अब चर के बीच कई गैर-रेखीय बातचीत के साथ कार्य शामिल करते हैं। चर की संख्या 1000 तक हो सकती है, और मुझे लगता है कि निकट भविष्य में बढ़ सकता है।

एक और बहुत हालिया नवाचार एक "ब्लैक बॉक्स अनुकूलन प्रतियोगिता" है। देखें: http://bbcomp.ini.rub.de/

एक एल्गोरिथ्म एक बिंदु x के लिए मान f (x) को क्वेरी कर सकता है, लेकिन यह ग्रेडिएंट जानकारी प्राप्त नहीं करता है, और विशेष रूप से यह उद्देश्य फ़ंक्शन के विश्लेषणात्मक रूप पर कोई धारणा नहीं बना सकता है।

एक मायने में, यह एक "वास्तविक समस्या" के रूप में जिसे आपने एक संगठित उद्देश्यपरक सेटिंग के रूप में संदर्भित किया है, के करीब हो सकता है।


1) "कोई आपत्ति नहीं": इसके विपरीत, आपके अच्छे लिंक का स्वागत है! 2) वहाँ किसी भी अच्छे भूखंड? विधियाँ और समस्याएं दोनों ही भग्न हैं, इसलिए किसी के लिए भी उनकी तरह एक समस्या खोजना कठिन और कठिन हो रहा है। विशेष रूप से, क्या आप समय श्रृंखला पूर्वानुमान के लिए तरीकों के बारे में जानते होंगे ?
Denis

डायनामिक मल्टी-ऑब्जेक्टिव ऑप्टिमाइज़ेशन पर सीईसी 2015 प्रतियोगिता के उद्देश्य कार्यों को यहां देखा जा सकता है: sites.google.com/site/cec2015dmoocomp/competition-process/… अन्य प्रतियोगिताओं के लिए, cec2015.org पर जाएं और फिर प्रतियोगिताओं पर क्लिक करें स्वीकृत प्रतियोगिताओं पर। हर एक के अपने कार्य हैं। उनमें से कुछ पर पत्रों में प्यारे भूखंड (2 डी मामलों के लिए) हैं। GECCO सम्मेलन की प्रतियोगिताओं में पाया जा सकता है: sigevo.org/gecco-2015/competitions.html#bbc परिणाम 15 जुलाई के बाद उपलब्ध होंगे
Lysistrata

0

आपके पास दोनों दुनिया के सर्वश्रेष्ठ हो सकते हैं। NIST में न्यूनतम परिणाम के लिए समस्याओं का एक सेट है , जैसे अपेक्षित परिणाम और अनिश्चितताओं के साथ इस 10 वीं डिग्री बहुपदों को फिट करना । बेशक, यह साबित करना कि ये मूल्य वास्तविक सर्वोत्तम समाधान हैं, या अन्य स्थानीय मिनीमा का अस्तित्व और गुण एक नियंत्रित गणितीय अभिव्यक्ति की तुलना में अधिक कठिन हैं।


खैर, NIST समस्याएँ छोटी हैं (2 3 1 1 11 7 6 6 6 6 6 params)। क्या ऐसे परीक्षण सेट हैं जो "वास्तविक" और "वास्तविक" दोनों के किसी भी कोने के लिए "वास्तविक" और प्रतिलिपि प्रस्तुत करने योग्य हैं ? सी एफ एक सिमुलेशन आधारित अनुकूलन समस्याओं के लिए अनुरोध
डेनिस
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.