यादृच्छिक खोज में केवल 60 पुनरावृत्तियों के साथ 5% ऑप्टिमा के भीतर मापदंडों के संयोजन को खोजने में 95% की संभावना है। अन्य तरीकों की तुलना में यह स्थानीय ऑप्टिमा में कम नहीं है।
एलिस झेंग द्वारा दातो में इस महान ब्लॉग पोस्ट की जांच करें , विशेष रूप से अनुभाग हाइपरपरमीटर ट्यूनिंग एल्गोरिदम ।
मुझे ऐसी फिल्में पसंद हैं जहाँ दलित व्यक्ति जीतता है, और मैं मशीन लर्निंग पेपर से प्यार करता हूँ जहाँ सरल समाधान आश्चर्यजनक रूप से प्रभावी होते हैं। यह बर्गस्ट्रा और बेंगियो द्वारा "रैंडम सर्च फॉर हाइपरपरिमेट ऑप्टिमाइज़ेशन" की कहानी है। [...] यादृच्छिक खोज को पहले बहुत गंभीरता से नहीं लिया गया था। ऐसा इसलिए है क्योंकि यह सभी ग्रिड बिंदुओं पर खोज नहीं करता है, इसलिए यह संभवतः ग्रिड खोज द्वारा प्राप्त इष्टतम को हरा नहीं सकता है। लेकिन फिर बर्गस्ट्रा और बेंगियो के साथ आया। उन्होंने दिखाया कि आश्चर्यजनक रूप से कई उदाहरणों में, यादृच्छिक खोज प्रदर्शन के साथ-साथ ग्रिड खोज भी करती है। कुल मिलाकर, ग्रिड से सैंपल लिए गए 60 रैंडम पॉइंट्स काफी अच्छे लगते हैं।
दृष्टिहीनता में, परिणाम के लिए एक सरल संभाव्य स्पष्टीकरण है: किसी परिमित स्थान के साथ नमूना स्थान पर किसी भी वितरण के लिए, अधिकतम 60 यादृच्छिक प्रेक्षण 95% प्रायिकता के साथ, वास्तविक अधिकतम के शीर्ष 5% के भीतर निहित है। यह जटिल लग सकता है, लेकिन ऐसा नहीं है। वास्तविक अधिकतम के आसपास 5% अंतराल की कल्पना करें। अब कल्पना करें कि हम उसके स्थान से नमूना लेते हैं और देखते हैं कि उसमें से कोई भी उस अधिकतम भूमि के भीतर है। प्रत्येक यादृच्छिक ड्रॉ में उस अंतराल में उतरने का 5% मौका होता है, अगर हम स्वतंत्र रूप से n अंक खींचते हैं, तो संभावना है कि उनमें से सभी को वांछित अंतराल याद है
(1−0.05)n। तो संभावना है कि उनमें से कम से कम एक अंतराल को मारने में सफल होता है 1 मात्रा है। हम सफलता की कम से कम -95 संभावना चाहते हैं। हमारी ज़रूरत के हिसाब से ड्रा की संख्या जानने के लिए, समीकरण में n को हल करें:
1−(1−0.05)n>0.95
हमें मिलता है । टा-दा!n⩾60
कहानी का नैतिक है: यदि हाइपरपैरमीटर का क्लोज-टू-इष्टतम क्षेत्र ग्रिड की सतह के कम से कम 5% पर रहता है, तो 60 परीक्षणों के साथ यादृच्छिक खोज उस क्षेत्र को उच्च संभावना के साथ पाएगी।
आप अधिक से अधिक परीक्षणों के साथ उस अवसर को बेहतर बना सकते हैं।
सभी के सभी, यदि आपके पास धुन करने के लिए बहुत सारे पैरामीटर हैं, तो ग्रिड खोज संभव नहीं हो सकती है। जब मैं यादृच्छिक खोज का प्रयास करता हूं।