स्टोकेस्टिक हिल क्लाइम्बिंग पर स्टोचस्टिक हिल क्लाइम्बिंग का चुनाव कब करें?

9

स्टोचस्टिक हिल क्लाइम्बिंग आमतौर पर स्टीपेस्ट हिल क्लाइम्बिंग से भी बदतर प्रदर्शन करता है , लेकिन ऐसे कौन से मामले हैं जिनमें पूर्व बेहतर प्रदर्शन करता है?

search hill-climbing

— रोहन शर्मा
स्रोत

3

उत्तल पहाड़ी चढ़ाई एल्गोरिदम उत्तल अनुकूलन के लिए अच्छी तरह से काम करता है। हालाँकि, वास्तविक दुनिया की समस्याएं आम तौर पर गैर-उत्तल अनुकूलन प्रकार की होती हैं: कई चोटियाँ होती हैं। ऐसे मामलों में, जब यह एल्गोरिथम एक यादृच्छिक समाधान पर शुरू होता है, तो वैश्विक शिखर के बजाय स्थानीय चोटियों में से एक तक पहुंचने की संभावना अधिक होती है। सिलेक्टेड एनीलिंग जैसी सुधार एल्गोरिदम को एक स्थानीय चोटी से दूर जाने की अनुमति देकर इस मुद्दे को संशोधित करता है, और इस तरह संभावना बढ़ जाती है कि यह वैश्विक शिखर को खोज लेगा।

जाहिर है, केवल एक चोटी के साथ एक साधारण समस्या के लिए, खड़ी पहाड़ी चढ़ाई हमेशा बेहतर होती है। यदि वैश्विक शिखर पाया जाता है तो यह शुरुआती रोक का भी उपयोग कर सकता है। इसकी तुलना में, एक सिम्युलेटेड एनलिंग एल्गोरिथ्म वास्तव में एक वैश्विक शिखर से कूद जाएगा, वापस लौटकर फिर से कूद जाएगा। यह तब तक दोहराएगा जब तक कि इसका ठंडा न हो जाए या पुनरावृत्तियों की एक निश्चित संख्या पूरी हो गई हो।

वास्तविक दुनिया की समस्याएं शोर और लापता डेटा से निपटती हैं। धीमी गति से चलने वाली पहाड़ी चढ़ाई का दृष्टिकोण, जबकि धीमी, इन मुद्दों के लिए अधिक मजबूत है, और अनुकूलन दिनचर्या में सबसे तेज पहाड़ी चढ़ाई एल्गोरिथ्म की तुलना में वैश्विक शिखर पर पहुंचने की अधिक संभावना है।

उपसंहार: यह एक अच्छा प्रश्न है जो एक समाधान तैयार करते समय या विभिन्न एल्गोरिदम के बीच चयन करते समय एक निरंतर प्रश्न उठाता है: प्रदर्शन-कम्प्यूटेशनल लागत व्यापार-बंद। जैसा कि आपको संदेह हो सकता है, जवाब हमेशा होता है: यह आपके एल्गोरिथ्म की प्राथमिकताओं पर निर्भर करता है। यदि यह कुछ ऑनलाइन लर्निंग सिस्टम का हिस्सा है जो डेटा के एक बैच पर काम कर रहा है, तो एक मजबूत समय बाधा है, लेकिन कमजोर प्रदर्शन बाधा (डेटा के अगले बैच डेटा के पहले बैच द्वारा पेश किए गए गलत पूर्वाग्रह के लिए सही होगा)। दूसरी ओर, यदि हाथ में उपलब्ध संपूर्ण डेटा के साथ यह एक ऑफ़लाइन शिक्षण कार्य है, तो प्रदर्शन मुख्य बाधा है, और स्टोचस्टिक दृष्टिकोण उचित हैं।

— गतिशील स्टारडस्ट
स्रोत

2

पहले कुछ परिभाषाओं के साथ शुरू करते हैं।
हिल-क्लाइम्बिंग एक खोज एल्गोरिथ्म है जो केवल एक लूप चलाता है और लगातार बढ़ते मूल्य की दिशा में चलता है-यानी, ऊपर की ओर। लूप समाप्त हो जाता है जब यह एक चरम पर पहुंच जाता है और किसी भी पड़ोसी का उच्च मूल्य नहीं होता है।

स्टोचैस्टिक हिल क्लाइम्बिंग , हिल-क्लाइम्बिंग का एक प्रकार है, जो ऊपर की ओर जाने वाली चालों में से एक यादृच्छिक को चुनता है। चयन की संभावना अलग-अलग चाल की स्थिरता के साथ भिन्न हो सकती है। हम अच्छी तरह से ज्ञात तरीके हैं:
पहली पसंद पहाड़ी चढ़ाई: उत्तराधिकारियों को यादृच्छिक रूप से उत्पन्न करता है जब तक कि एक उत्पन्न नहीं होता है जो वर्तमान स्थिति से बेहतर है। * माना जाता है कि यदि राज्य में कई उत्तराधिकारी हैं (जैसे हजारों, या लाखों)।
रैंडम-रीस्टार्ट पहाड़ी चढ़ाई:"यदि आप सफल नहीं होते हैं, तो कोशिश करें, फिर से प्रयास करें" के दर्शन पर काम करता है।

अब आपके उत्तर के लिए। स्टोचस्टिक पहाड़ी चढ़ाई वास्तव में कई मामलों में बेहतर प्रदर्शन कर सकती है । निम्नलिखित मामले पर विचार करें। छवि राज्य-अंतरिक्ष परिदृश्य दिखाती है। चित्र में मौजूद उदाहरण को आर्टिफिशियल इंटेलिजेंस: ए मॉडर्न अप्रोच नामक पुस्तक से लिया गया है ।

मान लीजिए कि आप वर्तमान स्थिति द्वारा दिखाए गए बिंदु पर हैं। यदि आप सरल पहाड़ी चढ़ाई एल्गोरिथ्म को लागू करते हैं तो आप स्थानीय अधिकतम पर पहुंच जाएंगे और एल्गोरिथ्म समाप्त हो जाएगा। भले ही अधिक इष्टतम उद्देश्य फ़ंक्शन मूल्य के साथ राज्य मौजूद है, लेकिन एल्गोरिथ्म वहां तक पहुंचने में विफल रहता है क्योंकि यह स्थानीय अधिकतम पर अटक गया है। एल्गोरिथ्म भी फ्लैट स्थानीय मैक्सिमा पर अटक सकता है ।
बेतरतीब ढंग से शुरू होने वाली पहाड़ी चढ़ाई एक लक्ष्य अवस्था मिलने तक यादृच्छिक रूप से उत्पन्न प्रारंभिक अवस्थाओं से पहाड़ी चढ़ाई खोजों की एक श्रृंखला का संचालन करती है।

पहाड़ी चढ़ाई की सफलता राज्य-अंतरिक्ष परिदृश्य के आकार पर निर्भर करती है। मामले में केवल कुछ स्थानीय मैक्सिमा, फ्लैट प्लैटॉक्स हैं; रैंडम-रीस्टार्ट हिल क्लाइंब बहुत जल्दी एक अच्छा समाधान मिलेगा। अधिकांश वास्तविक जीवन की समस्याओं में बहुत कठिन स्थिति होती है, जो उन्हें पहाड़ी चढ़ाई एल्गोरिथ्म या इसके किसी भी संस्करण का उपयोग करने के लिए उपयुक्त नहीं बनाती है।

नोट: हिल क्लाइम्ब एल्गोरिथम का उपयोग न्यूनतम मान ज्ञात करने के लिए भी किया जा सकता है , न कि केवल अधिकतम मानों के लिए। मैंने अपने उत्तर में अधिकतम शब्द का उपयोग किया है। यदि आप न्यूनतम मूल्यों की तलाश कर रहे हैं, तो ग्राफ सहित सभी चीजें रिवर्स हो जाएंगी।

— Ugnes
स्रोत

क्या आप हमें इस बारे में अधिक जानकारी देंगे कि स्टोचस्टिक हिल क्लाइम्बिंग एल्गोरिदम वास्तव में कैसे काम करता है?

— मुस्तफा ग़दीमी

1

मैं इन अवधारणाओं के लिए भी नया हूं, लेकिन जिस तरह से मैंने इसे समझा है, स्टोचैस्टिक हिल क्लाइम्बिंग उन मामलों में बेहतर प्रदर्शन करेगा जहां गणना समय कीमती है (फिटनेस फ़ंक्शन की गणना भी शामिल है) लेकिन सर्वश्रेष्ठ तक पहुंचने के लिए वास्तव में आवश्यक नहीं है संभावित समाधान। यहां तक कि एक स्थानीय इष्टतम तक पहुंचना ठीक होगा। एक झुंड में काम करने वाले रोबोट एक उदाहरण होंगे जहां इसका इस्तेमाल किया जा सकता है।

एकमात्र अंतर जो मुझे सबसे कठिन पहाड़ी चढ़ाई में दिखाई देता है, वह यह है कि यह न केवल पड़ोसी नोड्स को खोजता है, बल्कि पड़ोसियों के उत्तराधिकारियों को भी पसंद करता है, बहुत पसंद है कि कैसे शतरंज के एल्गोरिथ्म सबसे अच्छा कदम चुनने से पहले कई और आगे बढ़ते हैं।

— नव
स्रोत

0

$S$ $S$

— अब्दुल रहमान दबबोर
स्रोत