स्टोचस्टिक हिल क्लाइम्बिंग आमतौर पर स्टीपेस्ट हिल क्लाइम्बिंग से भी बदतर प्रदर्शन करता है , लेकिन ऐसे कौन से मामले हैं जिनमें पूर्व बेहतर प्रदर्शन करता है?
स्टोचस्टिक हिल क्लाइम्बिंग आमतौर पर स्टीपेस्ट हिल क्लाइम्बिंग से भी बदतर प्रदर्शन करता है , लेकिन ऐसे कौन से मामले हैं जिनमें पूर्व बेहतर प्रदर्शन करता है?
जवाबों:
उत्तल पहाड़ी चढ़ाई एल्गोरिदम उत्तल अनुकूलन के लिए अच्छी तरह से काम करता है। हालाँकि, वास्तविक दुनिया की समस्याएं आम तौर पर गैर-उत्तल अनुकूलन प्रकार की होती हैं: कई चोटियाँ होती हैं। ऐसे मामलों में, जब यह एल्गोरिथम एक यादृच्छिक समाधान पर शुरू होता है, तो वैश्विक शिखर के बजाय स्थानीय चोटियों में से एक तक पहुंचने की संभावना अधिक होती है। सिलेक्टेड एनीलिंग जैसी सुधार एल्गोरिदम को एक स्थानीय चोटी से दूर जाने की अनुमति देकर इस मुद्दे को संशोधित करता है, और इस तरह संभावना बढ़ जाती है कि यह वैश्विक शिखर को खोज लेगा।
जाहिर है, केवल एक चोटी के साथ एक साधारण समस्या के लिए, खड़ी पहाड़ी चढ़ाई हमेशा बेहतर होती है। यदि वैश्विक शिखर पाया जाता है तो यह शुरुआती रोक का भी उपयोग कर सकता है। इसकी तुलना में, एक सिम्युलेटेड एनलिंग एल्गोरिथ्म वास्तव में एक वैश्विक शिखर से कूद जाएगा, वापस लौटकर फिर से कूद जाएगा। यह तब तक दोहराएगा जब तक कि इसका ठंडा न हो जाए या पुनरावृत्तियों की एक निश्चित संख्या पूरी हो गई हो।
वास्तविक दुनिया की समस्याएं शोर और लापता डेटा से निपटती हैं। धीमी गति से चलने वाली पहाड़ी चढ़ाई का दृष्टिकोण, जबकि धीमी, इन मुद्दों के लिए अधिक मजबूत है, और अनुकूलन दिनचर्या में सबसे तेज पहाड़ी चढ़ाई एल्गोरिथ्म की तुलना में वैश्विक शिखर पर पहुंचने की अधिक संभावना है।
उपसंहार: यह एक अच्छा प्रश्न है जो एक समाधान तैयार करते समय या विभिन्न एल्गोरिदम के बीच चयन करते समय एक निरंतर प्रश्न उठाता है: प्रदर्शन-कम्प्यूटेशनल लागत व्यापार-बंद। जैसा कि आपको संदेह हो सकता है, जवाब हमेशा होता है: यह आपके एल्गोरिथ्म की प्राथमिकताओं पर निर्भर करता है। यदि यह कुछ ऑनलाइन लर्निंग सिस्टम का हिस्सा है जो डेटा के एक बैच पर काम कर रहा है, तो एक मजबूत समय बाधा है, लेकिन कमजोर प्रदर्शन बाधा (डेटा के अगले बैच डेटा के पहले बैच द्वारा पेश किए गए गलत पूर्वाग्रह के लिए सही होगा)। दूसरी ओर, यदि हाथ में उपलब्ध संपूर्ण डेटा के साथ यह एक ऑफ़लाइन शिक्षण कार्य है, तो प्रदर्शन मुख्य बाधा है, और स्टोचस्टिक दृष्टिकोण उचित हैं।
पहले कुछ परिभाषाओं के साथ शुरू करते हैं।
हिल-क्लाइम्बिंग एक खोज एल्गोरिथ्म है जो केवल एक लूप चलाता है और लगातार बढ़ते मूल्य की दिशा में चलता है-यानी, ऊपर की ओर। लूप समाप्त हो जाता है जब यह एक चरम पर पहुंच जाता है और किसी भी पड़ोसी का उच्च मूल्य नहीं होता है।
स्टोचैस्टिक हिल क्लाइम्बिंग , हिल-क्लाइम्बिंग का एक प्रकार है, जो ऊपर की ओर जाने वाली चालों में से एक यादृच्छिक को चुनता है। चयन की संभावना अलग-अलग चाल की स्थिरता के साथ भिन्न हो सकती है। हम अच्छी तरह से ज्ञात तरीके हैं:
पहली पसंद पहाड़ी चढ़ाई: उत्तराधिकारियों को यादृच्छिक रूप से उत्पन्न करता है जब तक कि एक उत्पन्न नहीं होता है जो वर्तमान स्थिति से बेहतर है। * माना जाता है कि यदि राज्य में कई उत्तराधिकारी हैं (जैसे हजारों, या लाखों)।
रैंडम-रीस्टार्ट पहाड़ी चढ़ाई:"यदि आप सफल नहीं होते हैं, तो कोशिश करें, फिर से प्रयास करें" के दर्शन पर काम करता है।
अब आपके उत्तर के लिए। स्टोचस्टिक पहाड़ी चढ़ाई वास्तव में कई मामलों में बेहतर प्रदर्शन कर सकती है । निम्नलिखित मामले पर विचार करें। छवि राज्य-अंतरिक्ष परिदृश्य दिखाती है। चित्र में मौजूद उदाहरण को आर्टिफिशियल इंटेलिजेंस: ए मॉडर्न अप्रोच नामक पुस्तक से लिया गया है ।
मान लीजिए कि आप वर्तमान स्थिति द्वारा दिखाए गए बिंदु पर हैं। यदि आप सरल पहाड़ी चढ़ाई एल्गोरिथ्म को लागू करते हैं तो आप स्थानीय अधिकतम पर पहुंच जाएंगे और एल्गोरिथ्म समाप्त हो जाएगा। भले ही अधिक इष्टतम उद्देश्य फ़ंक्शन मूल्य के साथ राज्य मौजूद है, लेकिन एल्गोरिथ्म वहां तक पहुंचने में विफल रहता है क्योंकि यह स्थानीय अधिकतम पर अटक गया है। एल्गोरिथ्म भी फ्लैट स्थानीय मैक्सिमा पर अटक सकता है ।
बेतरतीब ढंग से शुरू होने वाली पहाड़ी चढ़ाई एक लक्ष्य अवस्था मिलने तक यादृच्छिक रूप से उत्पन्न प्रारंभिक अवस्थाओं से पहाड़ी चढ़ाई खोजों की एक श्रृंखला का संचालन करती है।
पहाड़ी चढ़ाई की सफलता राज्य-अंतरिक्ष परिदृश्य के आकार पर निर्भर करती है। मामले में केवल कुछ स्थानीय मैक्सिमा, फ्लैट प्लैटॉक्स हैं; रैंडम-रीस्टार्ट हिल क्लाइंब बहुत जल्दी एक अच्छा समाधान मिलेगा। अधिकांश वास्तविक जीवन की समस्याओं में बहुत कठिन स्थिति होती है, जो उन्हें पहाड़ी चढ़ाई एल्गोरिथ्म या इसके किसी भी संस्करण का उपयोग करने के लिए उपयुक्त नहीं बनाती है।
नोट: हिल क्लाइम्ब एल्गोरिथम का उपयोग न्यूनतम मान ज्ञात करने के लिए भी किया जा सकता है , न कि केवल अधिकतम मानों के लिए। मैंने अपने उत्तर में अधिकतम शब्द का उपयोग किया है। यदि आप न्यूनतम मूल्यों की तलाश कर रहे हैं, तो ग्राफ सहित सभी चीजें रिवर्स हो जाएंगी।
मैं इन अवधारणाओं के लिए भी नया हूं, लेकिन जिस तरह से मैंने इसे समझा है, स्टोचैस्टिक हिल क्लाइम्बिंग उन मामलों में बेहतर प्रदर्शन करेगा जहां गणना समय कीमती है (फिटनेस फ़ंक्शन की गणना भी शामिल है) लेकिन सर्वश्रेष्ठ तक पहुंचने के लिए वास्तव में आवश्यक नहीं है संभावित समाधान। यहां तक कि एक स्थानीय इष्टतम तक पहुंचना ठीक होगा। एक झुंड में काम करने वाले रोबोट एक उदाहरण होंगे जहां इसका इस्तेमाल किया जा सकता है।
एकमात्र अंतर जो मुझे सबसे कठिन पहाड़ी चढ़ाई में दिखाई देता है, वह यह है कि यह न केवल पड़ोसी नोड्स को खोजता है, बल्कि पड़ोसियों के उत्तराधिकारियों को भी पसंद करता है, बहुत पसंद है कि कैसे शतरंज के एल्गोरिथ्म सबसे अच्छा कदम चुनने से पहले कई और आगे बढ़ते हैं।