1
जब मैं सुदृढीकरण सीखना बनाम पीआईडी नियंत्रण का उपयोग करना चाहिए?
OpenAIGym पर लूनर लैंडर जैसी समस्याओं के समाधान को डिजाइन करते समय , सुदृढीकरण सीखना एजेंट को सफलतापूर्वक भूमि पर पर्याप्त कार्रवाई नियंत्रण देने का एक लुभावना साधन है। लेकिन ऐसे कौन से उदाहरण हैं जिनमें नियंत्रण प्रणाली एल्गोरिदम, जैसे कि पीआईडी नियंत्रक , सिर्फ एक पर्याप्त काम करेंगे, जैसे …