स्पष्ट रूप से आवेदन और डिजाइन दृष्टिकोण के आधार पर इसके लिए कई अलग-अलग संभावित समाधान हैं। इसके अलावा, जैसा कि वीडियो से स्पष्ट है, द्विपाद रोबोट अभी भी चलने में लालित्य के स्तर को प्राप्त करने से एक लंबा रास्ता तय कर रहे हैं, जो कि अधिकांश मनुष्य थोड़ा सचेत प्रयास के साथ प्रबंधित करते हैं।
जैसा कि मनुष्यों के साथ सबसे महत्वपूर्ण तुलना है, यह देखने लायक है कि मनुष्य कैसे संतुलन बनाए रखता है। यह कॉन्सर्ट में काम करने वाले बहुत सारे इंद्रियों को शामिल कर सकता है।
एक मुख्य अंग आंतरिक कान में ट्यूबों का सेट है, जो अनिवार्य रूप से एक्सीलरोमीटर का एक सेट है। मनुष्य के पास एक सहज ज्ञान भी होता है जहां हमारे अंग बाहरी दबाव के काफी परिष्कृत अर्थ के अलावा अंतरिक्ष में होते हैं और वास्तव में हमारी मांसपेशियों को कितना बल प्रदान करते हैं।
स्पष्ट रूप से दृष्टि भी बहुत महत्वपूर्ण है, न केवल संवेदन बाधाओं के लिए, बल्कि गति, स्थिति और अभिविन्यास के लिए एक संदर्भ बिंदु प्रदान करने में भी।
एक और बहुत महत्वपूर्ण कारक यह है कि मानव शरीर में बहुत अधिक स्वतंत्रता है और सैकड़ों अलग-अलग मांसपेशियां हैं जो स्प्रिंग्स और डैम्पर्स के साथ-साथ एक्ट्यूएटर्स के रूप में कार्य कर सकते हैं। वास्तव में, यह ह्यूमनॉइड रोबोट चलने में बड़ी चुनौतियों में से एक है। हालांकि मुख्य जोड़ों (जैसे कूल्हों, घुटनों और टखनों) को इकट्ठा करना मुश्किल नहीं है और उन्हें वायवीय पिस्टन के जोड़े के साथ प्रदान करना है, वास्तविक मनुष्यों में पूरे शरीर को समायोजित करने के लिए स्थिर, सूक्ष्म और गतिशील समायोजन के साथ संतुलन बनाए रखने में शामिल है। द्रव्यमान केंद्र।
नियंत्रण प्रणाली के वास्तविक तंत्र के संदर्भ में यह काफी स्पष्ट है कि एक मानव मस्तिष्क पारंपरिक सॉफ्टवेयर नियंत्रण से बहुत अलग चीज है। बड़ी चुनौतियों में से एक यह है कि एक कार को स्टीयरिंग की तरह कुछ के विपरीत, जहां एक निश्चित नियंत्रण इनपुट एक ज्ञात प्रतिक्रिया देता है, सिस्टम की पूरी ज्यामिति चलने के साथ लगातार बदल रहा है और आवश्यक इनपुट बड़ी संख्या में विभिन्न मांसपेशियों का योग हो सकता है , वास्तव में एक ही आउटपुट प्राप्त करने के लिए बड़ी संख्या में संभावित इनपुट हो सकते हैं।
इसे ध्यान में रखते हुए नियंत्रण के लिए कई दृष्टिकोण हैं। पहला वह है जिसे आप 'ब्रूट फोर्स एप्रोच' कह सकते हैं, जहां आपके पास कई सेंसर और बहुत सारी कंप्यूटिंग शक्ति है जो पूरे सिस्टम को फ्री बॉडी डायग्राम की एक श्रृंखला के रूप में मॉडल करने के लिए और पूरे सिस्टम को पर्याप्त विस्तार से मॉडल करने की कोशिश करते हैं जो पीआईडी कंट्रोल कर सकते हैं असरदार बनो। लेकिन जैसा कि पहले ही यहां बताया गया है कि किसी दिए गए सुधार के लिए अपेक्षित प्रतिक्रिया अस्पष्ट हो सकती है।
एक अन्य दृष्टिकोण एक एल्गोरिथ्म के साथ आने के लिए है जो प्रतिक्रिया-आधारित नियंत्रण के अधिक सीमित डिग्री के साथ कुछ निश्चित तरीकों से प्रतिक्रिया करता है, यानी आपके पास एक पूर्व निर्धारित 'मानक' चाल है और कुछ गलत होने पर सुधार करें।
एक तीसरा और संभावित रूप से अधिक शक्तिशाली तरीका एक विकासवादी सीखने के प्रकार के दृष्टिकोण का उपयोग करना है जहां आप सेंसर और एक्ट्यूएटर्स को सॉफ़्टवेयर एक्सेस देते हैं और 'सफलता' के लिए कुछ मानदंड स्थापित करते हैं और बस इसे परीक्षण और त्रुटि के साथ प्राप्त करते हैं। इस मामले में सॉफ़्टवेयर नियंत्रण प्रणालियों को बहुत यादृच्छिक रूप से विकसित करता है और उन्हें बाहर करने की कोशिश करता है, उन संस्करणों को हटा देता है जिनके पास कम सफलता स्कोर होते हैं और जो बेहतर काम करते हैं उन्हें यादृच्छिक रूप से जोड़ते हैं।