डीपमाइंड ने कहा कि उनका गहन क्यू-नेटवर्क (DQN) 49 अटारी खेल खेलने के लिए सीखने के दौरान अपने व्यवहार को लगातार अनुकूलित करने में सक्षम था।
एक ही न्यूरल नेट के साथ सभी गेम सीखने के बाद, क्या एजेंट उन सभी को 'अलौकिक' स्तरों पर एक साथ खेलने में सक्षम था (जब भी इसे बेतरतीब ढंग से किसी एक गेम के साथ प्रस्तुत किया गया था) या यह एक समय में केवल एक गेम में अच्छा हो सकता है क्योंकि स्विचिंग फिर से सीखने की आवश्यकता है?