1
DQN को दो अलग-अलग नेटवर्क की आवश्यकता क्यों है?
मैं DQN के इस कार्यान्वयन के माध्यम से जा रहा था और मैं देखता हूं कि 124 और 125 दो अलग-अलग क्यू नेटवर्क को आरंभीकृत किया गया है। मेरी समझ से, मुझे लगता है कि एक नेटवर्क उपयुक्त कार्रवाई की भविष्यवाणी करता है और दूसरा नेटवर्क बेलमैन त्रुटि खोजने के …