2
बहुत लंबे समय तक प्रशिक्षण के दौरान एडम ऑप्टिमाइज़र के साथ अजीब व्यवहार
मैं 64 बेतरतीब ढंग से उत्पन्न डेटा बिंदुओं पर एक एकल अवधारणात्मक (1000 इनपुट इकाइयों, 1 आउटपुट, कोई छिपी हुई परतों) को प्रशिक्षित करने की कोशिश कर रहा हूं। मैं एडम ऑप्टिमाइज़र का उपयोग करके पाइटोरेक का उपयोग कर रहा हूं: import torch from torch.autograd import Variable torch.manual_seed(545345) N, D_in, …