मैं अपनी पहली परियोजना को एक साथ रखने की कोशिश कर रहा हूं। मेरे मन में एक गीत वर्गीकरण परियोजना थी, लेकिन चूंकि मैं मैन्युअल रूप से लेबलिंग करूंगा, इसलिए मैं केवल यथोचित रूप से लगभग 1000 गाने, या 60 घंटे का संगीत डाल सकता था।
मैं कई कक्षाओं के साथ वर्गीकृत कर रहा हूं, इसलिए यह संभव है कि एक वर्ग के प्रशिक्षण सेट में 50-100 गाने होंगे- ऐसा बहुत कम लगता है! क्या काम पर एक शॉट देने के लिए एक तंत्रिका नेटवर्क को प्रशिक्षित करने के लिए कितना डेटा की आवश्यकता है, इसके लिए अंगूठे का एक सामान्य नियम है?
संपादित करें: मैं एक वेनिला LSTM का उपयोग करने के बारे में सोच रहा था। इनपुट सुविधाओं में आयाम 39, आउटपुट आयाम 6 होगा, छिपी हुई परत आयाम के लिए मेरा पहला प्रयास 100 होगा।