तंत्रिका नेटवर्क को प्रशिक्षित करते समय कुछ प्रशिक्षण उदाहरण बहुत कम हैं?


14

मैं अपनी पहली परियोजना को एक साथ रखने की कोशिश कर रहा हूं। मेरे मन में एक गीत वर्गीकरण परियोजना थी, लेकिन चूंकि मैं मैन्युअल रूप से लेबलिंग करूंगा, इसलिए मैं केवल यथोचित रूप से लगभग 1000 गाने, या 60 घंटे का संगीत डाल सकता था।

मैं कई कक्षाओं के साथ वर्गीकृत कर रहा हूं, इसलिए यह संभव है कि एक वर्ग के प्रशिक्षण सेट में 50-100 गाने होंगे- ऐसा बहुत कम लगता है! क्या काम पर एक शॉट देने के लिए एक तंत्रिका नेटवर्क को प्रशिक्षित करने के लिए कितना डेटा की आवश्यकता है, इसके लिए अंगूठे का एक सामान्य नियम है?

संपादित करें: मैं एक वेनिला LSTM का उपयोग करने के बारे में सोच रहा था। इनपुट सुविधाओं में आयाम 39, आउटपुट आयाम 6 होगा, छिपी हुई परत आयाम के लिए मेरा पहला प्रयास 100 होगा।


2
यह वास्तव में जवाबदेह नहीं है क्योंकि सभी कार्य आसान नहीं हैं, और अलग-अलग नेटवर्क आर्किटेक्चर और हाइपरपरमेट चयन अलग-अलग तरीकों से विभिन्न मॉडलों में सुधार / चोट पहुंचाएंगे।
साइकोरैक्स का कहना है कि मोनिका

कम से कम, आपको अपने नेटवर्क संरचना को निर्दिष्ट करने की आवश्यकता है और प्रशिक्षण के लिए कितने लिंक होंगे।
गंग -

जवाबों:


16

यह वास्तव में आपके डेटासेट, और नेटवर्क आर्किटेक्चर पर निर्भर करता है। अंगूठे के एक नियम को मैंने पढ़ा है (2) तंत्रिका नेटवर्क के लिए प्रति वर्ग कुछ हजार नमूने बहुत अच्छा प्रदर्शन शुरू करने के लिए थे।

व्यवहार में, लोग कोशिश करते हैं और देखते हैं। 1000 नमूनों से छोटे प्रशिक्षण सेट के साथ अच्छे परिणाम दिखाने वाले अध्ययनों को खोजना दुर्लभ नहीं है।


मोटे तौर पर यह आकलन करने का एक अच्छा तरीका है कि अधिक प्रशिक्षण नमूने लेने के लिए किस हद तक फायदेमंद हो सकता है, प्रशिक्षण सेट के आकार के आधार पर तंत्रिका नेटवर्क के प्रदर्शन की साजिश करना, जैसे (1) से:

यहाँ छवि विवरण दर्ज करें


  • (1) डर्नोनकोर्ट, फ्रेंक, जी यंग ली, ओज़लेम उज़ुनर और पीटर ज़ोलोविट्स। " रिक्रिएंट न्यूरल नेटवर्क्स के साथ रोगी नोटों की डी-पहचान " arXiv preprint arXiv: 1606.03475 (2016)।
  • (२) साइरसन, डैन सी।, उली मीयर और जुरगेन श्मिधुबर। "गहरी तंत्रिका नेटवर्क के साथ लैटिन और चीनी वर्णों के लिए स्थानांतरण सीखने।" 2012 में तंत्रिका नेटवर्क पर अंतर्राष्ट्रीय संयुक्त सम्मेलन (IJCNN), पीपी। 1-6। IEEE, 2012. https://scholar.google.com/scholar?cluster=7452424507909578812&hl=en&as_sdt=0,22 ; http://people.idsia.ch/~ciresan/data/ijcnn2012_v9.pdf :

    प्रति वर्ग कुछ हजार नमूनों के साथ वर्गीकरण कार्यों के लिए , (अप्रकाशित या पर्यवेक्षित) दिखावा का लाभ प्रदर्शित करना आसान नहीं है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.