क्या हम जनरेटिव एडवरसरी नेटवर्क के साथ विशाल डेटासेट उत्पन्न कर सकते हैं


14

मैं एक ऐसी समस्या से निपट रहा हूँ जहाँ मुझे प्रशिक्षण के लिए अपने गहरे तंत्रिका नेटवर्क में फीड करने के लिए पर्याप्त डेटासेट (चित्र) नहीं मिल रहे हैं।

मैं स्कॉट रीड एट अल द्वारा प्रकाशित इमेज सिंथेसिस के पेपर जनरेटिव एडवरसरी टेक्स्ट से बहुत प्रेरित था । जनरेशनल एडवाइजररल नेटवर्क पर।

मैं यह जानने के लिए उत्सुक था कि, क्या मैं GAN मॉडल के इनपुट के रूप में उपलब्ध छोटे डेटासेट का उपयोग कर सकता हूं और गहरे नेटवर्क मॉडल से निपटने के लिए बहुत बड़ा डेटासेट उत्पन्न कर सकता हूं?

क्या यह काफी अच्छा होगा?


क्या हम गैर-छवि डेटासेट के लिए GAN का उपयोग कर सकते हैं?
मोहम्मद ईएल-कडौरी

@ MohamedEL-KADDOURY हाँ बेशक, ऑडियो के साथ arxiv.org/abs/1802.04208 , पाठ के साथ arxiv.org/abs/1801.07736 आदि
एल्विन मैथ्यू

जवाबों:


9

यह आपके प्रत्यक्ष डेटा संग्रह प्रयासों से बहुत अधिक जोड़ने की संभावना नहीं है।

वर्तमान जीएएन आउटपुट (2017 के अनुसार) की गुणवत्ता पर्याप्त उच्च नहीं होगी। GAN द्वारा निर्मित छवियां आम तौर पर छोटी होती हैं और इनमें असामान्य / अस्पष्ट विवरण और विषम विकृतियां हो सकती हैं। आपके द्वारा लिंक किए गए पेपर में, एक वाक्य से सिस्टम द्वारा उत्पन्न छवियों में विषय के दिए गए रंग के विश्वसनीय ब्लॉक होते हैं, लेकिन वाक्य के बिना आपको क्या उम्मीद है कि उनमें से अधिकांश किसी विशिष्ट विषय के रूप में पहचानने योग्य नहीं हैं ।

वाक्यों से छवियों को उत्पन्न करने की तुलना में कम महत्वाकांक्षी उद्देश्य (जो मेरी आलोचना के बावजूद, वास्तव में एक उल्लेखनीय उपलब्धि IMO है) को फोटो-यथार्थवादी छवियों के करीब उत्पन्न करना चाहिए। लेकिन उनका दायरा कम होगा और शायद आपकी वांछित छवि प्रकार शामिल नहीं है। इसके अलावा, आमतौर पर आउटपुट का आकार छोटा होता है जैसे 64x64 या 128x128 *, और अभी भी पर्याप्त विकृतियां और अस्पष्टताएं हैं जो मूल जमीनी सच्चाई की तस्वीरें काफी बेहतर होंगी।

जीएएन स्वयं उपलब्ध प्रशिक्षण पुस्तकालय द्वारा सीमित है - यदि आप इसके प्रशिक्षण डेटा के दायरे से बाहर छवियों को उत्पन्न करने का प्रयास करते हैं तो यह अच्छा नहीं होगा। पाठ्यक्रम के शोध पत्र में दिखाए गए परिणाम प्रशिक्षण डेटा द्वारा आपूर्ति किए गए डोमेन पर ध्यान केंद्रित करते हैं। लेकिन आप इस मॉडल में कोई वाक्य नहीं खिला सकते हैं और एक परिणाम की अपेक्षा कर सकते हैं जो अन्यत्र उपयोगी होगा।

यदि आपको एक GAN मिल जाता है जिसे आपकी समस्या के लिए उपयुक्त डेटा सेट पर प्रशिक्षित किया गया है, तो आप अपनी परियोजना के लिए सीधे उसी डेटा को स्रोत करने की कोशिश कर रहे हैं।

यदि आप सीमित जमीनी सच्चाई के आंकड़ों के साथ समस्या का सामना कर रहे हैं, तो हो सकता है कि GAN का उपयोग करने का एक बेहतर तरीका वीजीजी -19 या इनसेप्शन वी 5 जैसे पूर्व-प्रशिक्षित क्लासिफायर का उपयोग करना होगा, अंतिम कुछ पूरी तरह से जुड़ी परतों की जगह, और ठीक है इसे अपने डेटा पर ट्यून करें। यहां ऐसा करने का एक उदाहरण है कि पायथन में केरस पुस्तकालय का उपयोग करना - अन्य उदाहरण "ठीक धुन सीएनएन छवि प्रवर्धक" जैसी खोजों के साथ मिल सकते हैं।


* इस जवाब को पोस्ट करने के बाद से अत्याधुनिक GAN बेहतर हो गया है। एनवीडिया की एक शोध टीम को 1024x1024 फोटो-यथार्थवादी चित्र बनाने में उल्लेखनीय सफलता मिली है । हालांकि, यह मेरे जवाब में अन्य बिंदुओं को नहीं बदलता है। GANs छवि वर्गीकरण कार्यों के लिए छवियों का एक विश्वसनीय स्रोत नहीं हैं, शायद GAN पर जो कुछ भी पहले से प्रशिक्षित किया गया है, उसके उप-कार्यों को छोड़कर, सशर्त रूप से (या शायद अधिक तुच्छ रूप से, "अन्य" श्रेणियों के लिए स्रोत डेटा प्रदान करने में सक्षम है) classifiers)।


3

मेरे पास एक DNN के साथ एक ही मुद्दा है कि मैं वर्तमान में निर्माण कर रहा हूं। मेरे डेटा सेट को लेना और GAN के साथ नए डेटा को संश्लेषित करना एक महान विचार जैसा लगता है। लेकिन GAN केवल उसी छवि विचरण और मानक विचलन के साथ छवियों को आउटपुट करना सीखेगा जैसा कि प्रशिक्षण सेट में सीखा गया था। तो आपका नया जनरेट किया गया डेटा बस उसी नमूना वितरण के अधिक क्रमों का प्रतिनिधित्व करेगा। यह आपके एनएन ट्रेन को समान वितरण पर बेहतर बनाने में मदद करेगा, इसलिए इससे प्रशिक्षण अधिक हो सकता है।


3

केवल विशुद्ध सैद्धांतिक दृष्टिकोण से यह संभव नहीं हो सकता है।

किसी भी दिए गए प्रशिक्षण डेटासेट एक निश्चित स्थान की संरचना के बारे में जानकारी की एक निश्चित राशि का प्रतिनिधित्व करता है। यदि आप इस डेटासेट पर GAN प्रशिक्षित करते हैं, तो यह केवल उस डेटासेट द्वारा दर्शाई गई जानकारी से सीखेगा। GAN द्वारा संश्लेषित डेटा मूल डेटा की तुलना में एक बड़े स्थान से कभी नहीं हो सकता है, साधारण कारण के लिए: यह जानकारी कहां से आनी चाहिए? यदि यह मूल डेटासेट में नहीं था, तो यह GAN से संश्लेषित डेटा में भी नहीं हो सकता है।

यदि आप एक न्यूरल नेटवर्क को किसी डेटासेट पर अभिसरण के लिए प्रशिक्षित करते हैं, तो यह न्यूरल नेटवर्क सीखेगा कि डेटासेट में जो भी संरचना है। GAN द्वारा संश्लेषित किसी भी कृत्रिम प्रशिक्षण डेटा में कोई नई जानकारी नहीं होगी। वह विचार सीधे आगे होना चाहिए।


2

वास्तव में यह संभव है, इसे सुधारने के लिए GANs के साथ एक छोटे डेटासेट को बढ़ाने के लिए और यह वर्गीकरण नेटवर्कों के प्रदर्शन को भी बढ़ाएगा क्योंकि आप यहाँ पढ़ सकते हैं https://arxiv.org/pdf/1803.01229.pdf । GAN सीखने में सक्षम हैं जैसे मध्यवर्ती आकार जो मूल दिनांक में शामिल नहीं हैं लेकिन फिर भी मान्य हैं। तो सिंथेटिक चित्र वास्तव में डेटासेट आकार में सुधार कर सकते हैं और सीएनएन वर्गीकरण सटीकता में सुधार कर सकते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.