यह आपके प्रत्यक्ष डेटा संग्रह प्रयासों से बहुत अधिक जोड़ने की संभावना नहीं है।
वर्तमान जीएएन आउटपुट (2017 के अनुसार) की गुणवत्ता पर्याप्त उच्च नहीं होगी। GAN द्वारा निर्मित छवियां आम तौर पर छोटी होती हैं और इनमें असामान्य / अस्पष्ट विवरण और विषम विकृतियां हो सकती हैं। आपके द्वारा लिंक किए गए पेपर में, एक वाक्य से सिस्टम द्वारा उत्पन्न छवियों में विषय के दिए गए रंग के विश्वसनीय ब्लॉक होते हैं, लेकिन वाक्य के बिना आपको क्या उम्मीद है कि उनमें से अधिकांश किसी विशिष्ट विषय के रूप में पहचानने योग्य नहीं हैं ।
वाक्यों से छवियों को उत्पन्न करने की तुलना में कम महत्वाकांक्षी उद्देश्य (जो मेरी आलोचना के बावजूद, वास्तव में एक उल्लेखनीय उपलब्धि IMO है) को फोटो-यथार्थवादी छवियों के करीब उत्पन्न करना चाहिए। लेकिन उनका दायरा कम होगा और शायद आपकी वांछित छवि प्रकार शामिल नहीं है। इसके अलावा, आमतौर पर आउटपुट का आकार छोटा होता है जैसे 64x64 या 128x128 *, और अभी भी पर्याप्त विकृतियां और अस्पष्टताएं हैं जो मूल जमीनी सच्चाई की तस्वीरें काफी बेहतर होंगी।
जीएएन स्वयं उपलब्ध प्रशिक्षण पुस्तकालय द्वारा सीमित है - यदि आप इसके प्रशिक्षण डेटा के दायरे से बाहर छवियों को उत्पन्न करने का प्रयास करते हैं तो यह अच्छा नहीं होगा। पाठ्यक्रम के शोध पत्र में दिखाए गए परिणाम प्रशिक्षण डेटा द्वारा आपूर्ति किए गए डोमेन पर ध्यान केंद्रित करते हैं। लेकिन आप इस मॉडल में कोई वाक्य नहीं खिला सकते हैं और एक परिणाम की अपेक्षा कर सकते हैं जो अन्यत्र उपयोगी होगा।
यदि आपको एक GAN मिल जाता है जिसे आपकी समस्या के लिए उपयुक्त डेटा सेट पर प्रशिक्षित किया गया है, तो आप अपनी परियोजना के लिए सीधे उसी डेटा को स्रोत करने की कोशिश कर रहे हैं।
यदि आप सीमित जमीनी सच्चाई के आंकड़ों के साथ समस्या का सामना कर रहे हैं, तो हो सकता है कि GAN का उपयोग करने का एक बेहतर तरीका वीजीजी -19 या इनसेप्शन वी 5 जैसे पूर्व-प्रशिक्षित क्लासिफायर का उपयोग करना होगा, अंतिम कुछ पूरी तरह से जुड़ी परतों की जगह, और ठीक है इसे अपने डेटा पर ट्यून करें। यहां ऐसा करने का एक उदाहरण है कि पायथन में केरस पुस्तकालय का उपयोग करना - अन्य उदाहरण "ठीक धुन सीएनएन छवि प्रवर्धक" जैसी खोजों के साथ मिल सकते हैं।
* इस जवाब को पोस्ट करने के बाद से अत्याधुनिक GAN बेहतर हो गया है। एनवीडिया की एक शोध टीम को 1024x1024 फोटो-यथार्थवादी चित्र बनाने में उल्लेखनीय सफलता मिली है । हालांकि, यह मेरे जवाब में अन्य बिंदुओं को नहीं बदलता है। GANs छवि वर्गीकरण कार्यों के लिए छवियों का एक विश्वसनीय स्रोत नहीं हैं, शायद GAN पर जो कुछ भी पहले से प्रशिक्षित किया गया है, उसके उप-कार्यों को छोड़कर, सशर्त रूप से (या शायद अधिक तुच्छ रूप से, "अन्य" श्रेणियों के लिए स्रोत डेटा प्रदान करने में सक्षम है) classifiers)।