हां, GANs का उपयोग पाठ के लिए किया जा सकता है। हालांकि, GANs कैसे काम करते हैं और कैसे पाठ सामान्य रूप से तंत्रिका नेटवर्क द्वारा उत्पन्न होता है, के संयोजन में एक समस्या है:
- जेनरेटर और डिस्क्रिमिनेटर की संरचना के माध्यम से ग्रेडिएंट्स का प्रचार करके GAN काम करते हैं।
- सामान्य रूप से टोकन स्पेस पर अंतिम सॉफ्टमैक्स लेयर होने से टेक्स्ट उत्पन्न होता है, अर्थात, नेटवर्क का आउटपुट सामान्य रूप से प्रत्येक टोकन (यानी असतत स्टोचैस्टिक यूनिट) को उत्पन्न करने की संभावनाएं होती हैं।
ये 2 चीजें अपने आप एक साथ अच्छी तरह से काम नहीं करती हैं, क्योंकि आप असतत स्टोचस्टिक इकाइयों के माध्यम से ग्रेडिएंट का प्रचार नहीं कर सकते हैं। इससे निपटने के लिए 2 मुख्य दृष्टिकोण हैं: REINFORCE एल्गोरिथ्म और Gumbel-Softmax reparameterization ( कंक्रीट वितरण के रूप में भी जाना जाता है )। इस बात का ध्यान रखें कि REINFORCE को उच्च विचरण के लिए जाना जाता है, इसलिए आपको अच्छे क्रमिक अनुमान प्राप्त करने के लिए बड़ी मात्रा में डेटा की आवश्यकता होती है।
पाठ गणों के लिए REINFORCE के एक उदाहरण के रूप में आप SeqGAN लेख की जाँच कर सकते हैं । Gumbel-Softmax का एक उदाहरण आप इस लेख को देख सकते हैं ।
एक और पूरी तरह से अलग विकल्प जनरेटर के उत्पादन के रूप में असतत स्टोचस्टिक इकाई नहीं है (उदाहरण के लिए एम्बेडेड अंतरिक्ष में नियत रूप से टोकन उत्पन्न करना), इसलिए उनके माध्यम से बैकप्रोपैगेटिंग की मूल समस्या को समाप्त करना।