मैं न्यूरल नेटवर्क के साथ प्रयोग करना शुरू करना चाहता था और एक खिलौने की समस्या के रूप में मैं एक को प्रशिक्षित करने की इच्छा रखता था, यानी एक चतुर व्यक्ति की तरह चैटिंग बॉट लागू करता था। वैसे भी चतुर नहीं है।
मैंने कुछ प्रलेखन के लिए चारों ओर देखा और मुझे सामान्य कार्यों पर कई ट्यूटोरियल मिले, लेकिन कुछ इस विशिष्ट विषय पर। मैंने पाया कि कार्यान्वयन पर अंतर्दृष्टि दिए बिना परिणामों को उजागर किया। जिन लोगों ने किया, उन्होंने बहुत उथला किया (seq2seq पर टेंसोफ़्लो प्रलेखन पृष्ठ में imho की कमी है)।
अब, मुझे लगता है कि मैंने सिद्धांत को कम या ज्यादा समझ लिया होगा, लेकिन मुझे यकीन नहीं है और मुझे यकीन भी नहीं है कि कैसे शुरू करें। इस प्रकार मैं यह बताऊंगा कि मैं इस समस्या से कैसे निपटूंगा और मुझे इस समाधान पर एक प्रतिक्रिया चाहिए, मुझे बताएं कि मैं कहां गलत हूं और संभवत: विस्तृत स्पष्टीकरण और प्रक्रिया पर व्यावहारिक ज्ञान के लिए कोई लिंक है।
मैं जो डेटासेट उपयोग कर रहा हूं वह मेरे सभी फेसबुक और व्हाट्सएप चैट इतिहास का डंप है। मुझे नहीं पता कि यह कितना बड़ा होगा लेकिन संभवतः अभी भी बहुत बड़ा नहीं है। लक्ष्य भाषा अंग्रेजी नहीं है, इसलिए मुझे नहीं पता कि जल्दी से सार्थक बातचीत के नमूने कहां एकत्र करना है।
मैं प्रत्येक वाक्य से एक विचार वेक्टर उत्पन्न करने जा रहा हूं। फिर भी पता नहीं कैसे वास्तव में; मुझे deeplearning4j वेबसाइट पर word2vec के लिए एक अच्छा उदाहरण मिला, लेकिन वाक्यों के लिए कोई नहीं। मैं समझ गया कि कैसे शब्द वैक्टर बनाए जाते हैं और क्यों, लेकिन मुझे वाक्य वैक्टर के लिए एक विस्तृत स्पष्टीकरण नहीं मिला।
इनपुट और आउटपुट के रूप में विचारशील वैक्टर का उपयोग करके मैं तंत्रिका नेटवर्क को प्रशिक्षित करने जा रहा हूं। मुझे नहीं पता कि इसकी कितनी परतें होनी चाहिए, और इनमें कौन सी परतें परतें होनी चाहिए।
फिर एक और तंत्रिका नेटवर्क होना चाहिए जो एक विचार वेक्टर को एक वाक्य की रचना करने वाले चरित्र के अनुक्रम में बदलने में सक्षम हो। मैंने पढ़ा है कि मुझे अलग-अलग वाक्य की लंबाई के लिए पैडिंग का उपयोग करना चाहिए, लेकिन मुझे याद है कि कैसे वर्णों को सांकेतिक शब्दों में बदलना है (कोड कोड पर्याप्त हैं?)।