यह करने के लिए बहुत जटिल नहीं होना चाहिए। उल्लिखित लेख नहीं पढ़ा, यहाँ मेरा नुस्खा है:
परिवर्तनशील ऑटो एनकोडर
मॉर्फिंग चेहरों के साथ ऑनलाइन डेमो:
http://vdumoulin.github.io/morphing_faces/online_demo.html
और तहजीब के लिए https://jmetzen.github.io/2015-11-27/vae.html ।
मूल रूप से, यह आपको अपने मामले में 'स्टाइल' को समरूप करने का एक तरीका देता है, उदाहरण के लिए आइए हम बताते हैं कि ब्रश स्ट्रोक कितना चौड़ा या फजी होना चाहिए। सामान जो उस विशेष शैली पर निर्भर करता है जिसे आप अनुकरण करने की कोशिश कर रहे हैं।
ऊपर के उदाहरण में अलग-अलग 'रूपांकित' या 'कल्पना' वाले चेहरे अव्यक्त स्थान में मापदंडों का एक कार्य हैं। नीचे दी गई छवि में वह होगा जो आपको 'कोड' स्तर पर सामान बदलने से मिलता है।
यहां मूल विचार है: मूल छवि बाएं, दाईं ओर एक ही छवि का शैलीगत संस्करण:
अब, सिद्धांत रूप में, यदि आप इस तरह के एक मॉडल को एक सामान्य छवि और एक लक्षित के रूप में एक स्टाइल की गई छवि को प्रशिक्षित करेंगे और संकल्पों को जोड़ेंगे, तो आपको कर्नेल फिल्टर को सीखने में सक्षम होना चाहिए जो "ब्रश स्ट्रोक" के प्रकार से मेल खाता है जो कलाकार का उपयोग करता है ।
बेशक, इसका मतलब है कि आपको मूल और शैलीगत दोनों संस्करणों में छवियों के कुछ उदाहरणों की आवश्यकता है। इस तरह के डेटा को समुदाय को दान करना अच्छा होगा - यदि आप ऐसा करते हैं तो मैं इस तरह के काम को देखने के लिए उत्सुक हूं।
सौभाग्य!
ऑटो एनकोडर पर विकी लेख एक अच्छा प्रारंभिक बिंदु होगा:
https://en.wikipedia.org/wiki/Autoencoder