दुर्भाग्य से, @ साइकोरैक्स द्वारा अब स्वीकार किए गए उत्तर के रूप में, जबकि विस्तृत है, गलत है।
वास्तव में, स्पष्ट क्रोस एंट्रोपी के माध्यम से प्रतिगमन का एक प्रमुख उदाहरण - Wavenet - कर दिया गया है कार्यान्वित TensorFlow में ।
सिद्धांत यह है कि आप अपने आउटपुट स्पेस को अलग करते हैं और फिर आपका मॉडल केवल संबंधित बिन की भविष्यवाणी करता है; साउंड मॉडलिंग डोमेन में उदाहरण के लिए पेपर की धारा 2.2 देखें । इसलिए जब तकनीकी रूप से मॉडल वर्गीकरण करता है, तो हल किया गया अंतिम कार्य प्रतिगमन होता है।
एक स्पष्ट नकारात्मक पक्ष यह है कि आप आउटपुट रिज़ॉल्यूशन खो देते हैं। हालाँकि, यह एक समस्या नहीं हो सकती है (कम से कम मुझे लगता है कि Google के कृत्रिम सहायक ने बहुत ही मानवीय आवाज़ में बात की थी ) या आप कुछ पोस्ट-प्रोसेसिंग के साथ खेल सकते हैं, जैसे कि सबसे संभावित बिन के बीच में अंतर करना और यह दो पड़ोसी हैं।
दूसरी ओर, यह दृष्टिकोण सामान्य सिंगल-लीनियर-यूनिट आउटपुट की तुलना में मॉडल को बहुत अधिक शक्तिशाली बनाता है, अर्थात मल्टी-मोडल भविष्यवाणियों को व्यक्त करने की अनुमति देता है या यह आत्मविश्वास का आकलन करता है। ध्यान दें कि उत्तरार्द्ध अन्य तरीकों से स्वाभाविक रूप से प्राप्त किया जा सकता है, उदाहरण के लिए वैरिएबल ऑटोकेन्सर के रूप में एक स्पष्ट (लॉग) विचरण उत्पादन करके।
वैसे भी, यह दृष्टिकोण अधिक आयामी आउटपुट के लिए अच्छी तरह से पैमाने पर नहीं है, क्योंकि तब आउटपुट परत का आकार तेजी से बढ़ता है, जिससे यह कम्प्यूटेशनल और मॉडलिंग दोनों मुद्दों को बनाता है।