मैं स्टैनफोर्ड NLP डीप लर्निंग क्लास की लिखित असाइनमेंट समस्याओं http://cs224d.stanford.edu/assignment1/assignment1_soln में समस्याओं से गुज़र रहा हूँ
मैं 3a के उत्तर को समझने की कोशिश कर रहा हूं जहां वे केंद्र शब्द के लिए वेक्टर के व्युत्पन्न की तलाश कर रहे हैं।
मान लें कि आपको लिए केंद्र शब्द c के अनुरूप एक सदिश शब्द दिया गया है , और शब्द भविष्यवाणी को soft2ax फ़ंक्शन के साथ बनाया गया है जो word2vec मॉडल में पाया जाता है।
जहाँ w , w-वें शब्द और (w = 1,।, W) को दर्शाता है, शब्दावली में सभी शब्दों के लिए "आउटपुट" शब्द वैक्टर हैं। मान लें कि क्रॉस एन्ट्रापी लागत इस भविष्यवाणी पर लागू होती है और शब्द ओ अपेक्षित शब्द है।
जहां सभी आउटपुट वैक्टर का मैट्रिक्स है, और let शब्दों के सॉफ्टमैक्स भविष्यवाणी के कॉलम वेक्टर हैं, और y एक-गर्म-गर्म होना चाहिए जो H एक कॉलम वेक्टर भी है।
जहाँ क्रॉस एन्ट्रॉपी
तो केंद्र वेक्टर के लिए ढाल का उत्तर
क्या कोई मुझे इसके लिए कदम उठा सकता है? मैं इस प्रश्न का उपयोग शब्द 2vec में क्रॉस एन्ट्रापी लॉस के व्युत्पन्न व्युत्पन्न के रूप में कर रहा हूं, लेकिन मैं विशेष रूप से जानना चाहता हूंप्रतिनिधित्व।