शब्द 2vec में क्रॉस एन्ट्रापी लॉस की व्युत्पत्ति


10

मैं cs224d ऑनलाइन स्टैनफोर्ड क्लास कोर्स सामग्री के पहले समस्या सेट के माध्यम से अपने तरीके से काम करने की कोशिश कर रहा हूं और मुझे समस्या 3 ए के साथ कुछ समस्याएं आ रही हैं: सॉफ्टमैक्स प्रेडिक्शन फ़ंक्शन और क्रॉस एन्ट्रॉपी लॉस फंक्शन के साथ स्किप ग्राम 2 वर्ड मॉडल का उपयोग करते समय, हम भविष्यवाणी शब्द वैक्टर के संबंध में ग्रेडिएंट की गणना करना चाहते हैं। इसलिए सॉफ्टमैक्स फंक्शन दिया गया:

wi^=Pr(wordir^,w)=exp(wiTr^)j|V|exp(wjTr^)

और क्रॉस एन्ट्रापी फ़ंक्शन:

CE(w,w^)=kwklog(wk^)

हमें \ frac {\ आंशिक {CE}} {\ आंशिक {\ hat {r}}} की गणना करने की आवश्यकता हैCEr^

मेरे कदम इस प्रकार हैं:

CE(w,w^)=k|V|wklog(exp(wkTr^)j|V|exp(wjTr^))

=k|V|wklog(exp(wkTr^)wklog(j|V|exp(wjTr^))

अब दिया wk एक गर्म वेक्टर है और मैं सही वर्ग है:

CE(w,w^)=wiTr^+log(j|V|exp(wjTr^))

CEr^=wi+1j|V|exp(wjTr^)j|V|exp(wjTr^)wj

क्या यह सही है या इसे और सरल बनाया जा सकता है? मैं यह सुनिश्चित करने का प्रयास करना चाहता हूं कि मैं सही रास्ते पर हूं क्योंकि समस्या सेट समाधान ऑनलाइन पोस्ट नहीं किए गए हैं। साथ ही लिखित असाइनमेंट सही होना प्रोग्रामिंग असाइनमेंट को ठीक से करने में सक्षम होना महत्वपूर्ण है।


कृपया स्व-अध्ययन टैग को प्रश्न में जोड़ें
Dawny33

पहली लॉग पहचान में 2 माइनस साइन एक प्लस होना चाहिए। \: आप के लिए इसे ठीक करने की कोशिश की लेकिन संपादन में कम से कम 6 वर्ण होने की जरूरत है
FatalMojo

जवाबों:


7

CEr^=wi+1j|V|exp(wjTr^)j|V|exp(wjTr^)wj
को रूप में फिर से लिखा जा सकता है। ध्यान दें, रकम दोनों जम्मू द्वारा अनुक्रमित हैं, लेकिन यह वास्तव में 2 अलग-अलग चर होना चाहिए। यह अधिक उपयुक्त जो अनुवाद करने के लिए
CEr^=wi+j|V|(exp(wjr^)j|V|exp(wjTr^)wj)
CEr^=wi+x|V|(exp(wxr^)j|V|exp(wjTr^)wx)
CEr^=wi+x|V|Pr(wordxr^,w)wx

1
प्रासंगिक, वह व्याख्यान 2 में विवरण में उस व्युत्पत्ति पर चला जाता है 2 @ 38:00
फ़ालतोमोज़ो

अलग-अलग चरों द्वारा रकम को क्यों अनुक्रमित किया जाना चाहिए?
यमनको

1
सिर्फ भ्रम से बचने के लिए। गणितीय रूप से इसका मतलब समान है, लेकिन नई राशि जोड़ते समय इंडेक्स लेबल को बदलना अच्छा है।
फैटलमोज़ो सेप
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.