“इरादे पहचानने वाले” कैसे काम करते हैं?


11

अमेज़ॅन का एलेक्सा , नून्स का मिक्स और फेसबुक का विट.आई सभी एक समान प्रणाली का उपयोग करके यह निर्दिष्ट करते हैं कि टेक्स्ट कमांड को एक इरादे में कैसे परिवर्तित किया जाए - अर्थात ऐसा कुछ जिसे कंप्यूटर समझेगा। मुझे यकीन नहीं है कि इसके लिए "आधिकारिक" नाम क्या है, लेकिन मैं इसे "आशय मान्यता" कहता हूं। मूल रूप से "50% चमक के लिए मेरी रोशनी सेट करें" से जाने का एक तरीका है lights.setBrightness(0.50)

जिस तरह से वे निर्दिष्ट किए जाते हैं वह डेवलपर को "नमूना उच्चारण" की एक सूची प्रदान करता है जो एक इरादे से जुड़े होते हैं, और वैकल्पिक रूप से "संस्थाओं" (मूल रूप से पैरामीटर) के स्थानों के साथ टैग किए जाते हैं। यहाँ Wit.ai से एक उदाहरण दिया गया है:

wit.ai उदाहरण है

मेरा सवाल है: ये सिस्टम कैसे काम करते हैं? चूँकि वे सभी बहुत समान हैं, इसलिए मैं मानता हूँ कि कुछ ऐसे काम हैं जो वे सभी करते हैं। क्या किसी को पता है कि यह क्या है?

दिलचस्प रूप से हाउंडिफ़ एक अलग प्रणाली का उपयोग करता है जो रीगेक्स की तरह है ["please"] . ("activate" | "enable" | "switch on" | "turn on") . [("the" | "my")] . ("lights" | "lighting") . ["please"]:। मुझे लगता है कि उनकी आवाज पहचान प्रणाली के बीम खोज में एकीकृत है, जबकि एलेक्सा, Wit.ai और मिक्स में अलग-अलग स्पीच-> टेक्स्ट और टेक्स्ट-> इंटेंट सिस्टम हैं।

संपादित करें: मुझे एक प्रारंभिक बिंदु मिला - मानव के लिए एक तंत्र - अनौपचारिक आवाज कमांड के माध्यम से रोबोट इंटरैक्शन । उक्तियों की तुलना करने के लिए यह अव्यक्त शब्दार्थ विश्लेषण नामक कुछ का उपयोग करता है। मैं उस पर पढ़ने जा रहा हूँ। कम से कम इसने मुझे उद्धरण नेटवर्क में एक शुरुआती बिंदु दिया है।

संपादित करें 2: एलएसए अनिवार्य रूप से पाठ के प्रत्येक पैराग्राफ में इस्तेमाल किए गए शब्दों (शब्दों के बैग) की तुलना कर रहा है। मैं यह नहीं देखता कि यह इस मामले के लिए बहुत अच्छी तरह से कैसे काम कर सकता है क्योंकि यह पूरी तरह से शब्द क्रम खो देता है। हालाँकि इस प्रकार के आदेशों के लिए शायद शब्द क्रम ज्यादा मायने नहीं रखता।

संपादित 3: छिपे हुए टॉपिक मार्कोव मॉडल ऐसे दिखते हैं जैसे वे दिलचस्प हो सकते हैं।


यह पोस्ट विवरणों में इरादे का वर्गीकरण बताती है: mrbot.ai/blog/natural-language-processing/…
znat

यह मेरे प्रश्न में वर्णित "बैग ऑफ वर्ड्स" विधि का उपयोग करता प्रतीत होता है। मूल रूप से वाक्य में केवल वैक्टर शब्द जोड़ें। हालांकि यह नहीं हो सकता है कि यह कैसे काम करता है। Wit और Nuance के इंटरफेस बताते हैं कि वे ऐसी संस्थाओं को पहचानते हैं जो शब्दों का बैग आसानी से नहीं कर सकते। शब्दों का बैग भी सभी ऑर्डर को खो देता है, जैसे "10 पिछले 5 के लिए एक अलार्म सेट करें" "5 पिछले 10 के लिए अलार्म सेट करें" से अप्रभेद्य होगा। कुछ और चल रहा होगा।
टिम्मम्म

इकाई निष्कर्षण एक और समस्या है जहाँ अनुक्रम मायने रखता है। यदि आपके पास बहुत से डेटा हैं तो एक Rnn काम करेगा, छोटे डेटासेट में, जो अक्सर चैटबॉट्स में होते हैं, सशर्त यादृच्छिक फ़ील्ड बहुत अच्छी तरह से काम करते हैं
znat

ठीक है, इसलिए ... मैं "आरएनएन काम करूंगा" की तुलना में अधिक विस्तृत उत्तर की तलाश कर रहा हूं। अधिकांश आधुनिक सीक्वेंस लर्निंग सिस्टम RNN का उपयोग करते हैं ताकि एक दिया हुआ लगता है।
टिम्मम

अभिप्राय वाक्यों के सामान्य अर्थ (वैक्टर के वैक्टर) के बारे में हैं और संस्थाएँ संदर्भ (आसपास के शब्दों) को सीखने के बारे में हैं जिसमें वे दिखाई देते हैं। Rnn या CRF केवल एल्गोरिदम हैं जिनका उपयोग किया जा सकता है क्योंकि वे अनुक्रम से सीखते हैं। यदि आप विस्तार से सीखना चाहते हैं, तो रासा स्रोत कोड
znat

जवाबों:


4

हालांकि सीधे आपके प्रश्न का उत्तर नहीं दिया जा रहा है, फिर भी आप स्वचालित प्रश्न उत्तर के क्षेत्र में रुचि रख सकते हैं । प्राकृतिक भाषा पाठ प्रश्नों के उत्तर देने के लिए उन्हें पहले समझा जाना चाहिए, जो आपकी समस्या के साथ ओवरलैप करता है।

जुराफस्की और मैनिंग द्वारा एक अच्छा संसाधन पाठ्यक्रम है । विशेष रूप से शब्दार्थ और प्रश्न का उत्तर देने वाले सेक्शन में आप जो खोज रहे हैं उसकी मदद मिल सकती है। यहां YouTube पर व्याख्यान वीडियो उपलब्ध हैं


मुझे आपके उत्तर का पहला भाग बहुत ही मज़ेदार जानकारीपूर्ण लगा।
डिएगो

शायद यह एक टिप्पणी के रूप में बेहतर होगा, जैसा कि आप स्वीकार करते हैं, यह सवाल का जवाब नहीं देता है।
kbrose

2

इस पोस्ट में एक दृष्टिकोण है। मूल रूप से वे शब्दों के बैग का उपयोग करते हैं - वे शब्दों को विरल वैक्टर में बदलते हैं और फिर उन्हें जोड़ते हैं।

यह काफी अच्छी तरह से काम करता है, लेकिन एक प्रमुख दोष यह है कि उत्तर शब्द क्रम से स्वतंत्र है, इसलिए आप "एक पाउंड में कितने किलो" जैसे प्रश्न नहीं कर सकते हैं जब तक कि आप उन्हें विशेष मामला न दें।

हालाँकि मैंने एलेक्सा के साथ पाठ किया था और यह शब्द क्रम परिवर्तनों के लिए काफी असंवेदनशील है इसलिए शायद वे भी कुछ इसी तरह का प्रयोग करते हैं।


जिज्ञासु - भोले-भाले डॉक्टरों को नाइवे बेसेसियन के ऊपर क्या फायदा है? भोले-भाले शब्दों की धारणा के साथ मैं दोनों को रैखिक रूप से अलग करने वाली समस्याओं को हल करता हूं
अंगद
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.