अमेज़ॅन का एलेक्सा , नून्स का मिक्स और फेसबुक का विट.आई सभी एक समान प्रणाली का उपयोग करके यह निर्दिष्ट करते हैं कि टेक्स्ट कमांड को एक इरादे में कैसे परिवर्तित किया जाए - अर्थात ऐसा कुछ जिसे कंप्यूटर समझेगा। मुझे यकीन नहीं है कि इसके लिए "आधिकारिक" नाम क्या है, लेकिन मैं इसे "आशय मान्यता" कहता हूं। मूल रूप से "50% चमक के लिए मेरी रोशनी सेट करें" से जाने का एक तरीका है lights.setBrightness(0.50)
।
जिस तरह से वे निर्दिष्ट किए जाते हैं वह डेवलपर को "नमूना उच्चारण" की एक सूची प्रदान करता है जो एक इरादे से जुड़े होते हैं, और वैकल्पिक रूप से "संस्थाओं" (मूल रूप से पैरामीटर) के स्थानों के साथ टैग किए जाते हैं। यहाँ Wit.ai से एक उदाहरण दिया गया है:
मेरा सवाल है: ये सिस्टम कैसे काम करते हैं? चूँकि वे सभी बहुत समान हैं, इसलिए मैं मानता हूँ कि कुछ ऐसे काम हैं जो वे सभी करते हैं। क्या किसी को पता है कि यह क्या है?
दिलचस्प रूप से हाउंडिफ़ एक अलग प्रणाली का उपयोग करता है जो रीगेक्स की तरह है ["please"] . ("activate" | "enable" | "switch on" | "turn on") . [("the" | "my")] . ("lights" | "lighting") . ["please"]
:। मुझे लगता है कि उनकी आवाज पहचान प्रणाली के बीम खोज में एकीकृत है, जबकि एलेक्सा, Wit.ai और मिक्स में अलग-अलग स्पीच-> टेक्स्ट और टेक्स्ट-> इंटेंट सिस्टम हैं।
संपादित करें: मुझे एक प्रारंभिक बिंदु मिला - मानव के लिए एक तंत्र - अनौपचारिक आवाज कमांड के माध्यम से रोबोट इंटरैक्शन । उक्तियों की तुलना करने के लिए यह अव्यक्त शब्दार्थ विश्लेषण नामक कुछ का उपयोग करता है। मैं उस पर पढ़ने जा रहा हूँ। कम से कम इसने मुझे उद्धरण नेटवर्क में एक शुरुआती बिंदु दिया है।
संपादित करें 2: एलएसए अनिवार्य रूप से पाठ के प्रत्येक पैराग्राफ में इस्तेमाल किए गए शब्दों (शब्दों के बैग) की तुलना कर रहा है। मैं यह नहीं देखता कि यह इस मामले के लिए बहुत अच्छी तरह से कैसे काम कर सकता है क्योंकि यह पूरी तरह से शब्द क्रम खो देता है। हालाँकि इस प्रकार के आदेशों के लिए शायद शब्द क्रम ज्यादा मायने नहीं रखता।
संपादित 3: छिपे हुए टॉपिक मार्कोव मॉडल ऐसे दिखते हैं जैसे वे दिलचस्प हो सकते हैं।