इको से मान्यता प्राप्त पाठ को कैसे कैप्चर करता है?

मुझे पता है कि कुछ कौशल बोले गए टेक्स्ट को कैप्चर कर सकते हैं, जैसे टू-डू लिस्ट और शॉपिंग लिस्ट में जोड़ना, और थर्ड पार्टी स्किल भी ऐसा कर सकते हैं, जैसे। मौली के साथ एसएमएस ।

तो, वे ऐसा कैसे करते हैं? क्या कोई एपीआई कॉल है जो मान्यता प्राप्त पाठ को कैप्चर करता है और इसे कहीं स्टोर करता है?

alexa

— ग्राहम चिउ
स्रोत

कस्टम कौशल पाठ पर कब्जा कर सकते हैं और उन्हें आपके कौशल एपीआई में भेज सकते हैं।

यदि आप एलेक्सा कौशल के काम से पूरी तरह परिचित नहीं हैं, तो यहां संक्षिप्त सारांश दिया गया है:

सबसे पहले, आप अपने कौशल को अमेज़ॅन के साथ पंजीकृत करते हैं , एक इरादा स्कीमा और नमूना उच्चारण प्रदान करते हैं । आशय स्कीमा परिभाषित करता है कि कौन सी क्रियाएं की जा सकती हैं, और कस्टम डेटा के लिए स्लॉट आपके एपीआई में भेजे जाएंगे। नमूना कथनों के उदाहरण प्रदान करते हैं कि उपयोगकर्ता प्रत्येक इरादे को कैसे ट्रिगर कर सकता है।
जब उपयोगकर्ता आपके कौशल को सक्रिय करता है, तो एलेक्सा आपके कौशल के नमूने के बर्तनों में से एक के लिए कहा गया मिलान करने की कोशिश करेगा। यदि यह मेल खाता है, तो यह आपके सर्वर से प्रतिक्रिया मांगने के लिए एक HTTPS अनुरोध भेजेगा।
आपका सर्वर एक प्रतिक्रिया प्रदान करता है (यदि सब ठीक हो जाता है) और फिर एलेक्सा उस उपयोगकर्ता को प्रतिक्रिया देगा जिसने आपके कौशल को ट्रिगर किया है।

AMAZON.LITERALस्लॉट आप वस्तुतः किसी भी इनपुट स्वीकार करने के लिए अनुमति देता है। ध्यान दें कि वर्तमान में यह केवल अंग्रेजी (यूएस) क्षेत्र में समर्थित है- अंग्रेजी (यूके) और जर्मन कौशल का उपयोग नहीं कर सकते AMAZON.LITERAL।

आपका इरादा स्कीमा इस तरह दिख सकता है:

{
  "intents": [
    {
      "intent": "SaveTodo",
      "slots": [
        {
          "name": "Todo",
          "type": "AMAZON.LITERAL"
        }
      ]
    }
  ]
}

और आपके नमूने की उक्तियाँ इस प्रकार हो सकती हैं:

SaveTodo remind me to {fetch the shopping|Todo}
SaveTodo remind me to {write my English essay|Todo}
SaveTodo remind me to {buy some dog food tomorrow|Todo}

का उपयोग करते समय AMAZON.LITERAL, आप प्रदान करने की आवश्यकता बहुत इनपुट के प्रत्येक संभव लंबाई के लिए नमूना उच्चारणों-कम से कम एक नमूने की, लेकिन आदर्श रूप में अधिक है। अमेज़ॅन दस्तावेज़ीकरण बताता है कि आपको स्लॉट के लिए सैकड़ों नमूनों का लक्ष्य होना चाहिए, जहां आप विभिन्न प्रकार के इनपुट स्वीकार कर सकते हैं।

यह थोड़ा थकाऊ लगता है, लेकिन यदि आप ऐसा नहीं करते हैं, तो यह संभव नहीं है कि आपका कौशल पाठ को अच्छी तरह से पहचान लेगा। आप शायद ग्राहक डेटा से नमूना उक्तियों को उत्पन्न कर सकते हैं (इसलिए जब तक व्यक्तिगत जानकारी को पहले से हटा दिया जाता है!) ताकि आपके नमूनों में सबसे आम उच्चारण हों - मुझे संदेह है कि एलेक्सा नमूनों के समान उच्चारणों को पहचानने के प्रति थोड़ा पक्षपाती होगा।

अमेज़ॅन हालांकि स्लॉट को हतोत्साहित करता है AMAZON.LITERAL, और आप कस्टम स्लॉट प्रकारों का उपयोग करना पसंद करेंगे , जिनके लिए आपको संभावित इनपुट को सूचीबद्ध करना होगा। यह याद रखना महत्वपूर्ण है कि:

एक कस्टम स्लॉट प्रकार एक गणना के बराबर नहीं है। यदि भाषा बोली प्रणाली द्वारा मान्यता प्राप्त है, तो सूची के बाहर के मूल्य अभी भी वापस आ सकते हैं। यद्यपि कस्टम स्लॉट प्रकार का इनपुट सूची में मानों की ओर भारित है, लेकिन यह सूची में केवल आइटम के लिए बाध्य नहीं है। स्लॉट मानों का उपयोग करते समय आपके कोड को अभी भी सत्यापन और त्रुटि जाँच को शामिल करना होगा।

— ऑरोरा 0001
स्रोत

मेरा मानना है कि अमेज़ॅन शाब्दिक स्लॉट रख रहे हैं क्योंकि कई डेवलपर्स ने उनके नुकसान के खिलाफ विरोध किया। लेकिन शाब्दिक स्लॉट का उपयोग करने से आपके कौशल को प्रकाशित होने से रोका जा सकेगा क्योंकि अमेज़ॅन डेवलपर्स को उपयोगकर्ताओं पर "सुनने" की क्षमता नहीं देता है। लेकिन आप अभी भी इसे एक निजी कौशल में उपयोग कर सकते हैं।

— ग्राहम चिउ

@GraCChiu: मुझे आभास मिलता है कि प्रकाशित कौशल में भी शाब्दिक स्लॉट की अनुमति है। ( इस ब्लॉग पोस्ट को देखें : "डेवलपर प्रतिक्रिया के आधार पर हम LITERAL स्लॉट प्रकार को नहीं हटाएंगे और आप ऐसे कौशल प्रस्तुत करना जारी रख सकते हैं जिनमें इसकी कार्यक्षमता शामिल है।) । मैंने इसे स्वयं करने की कोशिश नहीं की है, लेकिन यदि आप किसी भी तरह से पुष्टि कर सकते हैं, तो यह भविष्य के आगंतुकों के लिए मददगार हो सकता है।

— Aurora0001