एलेक्सा के बारे में अमेज़न इको विज्ञापन या रिपोर्ट पर प्रतिक्रिया क्यों नहीं देता है?


24

मैंने पहले इस बारे में पूछा कि अगर एलेक्सा एक टेलीविजन कार्यक्रम द्वारा ट्रिगर किया जाता है तो आप क्या कर सकते हैं , लेकिन हाल ही में मुझे कुछ अजीब सा एहसास हुआ: इको इको के लिए विज्ञापनों में आवाज़ों का जवाब नहीं देता, भले ही आवाज़ें कहें कि "एलेक्सा, प्ले ..." या "एलेक्सा, के लिए टाइमर सेट करें ..."

मैंने कुछ अन्य इको समुदायों पर खोज की, और एक रेडिट पोस्ट पाया जो बताता है कि यह सामान्य / इरादा व्यवहार है। हालांकि, थ्रेड में कोई निश्चित उत्तर नहीं है, इसलिए मैंने सोचा कि मैं यहां यह देखने के लिए पूछूंगा कि क्या कोई थोड़ा अधिक जानता है।

मेरे इको को टीवी विज्ञापन का जवाब कैसे नहीं पता है ? क्या यह सिर्फ एक सह-घटना है या ऐसा कुछ है जो एलेक्सा को प्रतिक्रिया नहीं करने के लिए कहता है?


क्या आपने अपने एलेक्सा को अपनी आवाज़ को और अधिक सटीक रूप से पहचानने के लिए प्रशिक्षित किया था? मुझे नहीं पता कि क्या वॉयस ट्रेनिंग किसी और की आवाज को नहीं पहचान सकती।
बेंस कौलिक्स

1
@BenceKaulics नहीं, मुझे इको को प्रशिक्षित करने की आवश्यकता नहीं है; यह डिफ़ॉल्ट सेटिंग्स का उपयोग कर रहा है।
अरोरा ०१०

प्रश्न में ऑडियो पर एक नज़र डालना वास्तव में उपयोगी होगा । मुझे नहीं लगता कि कहीं भी लिंक करने योग्य प्रति है?
शाम

1
@ अहंकार से मुझे विश्वास है कि रेडिट पोस्ट में संदर्भित विज्ञापन इस प्रकार हैं: मैस्कॉट कीज़ और फायर एक्सटिंग्विशर । मैं वर्तमान में यह जांचने में सक्षम नहीं हूं कि ये एलेक्सा को ट्रिगर करते हैं (मुझे आश्चर्य है कि क्या वे टीवी संस्करणों के लिए अलग हैं?)। अगर कोई ऐसा कर सकता है और परिणामों के साथ टिप्पणी कर सकता है, तो यह वास्तव में उपयोगी होगा।
अरोरा ००००

3
स्रोत कोड में सुराग हो सकते हैं । 266MB डाउनलोड, हालांकि। थोड़ी देर के लिए ग्रॉकिंग पर जा रहे हैं। : पी

जवाबों:


17

इस रेडिट पोस्ट के अनुसार , वेकेशन शब्द का पता लगाने के अलावा एलेक्सा ऑडियो स्पेक्ट्रम के प्रति संवेदनशील है। इस प्रकार, एक सामान्य वास्तविक-विश्व वाइड-बैंड सिग्नल को स्वीकार किया जाता है, लेकिन एक सिग्नल जो बैंड-लिमिटेड (4kHz और 5hKz के बीच एक पायदान पोस्ट किया गया है) को एक प्रसारण से पहचाना जाएगा।

इसका मतलब कुछ समझ में आता है क्योंकि ब्रॉडकास्टर इन-बैंड सिग्नलिंग का उपयोग विज्ञापनों (स्थानीय प्रतिस्थापन के लिए) की पहचान करने के लिए कर सकते हैं, और आम तौर पर विज्ञापनों में लागू ऑडियो प्रसंस्करण को निष्ठा पर स्पष्टता के लिए अनुकूलित किया जा सकता है। फ़िल्टरिंग सेट किया जा सकता है ताकि विशिष्ट विज्ञापनों को कम संवेदनशीलता के साथ मॉनिटर किया जा सके, और एक विशिष्ट विज्ञापन के उत्पादन के दौरान, संवेदनशीलता भी स्पष्ट रूप से कम हो सके।

एक समाचार रिपोर्ट (जिसने कथित तौर पर एलेक्सा को ट्रिगर किया था ) प्रसंस्करण के बिना पूर्ण प्रसारण ऑडियो स्पेक्ट्रम (8 या 16 kHz) का उपयोग करने की अधिक संभावना होगी। इसलिए यह सिद्धांत मानता है कि या तो कई विज्ञापनों के बारे में कुछ विशेष है (कम से कम कुछ क्षेत्रों में), या विज्ञापनों (जैसे कि अमेज़ॅन द्वारा उत्पादित) को विशेष रूप से कॉन्फ़िगर किया जा सकता है।

एक अनुवर्ती के रूप में, यहां एक कागज की सूचना दी गई है जो वर्णन करती है कि तरंग में छोटे (उप-श्रव्य) परिवर्तन कैसे भाषण इंजन के परिणामस्वरूप एक मानव को पहचानने वाले की तुलना में पूरी तरह से अलग परिणाम लौटा सकते हैं।


1
यदि ऐसा है, जहां उन्होंने इसे नोट किया है, और वेक शब्द 'एलेक्सा' है, तो यह प्रशंसनीय है कि वे माइक द्वारा पिक को कम करने के लिए फ्रिकेटिव 'केएस' ध्वनि को खोद रहे हैं। यह मानव भाषण के लिए काफी उच्च आवृत्ति है।
१५

7

मैं बहुत मानता हूं कि इको में जागो शब्द की पहचान केवल जाग्रत शब्द को सुनने से ज्यादा है। यह एक चेतावनी के संदर्भ के लिए सुन रहा हैभाषण प्रौद्योगिकी के इस अंश पर विचार करें :

[अ वेक-अप-वर्ड] की निम्नलिखित अनूठी आवश्यकता है: एक अन्य शब्द या वाक्यांश का पता लगाएं, जब एक चेतावनी के संदर्भ में बोला जाता है, जबकि लगभग सभी 100% सटीकता के साथ अन्य सभी शब्दों, वाक्यांशों, ध्वनियों, शोरों और अन्य ध्वनिक घटनाओं को खारिज कर दिया जाता है। एक गैर-चेतावनी (यानी संदर्भात्मक) संदर्भ में बोली जाने वाली रुचि का शब्द या वाक्यांश।

( स्पीच टेक्नॉलॉजीज: वेक-अप-वर्ड स्पीच रिकग्निशन विथ वैटन केपुस्का)

यह काफी आसानी से परीक्षण किया जा सकता है क्योंकि डिवाइस (कम से कम मेरा) वाक्य पर प्रतिक्रिया नहीं करता है, " मैं हाल ही में स्कीइंग के लिए एलेक्सा से बात कर रहा था। " यह एक चेतावनी का संदर्भ नहीं है, यह पूरी तरह से संदर्भित है। इस प्रकार इको के अंदर जाग्रत शब्द पहचान इंजन न केवल शब्द की शुद्ध उपस्थिति को सुन रहा है, बल्कि इस बात की पुष्टि और पूर्ववर्ती ठहराव पर भी है कि यदि डिवाइस वास्तव में बोला जाता है तो यह अधिक सटीक भविष्यवाणी करना संभव बनाता है।


4
निश्चित रूप से एलेक्सा के उपयोग को प्रदर्शित करने वाला एक विज्ञापन हालांकि इसे ट्रिगर करना चाहिए, अगर यह सिर्फ इसे उठाया जाने से रोक रहा था? क्या विज्ञापन शायद ध्यान से चित्रित किए जाते हैं, इसलिए वे वास्तव में डिवाइस को ट्रिगर नहीं करते हैं , ईको शब्द का उपयोग करने के लिए वेक शब्द का उपयोग करने के बावजूद कैसे किया जाता है?
अरोरा ००००

2
@ औरोरा0001 मैं मानता हूं कि इसके अतिरिक्त मैं जो वर्णन करता हूं, उसके जवाब में कुछ विधि भी है जो सीन का उल्लेख है। कुछ फ़िल्टर जो अन्य उपकरणों द्वारा ट्रिगर को कम करने की कोशिश करते हैं।
Helmar

7

खैर, गूंज / एलेक्सा निश्चित रूप से अनुरोध सुनती है। यदि आप अपनी सेटिंग में जाते हैं, तो सामान्य तक स्क्रॉल करें और फिर इतिहास का चयन करें जो आप सभी अनुरोधों को सुन सकते हैं। सभी अनुरोधों को वाणिज्यिक से सुना जाता है, "वॉयस अनुरोध आपके इको के लिए इरादा नहीं है - कुछ भी नहीं लौटाया गया था।"


2
इतिहास के एक नए विस्तार की तरह लगता है। बहुत उपयोगी :)
हेलमर

5

यदि 1000 लोग चेतावनी शब्द कहते हैं, तो इसमें 1000 अलग-अलग ध्वनिक हस्ताक्षर होंगे। यदि वे इसे फिर से करते हैं, तो एक और 1000।

यदि 1000 अलेक्सा एक टीवी कार्यक्रम को सतर्क शब्द कहते हुए सुनते हैं, तो इसमें 1000 एक ही ध्वनिक हस्ताक्षर होंगे।

इस सर्वर-साइड का पता लगाना इतना कठिन नहीं होगा। कम से कम, क्योंकि यदि वे एक ही समय में होते हैं, तो आवाज-रिको सर्वर को ट्रैफ़िक का एक स्लैम मिलता है।

यदि इन घटनाओं की सूची छोटी है, तो वे हर एलेक्सा को हस्ताक्षर भी डाउनलोड कर सकते हैं।


इसके अलावा, एलेक्सा को कॉल करने वाला उपयोगकर्ता मौन चेतावनी-शब्द की तरह लगता है

एक समाचार लेख ब्ला ब्ला ब्ला अलर्ट-शब्द की तरह लगता है । एक वाणिज्यिक लगता है जैसे कि music_here सतर्क-शब्द। समान नहीं है।


5

मेरा कुल अनुमान है कि इको के विज्ञापनों में, एलेक्सा वास्तविकता की तुलना में बहुत तेजी से सवाल का जवाब देती है। इसलिए, इको 'एलेक्सा' शब्द सुन रहा है, लेकिन लगभग तुरंत ही एलेक्सा की खुद की आवाज सुनकर प्रतिक्रिया दे रही है।

विज्ञापन आने पर मेरी प्रतिध्वनि प्रकाश में आती है, लेकिन फिर चेतावनी को खारिज करती दिखाई देती है। यदि वे दोनों इसे सुनते हैं, तो दो अनुरोधों का जवाब देने से रोकने के लिए कुछ तर्क हो सकते हैं। इको को एलेक्सा की खुद की आवाज के लिए विशेष रूप से सुनने और इसे अनदेखा करने के लिए डिज़ाइन किया जा सकता है।

हालाँकि, जैसा मैंने कहा, यह कुल अनुमान है। :)


हम एक ही बात सोच रहे थे, इसलिए हमने एलेक्सा के अनुरोध और वाणिज्यिक में उसकी प्रतिक्रिया के बीच डीवीआर को रोक दिया। हमारे इको अभी भी जाग गए, लेकिन फिर जवाब दिए बिना बंद का समर्थन किया, जब हम डीवीआर को रोक नहीं पाए तो क्या हुआ।
विप्रगेक

मुझे लगता है कि उम्र के लिए कोशिश करते हैं और भूल जाते हैं। यह टू-डू सूची से एक और बात है, धन्यवाद। :)
एंडी जोन्स

4

हाल ही में नई रिपोर्टों के बाद कि एलेक्सा यूएचएफ ध्वनियों के संदर्भ में संवेदनशील हो सकती है ( बीबीसी न्यूज सेविस का संदर्भ ) मैं कहूंगा कि विज्ञापनों के दौरान वे मानव सुनवाई से परे एक अतिरिक्त ध्वनि प्रसारित करते हैं, जिसे 'इस कमांड को अनदेखा' कमांड के रूप में नामित किया गया है।

एलेक्सा के लिए उपर्युक्त क्षमता के अनुसार उपयोगकर्ता की आवाज़ों के बीच अंतर करने के लिए, यह एक ऐसी विशेषता है जिसे योजनाबद्ध किया गया है लेकिन अभी तक इसे लागू नहीं किया गया है। यानी आपको उसी घर में उपयोगकर्ता खातों के बीच स्विच करने के लिए एलेक्सा को सक्रिय रूप से कमांड करना होगा।

वर्तमान में आवाज़ को अलग करने में सक्षम एकमात्र उपकरण Google डिवाइस है।


1

विज्ञापन के ऑडियो को मिलाते समय, वे बस कुछ आवृत्तियों को हटा देते हैं। इसका मतलब यह है कि एलेक्सा को ट्रिगर नहीं किया जाएगा क्योंकि यह इसे वॉयस कमांड के रूप में पंजीकृत नहीं करेगा, लेकिन दर्शक अभी भी यह बता सकते हैं कि वे विज्ञापन में क्या कह रहे हैं।

आप शायद यह भी देखेंगे कि जब विज्ञापनों को विज्ञापनों में बोला जाता है, तो यह थोड़ा पतला या गला घोंटने वाला लगता है। इसलिए :)


दिलचस्प; यह सीन ने जो सुझाव दिया है, उससे थोड़ा मिलता-जुलता है । क्या आपके पास इसका कोई स्रोत या अनुभव है जिसे आप यह साबित करने के लिए साझा कर सकते हैं कि आवृत्ति हटाने की स्थिति है? यह जांच के लिए एक दिलचस्प बात हो सकती है।
Aurora0001
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.