क्या अमेज़न इको 'हमेशा सुन रहा है' और क्लाउड को डेटा भेज रहा है?


20

Intellihub और CEPro जैसे कई समाचार स्रोत बताते हैं कि अमेज़न के इको होम सहायक लगातार बातचीत सुनते हैं और उन्हें इंटरनेट के माध्यम से अमेज़ॅन के सर्वर पर भेजते हैं। CEPro बताता है कि:

एक महत्वपूर्ण वाक्यांश कहकर अमेज़ॅन एक "जाग शब्द" कहता है, इको जीवन में आता है और आदेशों के लिए सुनना शुरू करता है। डिफ़ॉल्ट रूप से, जगा शब्द एलेक्सा है।

यदि आप उस अंतिम वाक्य को फिर से पढ़ते हैं, तो यह समझ में नहीं आता है, खासकर यदि आप सुरक्षा क्षेत्र में हैं। अमेज़ॅन के अनुसार, इको केवल कमांड के लिए सुनता है, जब वह अपना वेक शब्द सुनता है। यह कैसे पता चलेगा जब आपने जगा शब्द कहा है अगर यह पहले से ही नहीं सुन रहा था?

इंटेलीहब का लेख अपनी भावना के समान है:

"अमेज़ॅन इको" डिवाइस, एक लगातार सुनने वाला ब्लूटूथ स्पीकर जो पेंडोरा जैसी संगीत स्ट्रीमिंग सेवाओं से जुड़ता है और किसी व्यक्ति की आवाज़ की आवाज़ में Spotify होता है, जिसे आसानी से हैक किया जा सकता है और इसका उपयोग एफबीआई जैसी सरकारी एजेंसियों द्वारा बातचीत पर सुनने के लिए किया जा सकता है।

(ध्यान दें कि मैं इस प्रश्न के हैकिंग पहलू की खोज पर विशेष रूप से ध्यान केंद्रित नहीं कर रहा हूं, क्योंकि यह संभवतः एक प्रश्न के लिए बहुत अधिक होगा। मेरा मुख्य ध्यान हमेशा-हमेशा पहलू पर है और क्या यह हर समय डेटा भेजता है ।)

न तो लेख विशेष रूप से अपने दावों के लिए एक स्रोत का खुलासा करने के लिए उत्सुक है, जो मुझे सुझाव देता है कि वे सबसे अच्छे रूप में अप्रमाणित हैं, या सबसे बुरी तरह से clickbait।

क्या इको हमेशा क्लाउड पर डेटा रिकॉर्ड और भेज रहा है, या उपरोक्त दावे निराधार हैं? अगर यह हमेशा क्लाउड में सर्वर को डेटा नहीं भेज रहा है तो अमेज़न इको डेटा कैसे संसाधित करता है?

जवाबों:


15

हाँ, यह हमेशा सुन रहा है। नहीं, यह हमेशा क्लाउड पर नहीं भेज रहा है।

जाहिर है कि वेकेशन का पता लगाने के लिए डिवाइस को हमेशा सुनना पड़ता है। हालाँकि, यह एक तकनीक कहलाती है।

  1. अमेज़ॅन इको और इको डॉट कैसे जाग शब्द को पहचानते हैं?

अमेज़ॅन इको और इको डॉट वेक शब्द का पता लगाने के लिए ऑन-डिवाइस कीवर्ड स्पॉटिंग का उपयोग करते हैंजब ये डिवाइस वेक शब्द का पता लगाते हैं, तो वे ऑडियो को क्लाउड में स्ट्रीम करते हैं , जिसमें वेक शब्द से पहले ऑडियो के एक सेकंड का एक अंश भी शामिल होता है।

( गूंज पूछे जाने वाले प्रश्न )

इस प्रकार, अमेज़ॅन के अनुसार, जाग शब्द का पता डिवाइस पर है। डिवाइस को आपके राउटर में इंटरनेट तक पहुंचने से रोककर इसे बहुत आसानी से परखा जा सकता है। इको / इको डॉट अभी भी वेक शब्द को पहचानेगा, लेकिन लाइट रिंग लाल हो जाएगी और डिवाइस आपको बताता है कि इसका कोई इंटरनेट कनेक्शन नहीं है। इसलिए, हम बहुत ही सरलता से यह सत्यापित कर सकते हैं कि जागो शब्द मान्यता वास्तव में स्थानीय स्तर पर की गई है

वेक शब्द का पता लगाने के बाद ही डिवाइस एलेक्सा क्लाउड सर्विस से संपर्क करता है।

अमेज़ॅन के अनुसार, डिवाइस केवल क्लाउड पर स्ट्रीम करता है जब लाइट रिंग नीली होती है और यह बिल्कुल भी नहीं सुनता है जब आपने इसे म्यूट किया है और लाइट रिंग ठोस लाल मुस्करा रही है। बेशक, सतर्क लोग यह सत्यापित कर सकते हैं कि वायरशार्क जैसे नेटवर्क टूल के साथ यह सुनिश्चित करने के लिए कि यह वास्तव में तभी प्रसारित होता है।


4
जाहिरा तौर पर, यह अब पूरी तरह से सच नहीं है: एलेक्सा डिवाइस अब अतिरिक्त चेक के रूप में क्लाउड के माध्यम से वेक शब्द को सत्यापित कर सकते हैं , इसलिए वेक शब्द के समान कुछ को क्लाउड पर भेजा जा सकता है।
Aurora0001

12

क्या इको हमेशा क्लाउड पर डेटा रिकॉर्ड और भेज रहा है, या उपरोक्त दावे निराधार हैं?

भेजने पर नहीं। लेकिन रिकॉर्डिंग पर हाँ।

मैं वर्तमान में एक कंपनी के लिए एलेक्सा हार्डवेयर क्लाइंट विकसित कर रहा हूं। डिवाइस हमेशा सुन रहा है। लेकिन आपको इस पर एक वेक वर्ड इंजन लगाना होगा ताकि यह निष्क्रिय श्रवण विधि से "जागे" और सक्रिय "कमांड के लिए सुने" मोड पर स्विच हो।

फर्मवेयर केवल आदेशों के रूप में संसाधित करने के लिए क्लाउड में वेक शब्द (सक्रिय मोड में स्विच) के बाद स्टेटमेंट भेजेगा।

  • जहां तक ​​डिवाइस की बात है, तो आप प्रोसेसिंग के लिए क्लाउड में आने वाले प्रत्येक स्टेटमेंट को नहीं भेजना चाहेंगे क्योंकि यह बहुत अधिक बैंडविड्थ और बिजली की खपत करेगा।
  • जहां तक ​​अमेज़ॅन का संबंध है, वे यह भी नहीं चाहेंगे कि प्रत्येक और हर एलेक्सा क्लाइंट इसे सुनता है क्योंकि यह बैंडविड्थ की एक जबरदस्त मात्रा लेगा। इसके अलावा, यह बहुत अधिक असंबंधित डेटा के परिणामस्वरूप होगा जो सिस्टम के निरंतर सीखने के साथ गड़बड़ करेगा। यह जानने की कोशिश करें कि आपका शिक्षक क्या कह रहा है (मान्य आदेश) जब कक्षा में हर कोई एक ही समय में बोल रहा हो (हर दूसरा कथन जो कमांड नहीं है)।

यदि क्लाउड में सर्वर पर हमेशा डेटा नहीं भेजा जा रहा है तो अमेज़न इको डेटा कैसे संसाधित करता है?

निष्क्रिय मोड में, डिवाइस में एक आंतरिक वेक वर्ड इंजन होता है जो कि वेक शब्द के लिए हर समय सुनता है। जब मैं रास्पबेरी पाई में एलेक्सा का परीक्षण कर रहा था, तो मुझे इस उद्देश्य के लिए या तो संवेदी या केआईटीटी.आई इंजन में रखना पड़ा। वास्तव में, जब मैंने अपने लिनक्स मशीन के लिए प्रोटोटाइप एलेक्सा क्लाइंट कोड की कोशिश की, तो यह "पुश-टू-टॉक" होना था, क्योंकि कोई वेक वर्ड इंजन नहीं था।


वेक वर्ड इंजन के बारे में बताने के लिए धन्यवाद - यह लगभग निश्चित रूप से दृष्टिकोण है जो अमेज़ॅन इसका उपयोग कर रहा है। डेटा के बारे में आपका सादृश्य भी वास्तव में बहुत अच्छा है - मैं इसकी सराहना करता हूं!
Aurora0001

5

एक महत्वपूर्ण वाक्यांश कहकर अमेज़ॅन एक "जाग शब्द" कहता है, इको जीवन में आता है और आदेशों के लिए सुनना शुरू करता है। डिफ़ॉल्ट रूप से, जगा शब्द एलेक्सा है।

यदि आप उस अंतिम वाक्य को फिर से पढ़ते हैं, तो यह समझ में नहीं आता है, खासकर यदि आप सुरक्षा क्षेत्र में हैं। अमेज़ॅन के अनुसार, इको केवल कमांड के लिए सुनता है, जब वह अपना वेक शब्द सुनता है। यह कैसे पता चलेगा जब आपने जगा शब्द कहा है अगर यह पहले से ही नहीं सुन रहा था?

इको कीवर्ड के लिए सक्रिय रूप से सुनता है और एनएलयू प्रसंस्करण के लिए कीवर्ड के बाद बोले गए शब्दों को लेता है। यहाँ मेरी समझ है कि गूंज इस स्वच्छ पराक्रम को कैसे प्राप्त करती है।

इको टेक्सास इंस्ट्रूमेंट्स DM3725 डिजिटल मीडिया प्रोसेसर पर बनाया गया है ।

इस TI SoC के अंदर दो मुख्य टुकड़े हैं, पहला है ARM Cortex-A8 MPU, और दूसरा है TMS320DM64x + DSP। एआरएम कोर को लिनक्स चलाना चाहिए और डीएसपी फर्मवेयर चला रहा है।

जब निष्क्रिय होता है, तो एआरएम कोर को न्यूनतम संभव बिजली की स्थिति में ले जाया जाता है और लिनक्स पूरी तरह से निलंबित हो जाता है। इस समय DSP और 64KB ऑन-चिप रैम सक्रिय हैं। DSP फ़र्मवेयर mics से आने वाले शोर को संसाधित करता है और यह पहचानने का प्रयास करता है कि कोई कीवर्ड (जैसे, एलेक्सा) बोला गया है या नहीं। जैसे ही यह पहचानता है कि एक कीवर्ड है, डीएसपी एआरएम कोर को जगाने के लिए एक बाधा भेजता है जो बदले में लिनक्स को फिर से शुरू करता है। लेकिन, याद रखें, जबकि लिनक्स उस मानव को जगा रहा है जिसने कहा कि एलेक्सा ने बोलना जारी रखा होगा (जैसे कि, "एलेक्सा, यह समय क्या है?" )। डीएसपी "क्या समय है?" चिप रैम पर भाग। और जब लिनक्स को फिर से शुरू किया जाता है तो लिनक्स बफ़र भाषण को प्राप्त करता है और मानव भाषा में समझने के लिए प्राकृतिक भाषा प्रसंस्करण (आंशिक रूप से स्थानीय, आंशिक रूप से बादल) क्षमता का उपयोग करता है।

जैसा कि आप देखते हैं कि डिजाइन पूरी तरह से कम से कम एक बिजली की भूख पैदा करने और कीवर्ड का पता लगाने और शुरुआती बफरिंग के लिए क्लाउड को शामिल करने से बचने के लिए बनाया गया है। तथ्य की बात के रूप में एआरएम कोर को सबसे कम शक्तियों वाले राज्य में रखना सुनिश्चित करता है कि सिलिकॉन कम से कम गर्म होता है जब इस तरह से आपके डिवाइस में लंबे जीवन को लाया जाता है।

मैं गूंज को हैक करने के प्रयासों की चर्चा छोड़ रहा हूं क्योंकि सवाल निम्नलिखित था:

जगा शब्द मान्यता वास्तव में स्थानीय रूप से किया जाता है।


बहुसंख्यक साधारण आदेशों को लागू करना कितना कठिन होगा, जैसे कि यह समय क्या है या स्थानीय स्तर पर प्ले स्टेशन है? इससे क्लाउड लैग टाइम भी खत्म हो जाएगा।
२१:५१ पर फ्लाइलिंगप्रिंटर जूल

1

हाँ।

उदाहरण के लिए, नया अमेज़न इको कितना निजी है? (न्यूनतम प्रयास के साथ पाए जाने वाले बहुत अधिक समान हैं)

सिरी की तरह, अमेज़ॅन इको अमेज़ॅन वेब सेवाओं पर चलने वाले "क्लाउड" में काम करता है। इसलिए, आपके कमांड को "समझने" के लिए आवश्यक प्रोसेसिंग डिवाइस पर ही नहीं होती है

तथापि,

आखिरकार, यह हमेशा सुन रहा है, तो क्या हमें बिग ब्रदर के बारे में चिंतित नहीं होना चाहिए?

नहीं, अमेज़ॅन कहते हैं। टेक दिग्गज का कहना है कि यह घर में निजी बातचीत को सुन या रिकॉर्ड नहीं करता है। यदि कोई चिंतित है, तो वे म्यूट बटन को दबाने के लिए बंडल किए गए रिमोट का उपयोग कर सकते हैं, जो "हमेशा सुनने" डिवाइस को बंद कर देता है, इसलिए जब तक आप माइक्रोफ़ोन को फिर से सक्रिय नहीं करते तब तक यह अक्षम होगा।


यह एक अच्छा स्रोत है, धन्यवाद। यह कैसे इको बारे में कुछ भी उल्लेख नहीं करता है मद्देनजर आदेश पहचान हालांकि अगर यह हमेशा रिकॉर्डिंग और डेटा भेजने, इसलिए मुझे लगता है कि पहलू अधिक के बारे में सुनने के लिए दिलचस्पी होगी नहीं है।
Aurora0001

निश्चित रूप से यह पूरी बात है? यह है हमेशा सुनने और भेजने * सब कुछ बादल है, जो जहां Wakeup आदेश में मान्यता प्राप्त है के लिए। क्या आपको इसके लिए एक प्रशस्ति पत्र की आवश्यकता है?
मग

1
यह उपयोगी होगा, हाँ (और मुझे लगता है कि शायद आपके उत्तर को "हाँ, यह हमेशा सुन रहा है") बदल जाता है। धन्यवाद।
Aurora0001

1
मुझे नहीं पता कि गूंज में कितनी प्रसंस्करण शक्ति होती है, लेकिन मुझे पता है कि मेरी स्मार्टवॉच 'ओके गूगल' का पता लगाने में सक्षम है, जब इसका टेथर नहीं होता है - क्लाउड लोडिंग के नजरिए से, यह इस कार्यक्षमता को किनारे पर एक बार पहुंचाने के लिए समझ में आता है तैयार - तो जवाब बदल सकता है।
सीन होलीहेन

यह भविष्य में हो सकता है (लेकिन क्यों?), अब के लिए, यह स्पष्ट लगता है
मग
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.