मैं उबंटू पर एंड्रॉइड द्वारा उपयोग की जाने वाली आवाज पहचान का उपयोग कैसे कर सकता हूं?


16

अगर मैं एक एंड्रॉइड ऐप विकसित कर रहा हूं जो टीटीएस और वॉयस रिकग्निशन का उपयोग करता है, तो कौन सी लाइब्रेरी उबंटू पर एक ही वॉयस रिकॉग्निशन और स्पीच के लिए उपयोग की जाती हैं?

मैं भाषण के लिए पाठ के लिए जासूसी कर रहा हूं, लेकिन मैं अनिश्चित हूं कि आवाज मान्यता पुस्तकालय और शब्दकोश / सीखने / अंशांकन प्रणाली का उपयोग आवाज की पहचान के लिए किया जाता है।

मैं उबंटू डेस्कटॉप पर ऐप उपलब्ध कराना पसंद करता हूं।
साथ ही एक एमुलेटर के बाहर इसका परीक्षण करें


इसकी जाँच करें, लेकिन कोई ठोस जवाब नहीं है
devav2

@ devav2 प्रयास के लिए धन्यवाद, लेकिन वास्तव में संबंधित नहीं है। वॉयस लॉगिन और कौन सा वॉयस रिकग्निशन टूलकिट एंड्रॉइड पर उपयोग किया जाता है (और अगर यह उबंटू में उपलब्ध है) दो पूरी तरह से अलग चीजें हैं।
रोबॉटहंसन

आपको शायद यह पता लगाने की आवश्यकता होगी कि एंड्रॉइड का उपयोग करने वाले पुस्तकालयों में कहीं और क्या है, फिर यहां वापस आएं और पूछें कि उन्हें उबंटू में कैसे उपयोग करना है। यदि आप इसे एंड्रॉइड डॉक्यूमेंटेशन में नहीं पा रहे हैं, तो एंड्रॉइड उत्साही या स्टैक ओवरफ्लो मदद कर सकता है।
ændrük

एंड्रॉइड के साथ इसका उपयोग करने के बारे में निश्चित नहीं है, लेकिन फेस्टिवल / फेस्टवॉक्स जासूसी की तुलना में बहुत कम रोबोट लगता है। भाषण मान्यता के लिए, en.wikipedia.org/wiki/… मदद कर सकता है।
एडम

ठीक है, अब उबंटू उबंटू डेस्कटॉप पर मानक आता है ... इसलिए कोई निर्भरता नहीं जोड़ा गया है। दूसरी ओर, cststral से भुगतान किए गए पैकेज भयावह रूप से महंगे नहीं हैं और वे स्कीकी पर सीमा बनाते हैं।
रोबॉटहुम्स

जवाबों:


5

आप अपने एप्लिकेशन के लिए Google की webspeech API का उपयोग कर सकते हैं । यह उसी तकनीक का उपयोग करता है जैसा कि एंड्रॉइड पर उपयोग किया जाता है।


यदि आप थोड़ा और डेटा में संपादित करते हैं, तो मैं इसे एक के रूप में अच्छी तरह से स्वीकार
करूँगा

ईमानदारी से, मुझे आपको जानकारी देने के लिए उनके एपीआई के साथ पर्याप्त अनुभव नहीं है!
इशिता


1
  1. एंड्रॉइड आवाज की पहचान एक इंटरनेट कनेक्शन पर निर्भर करती है, क्योंकि सर्वर में आवाज पैटर्न का पर्याप्त डेटाबेस होता है। (मुझे लगता है)

    • कंप्यूटर अभी तक आवाज की पहचान के साथ बहुत अच्छे हैं, इसलिए आपको संदर्भ और बेहतर समझ वाले शब्दों को पार करने के लिए कंप्यूटर के लिए आवाज़ की एक विशाल डेटाबेस की आवश्यकता है। (कम से कम अंतिम बार मैंने इसका अध्ययन किया था)

    • इसलिए, आप इसे ऑफ़लाइन उपयोग नहीं कर सकते।

  2. हालाँकि आप वर्कअराउंड के माध्यम से लिखने के लिए वॉइस रिकॉग्निशन का उपयोग कर सकते हैं

    • एक दूरस्थ डेस्कटॉप / vnc कनेक्शन बनाकर, और प्रत्यक्ष

    • या एक दूरस्थ कीबोर्ड एप्लिकेशन का उपयोग करके।

Chrome खोजों के लिए ध्वनि पहचान का उपयोग कर सकता है, और एक एक्सटेंशन के साथ, फ़ील्ड डेटा को भरने के लिए उपयोग किया जा सकता है। लेकिन जहाँ तक मुझे पता है कि यह है।

और यह सब मुझे पता है


मैं समझता हूं कि आवाज की पहचान के लिए सरल ध्वन्यात्मकता और शब्दकोशों से परे शब्दों को सीखने के लिए एक कोष की आवश्यकता होती है (इसलिए जब आप ईर्ष्या नहीं करते हैं तो फजी मैच किए जा सकते हैं)। यदि यह प्रयोग करने योग्य है तो मुझे इंटरनेट कनेक्शन की आवश्यकता है।
रोबॉटहैंस

0

हो सकता है कि आप CMU Sphinx का उपयोग करते हों, इसे लिनक्स और Android दोनों में भाषण पहचान विकसित करने के लिए टूलकिट के रूप में उपयोग किया जा सकता है: CMU Sphinx

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.