डेस्कटॉप वातावरण पर ध्वनि नियंत्रण


16

मैं एक ऐसी प्रणाली को सक्षम करना चाहूंगा जो उपयोगकर्ता के वॉयस कमांड का जवाब दे सके और मौखिक कमांड GIVEN के अनुसार स्क्रिप्ट चला सके।

आदर्श रूप से, मैं चाहूंगा कि कंप्यूटर लगातार सुन रहा हो।

एक बार जब यह बज़ शब्द "कंप्यूटर" सुनता है तो यह 10 सेकंड (या तो) के लिए कमांड को सक्रिय और सुनेगा।

एक बार सक्रिय, और जब यह सुन रहा है, तो मैं स्क्रिप्ट चलाने में सक्षम होने के लिए चर्चा के दूसरे सेट के लिए चाहूंगा।

उदाहरण के लिए....

(कंप्यूटर निष्क्रिय है) "कंप्यूटर" (कंप्यूटर तुरंत सुनता है) "नए संदेश का उपयोग करें" (MESSAGES शब्द buzz किया जा रहा है * IGNORES "ACCESS NEW" - कंप्यूटर एक स्क्रिप्ट चलाता है और विकास या सहानुभूति खोलता है)। ब्राउज़र के लिए एक हो सकता है, विंडोज़ बंद करने और डेस्कटॉप दिखाने के लिए एक, या वास्तव में सामान का एक गुच्छा हो सकता है।

क्या यह भी संभव है?

जवाबों:


7

Gnome-आवाज नियंत्रण

कोड 2007 के Google समर के भाग के रूप में विकसित, यह कुछ सुविधाओं को विकसित करने के लिए एक विचार था जो गनोम डेस्कटॉप में प्रयोज्यता में सुधार करेगा।

लक्ष्य एक डेस्कटॉप वॉयस कंट्रोल सिस्टम लागू करना है। सिस्टम में एक एप्लिकेशन शामिल होता है जो ऑडियो इनपुट (माइक्रोफ़ोन) की निगरानी करेगा और जब एक महत्वपूर्ण ऑडियो सिग्नल का पता चला है, तो सॉफ्टवेयर सिग्नल को पकड़ता है, संसाधित करता है और पहचानता है और फिर गनोम डेस्कटॉप पर वांछित कार्रवाई को निष्पादित करता है। क्रियाओं के एक सेट में सक्रिय विंडो को अधिकतम, न्यूनतम, बंद करना शामिल हो सकता है; एक विशिष्ट कार्यक्रम खोलें; एक डेस्कटॉप से ​​दूसरे में स्विच करना; दूसरों के बीच में। GnomeVoiceControl C में CMU Sphinx के साथ मिलकर कार्यान्वित किया जाता है, जो कि एक खुला स्रोत उपकरण है, जो भाषण को पाठ में बदलने के लिए बनाया गया है।

लेखकों द्वारा स्लाइड-शो

दुर्भाग्य से ऐसा लगता है कि यह मूल "लक्ष्यों" से बहुत अधिक विकसित नहीं हुआ है - हालांकि इस साल बल्गेरियाई और तुर्की जैसी नई भाषाओं के लिए समर्थन जोड़ने वाली कुछ गतिविधि दिखाई देती है।

स्थापित करने के लिए:

sudo apt-get install gnome-voice-control

एक प्रकार का बत्तक-सदृश नाक से पशु

एक दिलचस्प दिखने वाला प्रोजेक्ट कॉल प्लैटिपस है - मूल रूप से ड्रैगन नेचुरली स्पीकिंग का एक लिनक्स फ्रंट-एंड है जो वाइन में चलता है।

इस एप्लिकेशन के लिए दावा-से-प्रसिद्धि है "यह विंडोज या लिनक्स प्रोग्राम और स्क्रिप्ट भी लॉन्च कर सकता है, उदाहरण के लिए" स्टार्ट टर्मिनल "।

VEDICS

यह एक नया प्रोजेक्ट है जो कहता है कि यह यूनिटी इंटरफेस के साथ काम करता है।

प्रोजेक्ट पेज कहता है कि यह "रन [प्रोग्राम नाम]" को मान्यता देता है - इसलिए सिद्धांत रूप में आप [प्रोग्राम का नाम] कोई भी स्क्रिप्ट हो सकते हैं जिसे आप चलाना चाहते हैं।


असाधारण तेजी से प्रतिक्रिया के लिए धन्यवाद। मैंने उस कार्यक्रम के बारे में सुना और मैंने इसे स्थापित किया, लेकिन यह पिछले कॉन्फ़िगरेशन को प्राप्त नहीं करता है - यह सिर्फ "कॉन्फ़िगरेशन" कहता है। मुझे आश्चर्य है कि इस मोर्चे पर बहुत काम नहीं हुआ है। क्या हो सकता है कि एक खिड़कियां समान हो जो मैं शराब के साथ चला सकता हूं?
बोर्गडोमिनेशन

1
पुराने शब्द ग्नोम की आवाज़ जो सिनैप्टिक में है, ने मुझे वही परिणाम दिए। मैंने वेबसाइट से नवीनतम की कोशिश की और यह आगे बढ़ने के लिए लग रहा था लेकिन मुझे इसे ठीक से काम करने के लिए कभी नहीं मिला। मैनुअल आश्रितों के लिए एक दर्द था।
केंड्रिक

3

साइमन सुनता है

यह एक ओपन सोर्स प्रोजेक्ट है जिसका उद्देश्य शारीरिक रूप से अक्षम लोगों के लिए शुरू में विकसित की गई वाक् पहचान द्वारा माउस और / या कीबोर्ड को बदलना है।

एक ppa है जहां से हम एप्लिकेशन इंस्टॉल कर सकते हैं : ppa: grasch-simon-listens / simon


सिमॉन केवल kde के साथ काम करता है? यह वास्तव में बहुत बढ़िया लग रहा है और मैंने इसे स्थापित किया है, लेकिन इसे गनोम-शेल के साथ काम करना नहीं मिल सकता है। विशेष रूप से खिड़की प्रबंधन। अगर मैं उदाहरण के लिए सभी विंडो दिखाना चाहता हूं, तो kde env और gnome env में अलग से काम करना सही है?
जोशुआ रॉबिसन

1
निर्भरता को हल किया जाना चाहिए जब ppa से Ubuntu <= 12.04 पर स्थापित किया गया, लेकिन मैंने हाल ही में कोशिश नहीं की है, और मुझे यह भी पता नहीं है कि यह GNOME शेल के साथ कैसे हस्तक्षेप कर सकता है। 12.10 के लिए कोई संस्करण (अभी तक) नहीं है।
ताकत

3

Google2Ubuntu

Google2Ubuntu एक उपकरण है जो आपको Google वाक् पहचान API के माध्यम से वॉयस कमांड का उपयोग करके आपके कंप्यूटर को नियंत्रित करने देता है।

स्थापित करने के लिए टर्मिनल पर नीचे दिए गए आदेश चलाएँ google2Ubuntu,

sudo add-apt-repository ppa:benoitfra/google2ubuntu
sudo apt-get update
sudo apt-get install google2ubuntu

स्रोत


1

लिनक्स भाषण मान्यता

यह लिनक्स वितरण के तहत चलाने के लिए विकसित किया जा रहा है, यह कस्टम कॉन्फ़िगरेशन, संदर्भ आधारित मान्यता, डिक्टेशन मोड और कॉन्फ़िगर करने योग्य मैक्रो का समर्थन करने के लिए बहुत ही कॉन्फ़िगर करने योग्य और आसान है।

लिनक्स भाषण मान्यता स्थापित करने के लिए परियोजना के GitHub पृष्ठ पर जाएं। ज़िप फ़ाइल डाउनलोड करें और इसे निकालें।

फिर कुछ निर्भरताएँ स्थापित करें:

sudo apt-get install sox python-argparse libsox-fmt-mp3 mutt xvkbd xautomation

निकाले गए फ़ोल्डर (Palaver-master) को टर्मिनल में खोलें और सेटअप निष्पादित करें:

cd /~Path-to-folder~/Palaver-master/
./setup

अब रिकॉर्डिंग को सक्षम करने के लिए एक हॉटकी निर्दिष्ट करना है, जो कि सिस्टम सेटिंग्स पर जाने के लिए ...> कीबोर्ड> शॉर्टकट> कस्टम शॉर्टकट शॉर्टकट जोड़ने के लिए प्लस बटन पर क्लिक करें, इसे ध्वनि पहचान का नाम दें और कमांड सेट करें:

/~Path-to-folder~/Palaver-master/hotkey

लागू करें पर क्लिक करें, शॉर्टकट पर क्लिक करें और फिर आवाज पहचान को सक्रिय करने के लिए एक हॉटकी असाइन करें।

ध्यान दें कि अभी तक कोई स्थिर बिल्ड जारी नहीं किया गया है, इसलिए इस चरण में आदेशों को पूरी तरह से कार्यात्मक होने की उम्मीद नहीं है, कई वाक्यांशों को मान्यता दी जाएगी, लेकिन कोई वास्तविक कार्रवाई नहीं की जाएगी।


अब तक,
पाल्वर

0

Snips.ai

बस इसे pi3 पर आज़माया - लगता है कि
डॉक में संभावित रन हैं

https://snips.ai/


1
उबंटू पूछने के लिए आपका स्वागत है। कृपया ध्यान दें कि यदि आप इस उपकरण से संबद्ध हैं, तो आपको अपनी पोस्ट में स्पष्ट रूप से कहने की आवश्यकता है; देखें कि कैसे एक स्पैमर नहीं है
ग्लोरफाइंडेल

1
आधिकारिक वेबसाइट कहती है: ओपन सोर्स: हम समय के साथ स्निप्स खोलने के लिए प्रतिबद्ध हैं , इसलिए स्निप्स कोशिश करने लायक हो सकते हैं।
कारेल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.