नेत्रहीन माता-पिता के लिए प्रोजेक्ट टेक्स्ट-टू-स्पीच


12

मेरी पहली पोस्ट यहाँ (मुझे पूरी उम्मीद है कि यह उन स्वीकृत पदों के दायरे में है जिन्हें मैं नहीं जानता था कि और कहाँ मुड़ना है)।

मैं एक नब्बे वर्षीय मां के लिए एक परियोजना करने की योजना बना रहा हूं जो तेजी से अपनी दृष्टि खो रही है और अपेक्षाकृत हंसमुख जीवन जीती है।

वह घर पर अकेली बैठकर बुनियादी केबल देखती है और उसमें इंटरनेट कनेक्शन नहीं है। 60 छोटे बटन के साथ उसका एक विशाल रिमोट कंट्रोल है और मूल रूप से पूरी बात से भ्रमित है।

मैं बस एक हार्ड डिस्क को फिल्मों और / या ऑडियोबुक की एक लाइब्रेरी पर रखना चाहता हूं ताकि वह उनके माध्यम से नेविगेट कर सके और अपने अवकाश को देख सके।

मैंने फैसला किया है कि उसे 6 बड़े विन्यास बटन के साथ एक साधारण जॉयस्टिक चाहिए। मुझे कुछ तरीके खोजने की जरूरत होगी जो शीर्षक स्वतः ही उसे पढ़ सकते हैं (जैसा कि वह चयन से पहले नीचे स्क्रॉल करता है)।

एक GUI, जो मॉनिटर पर बहुत बड़ा पाठ प्रदान करता है, पर्याप्त हो सकता है ... लेकिन मेरा मानना ​​है कि टेक्स्ट-टू-स्पीच फीचर सबसे कठिन समस्या हो सकती है।

यदि शीर्षक उसे पढ़ा जाता है, तो एक GUI लगभग एक बिंदु है।

XBMC, मैं देखता हूं, कुछ टेक्स्ट-टू-स्पीच फीचर्स हैं ... हालांकि मैं यह निर्धारित नहीं कर सकता कि क्या यह ऐसा कुछ होगा जो सामग्री को "प्राप्त करने" के लिए इंटरफ़ेस के माध्यम से नेविगेट करने के लिए उसकी दृष्टि की आवश्यकता होगी। (इसके अलावा, मैं यह निर्धारित नहीं कर सकता कि क्या मेनू स्वयं गुई द्वारा पढ़ा गया है - "दृष्टिहीन" नेविगेशन के लिए अनुमति देता है)

मुझे बूट करने पर तत्काल सूची के साथ एक GUI खोलने की आवश्यकता है (जिसके माध्यम से वह केवल स्क्रॉल कर सकता है और सामग्री का चयन कर सकता है)।

मेरा सरल सवाल यह है कि क्या यह पीआई के साथ संभव है और क्या ऐसा लगता है कि यह एक साध्य लक्ष्य है।

इस मौके पर कि कोई मुझे सही दिशा में ले जा सकता है, मैं अंत में इसकी सराहना करूंगा।

बहुत धन्यवाद।


क्या आपने इस मंच पर "भाषण" की खोज करने की कोशिश की है। कुछ लिंक हैं (मैंने वास्तव में कोई भी कोशिश नहीं की है) उदाहरण के लिए raspberrypi.stackexchange.com/questions/1015/…
Milliways

मुझे यकीन नहीं है कि आपने इसे Rapsberry org मंचों पर पोस्ट किया है । यदि आपने ऐसा नहीं किया है, तो यह उस प्रकार का प्रश्न है, जो अक्सर यथोचित रूप से पूछा जाता है।
joan

यद्यपि "भाषण-मान्यता" के लिए एक टैग है, "भाषण-पीढ़ी" के लिए रिवर्स नहीं था जो कि एक असतत विषय है। इसे अक्सर "टेक्स्ट-टू-स्पीच" (दूसरे भाग) के रूप में संदर्भित किया जाता है और ये सभी अक्सर उन मामलों से जुड़े होते हैं जिन्हें आम तौर पर "एक्सेसिबिलिटी" के रूप में संदर्भित किया जाता है जो दोनों के लिए उपयोग करने के लिए चीजों को आसान बनाने से संबंधित हैं। पूरी तरह से सक्षम मनुष्यों और उन लोगों के लिए भी जिनके पास कुछ हद तक हानि है, जिन्हें समान परिणाम प्राप्त करने के लिए अतिरिक्त कार्यक्षमता की आवश्यकता हो सकती है। इस उत्तर का उपयोग इन तीन टैग बनाने के लिए किया गया है।
SlySven

3
मुझे इस परियोजना के विचार से बहुत प्यार है, मैंने इसे रास्पबेरी पाई मेटा पर क्रिसमस गिव-दूर प्रतियोगिता में सर्वश्रेष्ठ मूल रास्पबेरी पाई प्रोजेक्ट आइडिया के लिए नामांकित किया है ।
फिल बी।

1
उन सभी के लिए जिन्होंने पोस्ट किया है: मैं इस पर प्रतिक्रिया के द्वारा बहुत स्पर्शित और प्रोत्साहित हूं। मैं एक नवजात शिशु हूं और मैंने कभी अपनी आंखों से पीआई नहीं देखा। मैं इस तरह की प्रतिक्रियाओं के लिए बहुत आभारी हूं और उनकी वजह से इसे आगे बढ़ाने के अपने संकल्प को नवीनीकृत किया है। मैंने अपनी माँ के साथ भी खबर साझा की है - जो कहती है कि वह रास्पबेरी पाई को सेब पसंद करती है और वास्तव में नहीं जानती कि मैं किस बारे में बात कर रहा हूं ... लेकिन यह अभी के लिए ठीक है :)।
लियोफिब

जवाबों:


8

मुझे यकीन नहीं है कि मुझे कैसे बनाना है, लेकिन मुझे पता है कि टेक्स्ट-टू-स्पीच कैसे करना है। आप जासूसी का उपयोग कर सकते हैं:

sudo apt-get install espeak
espeak 'Hello world'

डिफ़ॉल्ट रूप से, जासूसी की आवाज को समझना मुश्किल है (मेरे लिए)। एक आवाज खोजने के लिए, का उपयोग करें:

sudo apt-cache search espeak

फिर, एक आवाज खोजें। इसे स्थापित करो। फिर भागो

man espeak

आवाज बदलने के तरीके खोजने के लिए। यह सरल होना चाहिए।

यहाँ कुछ का एक उदाहरण है जो मैंने जासूसी का उपयोग करके बनाया है: https://github.com/Merlin04/robotthingy

संपादित करें: मुझे लगता है कि आप किवी के साथ एक जीयूआई बना सकते हैं। यह अजगर का उपयोग करता है।


7

मुझे केवल एक्सबीएमसी के साथ सीमित अनुभव है, लेकिन दृढ़ता से विश्वास है कि 'पहले से ही लक्षित दर्शकों' (यह 90 वर्षीय महिला) के लिए अति जटिल हो सकता है।

हालांकि, मेरा मानना ​​है कि यह परियोजना सबसे निश्चित रूप से एक रासपी पर प्राप्त करने योग्य है। जैसा कि मैं एक webdeveloper हूँ मैं एक साधारण webapp बनाने का सुझाव दूंगा। अगर ऐसा कुछ मौजूद है तो मेरे पास कोई सुराग नहीं है, लेकिन मैं इसे विकसित करने के लिए बहुत मुश्किल होने की कल्पना नहीं कर सकता।

मूल विचार:

  1. रास्पियन के साथ रासपी।
  2. व्हाट्सएप चलाने वाला अपाचे।
  3. कुछ बैकएंड (उदाहरण के लिए PHP) हार्ड डिस्क पर फ़ाइलों को अनुक्रमित करता है, कुछ पठनीय प्रारूप में नाम को प्रारूपित करता है और उन्हें सूची के रूप में आउटपुट करता है।
  4. जॉयस्टिक-इनपुट को नियंत्रित करने और HTML5 स्पीच सिंथेसिस एपीआई (उदाहरण: http://creative-punch.net/2014/10/intro-html5-speech-synthesis-api) के साथ फिल्मों / पुस्तकों के शीर्षक को पढ़ने के लिए जावास्क्रिप्ट का उपयोग करें। / ) है।
  5. एक फिल्म / पुस्तक के चयन पर, बस ब्राउज़र में फ़ाइल खोलें। (इस तरह आपको एक नई विंडो नहीं खोलनी पड़ेगी, ताकि वह बैक बटन दबाकर मेनू में वापस आ सके।)

OSMC (कोड़ी) कुछ बाकी एपी को उजागर करता है। हो सकता है कि आप अपने स्वयं के फ्रंट-एंड / गुई का निर्माण करने के लिए उपयोग कर सकें। हालाँकि मैं Rien से सहमत हूँ कि यह आपके दर्शकों के लिए जटिल लगता है। मुझे नहीं लगता कि एक मानव उसके लिए ऑडियोबुक शुरू करने / रोकने में सहायता के लिए पास हो सकता है?
हवनर

हाय हवनार, वास्तव में, नहीं। उसे घर में दो कुत्ते मिले और बस यही बात है ... एक बात जिसका मैंने ज़िक्र किया, मैं मानता हूं कि उसका इंटरनेट कनेक्शन भी नहीं है।
लियोफिब

ठीक है कुछ क्यू। मैं संक्षिप्तता के कारण उन्हें छोटा रखूँगा। 1) इसके लिए RasPi 2, सही? 2) आप इसके लिए क्या ओएस सुझाएंगे? 3) क्या आपको लगता है कि यह WIFI के बिना उचित होगा? - उसके पास कोई नेट कनेक्शन नहीं है, अफसोस। 4) Apache का उपयोग सर्वर चलाने के लिए किया जाता है या यह OS है? 5) क्या मुझे खुद को तैयार करने के लिए लिनक्स और इसकी आज्ञाओं से परिचित होना शुरू करना चाहिए? यहाँ एक विचार है: youtube.com/watch?v=NCVWX4suGE4 आपको क्या लगता है? क्या मुझे एक सामान्य आरपीआई 2 किट के साथ जाना चाहिए? - बहुत धन्यवाद और नया साल मुबारक।
सिंह राशि

1
1) पी 2 एक बहुत अधिक शक्तिशाली है, इससे आपको या तो आपके जाने के तरीके से फायदा होगा। 2) रास्पबियन सबसे अधिक उपयोगकर्ता के अनुकूल है और सबसे अधिक इस्तेमाल किया जाता है, इसलिए गाइडों को ढूंढना आसान है और 3 पर मदद करें) आप एक इंटरनेट कनेक्शन के बिना वाईफाई कर सकते हैं, यदि आपको एक इन्फ्रा रेड रिमोट 4 के साथ जाना है तो वायरलेस सेटअप की आवश्यकता नहीं है) बहुत सारे वेब सर्वर अपाचे एक व्यापक रूप से इस्तेमाल किए गए एक 5) हाँ, एक उपयोगी कौशल कम नहीं है! 5B) आप sdcard, hdmi केबल, पावर एडॉप्टर के साथ pi2 से शुरू कर सकते हैं और इसके साथ खेलना शुरू कर सकते हैं। कुछ एप्लिकेशन डेवलपमेंट स्किल्स में सहायक हो सकते हैं।
हवनर

1
मैं हवनार की तुलना में चीजों पर एक अलग दृष्टिकोण रखता हूं जो मुझे लगता है, इसलिए मेरे जवाब यहां हैं: 1) आवश्यक नहीं, 1 बी इतना शक्तिशाली होना चाहिए कि मुझे भी लगता है, लेकिन 2 सुरक्षित है फिर भी 2) रास्पबियन वास्तव में, सबसे अधिक ज्ञात समर्थन इस प्रकार है 3/4 ) अपाचे वेबसर्वर सॉफ्टवेयर है, इस प्रकार आप एक सिस्टम पर अपनी वेबसाइटें चला सकते हैं (इस मामले में raspi)। मतलब कि आपको तब तक इंटरनेट कॉन्सेप्टन की जरूरत नहीं है, क्योंकि वेबपेज आपके रासपी पर चल रहा होगा। 5) हाँ, कुछ बुनियादी कमांडलाइन मुझे लगता है कि रास्पियन और अपाचे चलाने के लिए उपयोगी है।
रियान ह्यूवर

4

मैंने आपके लिए कुछ हल्की खुदाई की है क्योंकि ज्यादातर चीजें आपके लक्षित दर्शकों के लिए बहुत जल्दी जटिल हो सकती हैं।

मेरे व्यक्तिगत अनुभव से, बटन और गुई (आपकी देव आंखों में कोई फर्क नहीं पड़ता ) बुजुर्गों को भ्रमित करने के रूप में सामने आ सकते हैं।

मुझे नहीं पता कि आपके कौशल (वेब) विकास के साथ कितने अच्छे हैं, या यदि आप अपने लक्ष्यों को प्राप्त करने में मदद करने के लिए प्रेरित कुशल देव प्राप्त कर सकते हैं, लेकिन अंतिम उपयोगकर्ता के लिए सरलता यहां महत्वपूर्ण है।

वहां "द वन बटन ऑडियोबुक प्लेयर" वह हो सकता है जिसे आप ढूंढ रहे हैं। या शायद इसके लिए एक अनुकूलन।

नीचे निकालें:

It basically consists of:

1 Raspberry Pi
1 ModMyPi enclosure
1 button
2 resistors (330 Ohm, 10 Kilo-Ohm)
1 blue LED
1 (slow) 8GB SD-Card
some wire
a pair of speakers

निम्नलिखित सॉफ्टवेयर का उपयोग किया गया है:

Raspbian minimal image (http://www.linuxsystems.it/2012/06/raspbian-wheezy-armhf-raspberry-pi-minimal-image)
mpd (music player daemon)
mpc
mpd-python
pyudev (for USB access)
a self-written python script

विशेषताएं निम्नलिखित हैं:

  • हमेशा पर: जब आप रास्पबेरी पर बिजली, यह बूट होगा और ठहराव में ऑडियो बुक के साथ अजगर स्क्रिप्ट शुरू

  • एक बटन का उपयोग: बटन रुक जाता है और ऑडियो बुक को रोक देता है या जब आप बटन को 4 सेकंड से अधिक समय तक दबाते हैं, तो एक ट्रैक वापस चला जाता है

  • याद रखने की स्थिति: यह हमेशा आखिरी खेले गए स्थान को याद रखेगा

  • केवल एक ऑडियोबुक: रास्पबेरी पर हमेशा केवल एक ऑडियो पुस्तक होगी

  • आसान ऑडियो बुक परिनियोजन: जब आप किसी विशेष नाम / लेबल के साथ USB थंब ड्राइव में प्लग करते हैं, तो रास्पबेरी बजना बंद कर देगा, अंगूठे की ड्राइव को माउंट करेगा, पुरानी ऑडियो बुक को हटा देगा, नई को कॉपी कर देगा, प्लेलिस्ट को फिर से जोड़ देगा और - अनप्लगिंग के बाद थंब ड्राइव - पॉज़ मोड में नया ऑडियोबुक शुरू करता है

  • बहु प्रारूप: चूंकि यह mpd का उपयोग करता है, खिलाड़ी Ogg Vorbis, FLAC, OggFLAC, MP2, MP3, MP4 / AAC, MOD, मस्कैप और लहर का समर्थन करता है

>>> स्रोत <<< --- सभी क्रेडिट वहाँ जाता है!

github लिंक


जॉयस्टिक का उपयोग करने पर नियंत्रण इंटरफ़ेस का विस्तार करने में सक्षम हो सकता है यदि यह लक्षित दर्शकों के लिए एक सुसंगत और सरल यूआई प्रस्तुत करने के लिए सावधानी से किया जाता है - लिंक्ड-इन साइट पर एक टिप्पणीकार ने उल्लेख किया कि यह केवल खेलने की स्थिति को याद करता था जब आरपीआई संचालित था - यह संशोधित करने के लिए कुछ हो सकता है - हालांकि मुझे यकीन है कि जब मैंने लैन संगीत सर्वर के साथ कुछ प्रयोग किया था, तो mpdयाद था कि यह एक लंबी प्ले-लिस्ट में था, इसके लिए एक विकल्प हो सकता है ...
SlySven

पीआई संचालित एसडी कार्ड के लिए इसके बेहतर तरीके से नहीं छोड़ने का कोई कारण नहीं है, इसका निर्माण बंद नहीं होना है।
हवनार

" ... इसका निर्माण बंद नहीं होना चाहिए। " शायद यह कहना बेहतर है, "यह बिना शट-डाउन किए सत्ता से हटाए जाने के प्रति सहनशील नहीं है।" - एक पीआई के लिए एक यूपीएस मुझे 2-1000 मिनट ऑन और 2-1000 मिनट के बीच किसी भी चीज़ के टाइमर चक्र पर पीआई को स्टार्ट-अप और शटडाउन करने की सुविधा है - जिसमें समय चूक फोटोग्राफी में आवेदन होंगे - और वहां कोई संकेत नहीं है कि यह स्वाभाविक रूप से हानिकारक है - हालांकि मैं सहमत हूं कि एसडी कार्ड उन अतिरिक्त लॉग-फाइल राइट्स से थोड़ी तेजी से "खराब" हो सकता है।
स्लीव्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.