विंडोज के लिए अच्छा टेक्स्ट-टू-स्पीच समाधान [बंद]


9

मैं विंडोज 7 चला रहा हूं और मुझे पता है कि यह मेरे अनुप्रयोगों में मुझे पाठ पढ़ने की क्षमता है, लेकिन मैं wav फ़ाइल या एमपी 3 के रूप में पाठ के विखंडू को बचाने के लिए एक अच्छी उपयोगिता की तलाश कर रहा हूं। यह पहले से ही ओएस में बनाया जा सकता है, लेकिन चतुराई से प्रच्छन्न। मुझे पता है कि मैं एपीआई को कॉल करने के लिए एक कार्यक्रम लिख सकता हूं , जो कि मेरा अगला कदम है अगर पहले से ही कोई अच्छा समाधान नहीं है।

मैं वास्तव में एटी एंड टी प्रणाली की गुणवत्ता को पसंद करता हूं , लेकिन इसमें उत्पादित एमपी 3 का उपयोग करने पर कुछ बहुत ही सख्त प्रतिबंध हैं। मैं उन्हें अपने पॉडकास्ट में इस्तेमाल करना चाहता हूं।

वेब आधारित ओके भी है, जब तक कि यह आसानी से एक काफी अनएकेनटर्ड (सार्वजनिक डोमेन या क्रिएटिव कॉमन्स) Wav, MP3 या कुछ अन्य मानक ऑडियो फ़ाइल का उत्पादन करता है। स्वाभाविक रूप से मैं वाणिज्यिक पर मुक्त या खुला स्रोत पसंद करता हूं, लेकिन यह एक आवश्यकता नहीं है।

जवाबों:


4

मैंने जासूसी करने की कोशिश की है , त्योहार , और मैरीटीटीएस । वे सभी अधिकांश भाग के लिए समझने योग्य आवाज़ें उत्पन्न करते हैं लेकिन वे बहुत स्वाभाविक नहीं हैं। इन प्रणालियों के लिए अतिरिक्त वॉयस डाउनलोड के साथ भी (जैसे कि एमबीरोला, सीएमयू आर्कटिक) आवाजें इतनी बेहतरीन नहीं हैं।

IVONA आवाजें सबसे अच्छी हैं जो मैंने अब तक सुनी हैं। वे आपको 30 दिन का निःशुल्क डेमो देते हैं जो आपके लिए एक बार के काम के लिए पर्याप्त है। इसके बाद वे $ 45 / आवाज की तरह हैं। अमेज़ॅन ने कंपनी को सिर्फ इसलिए खरीदा है ताकि आप जान सकें कि यह ठोस है ( http://www.ivona.com/us/news/amazoncom-announce-acquisition-of-ivona-software/ )।

वे Microsoft के SAPI इंटरफ़ेस के साथ काम करते हैं, जिसका अर्थ है कि आवाज़ें किसी भी प्रोग्राम के लिए उपलब्ध हैं जो कि समर्थन करता है (जैसे Adobe Reader)। मैं उन्हें टेक्स्ट टू वेव प्रोग्राम के साथ उपयोग कर रहा हूं, जो कि तरंग फाइलों में टेक्स्ट फाइलों के थोक रूपांतरण के लिए अच्छा है।

संपादित करें

वास्तव में बस अपने प्रश्न को फिर से पढ़ें और मुझे लगता है कि गैर-व्यक्तिगत उपयोग (उदाहरण के लिए पॉडकास्ट) के लिए कीमत शायद IVONA के लिए बहुत अधिक है। उस मामले में मैं कहूंगा कि मेरीटस की जाँच करें।


मैंने सिर्फ मैरीटीटीएस की बात सुनी और यह जासूसी और त्यौहार के शीर्ष पर है।
तीसवीं उपरांत

MaryTTS में बेहतरीन आवाजें हैं, और यह मुफ्त भी है।
जिम मैककेथ

ऐसा लगता है कि डेस्कटॉप-उपयोग के लिए इवोना की आवाज़ों के लिए टेक्स्ट-टू-स्पीच अब TextAloud
उपयोगकर्ता

6

eSpeak स्वतंत्र और खुला स्रोत है और आपको जरूरत की हर चीज प्रदान करता है।

यह एक फ़ाइल से या स्टड से पाठ बोलने के लिए कमांड लाइन प्रोग्राम के रूप में चल सकता है।
एक साझा लाइब्रेरी संस्करण भी उपलब्ध है।

* अलग-अलग आवाज़ें शामिल हैं, जिनकी विशेषताओं को बदला जा सकता है।
* एक WAV फ़ाइल के रूप में भाषण उत्पादन का उत्पादन कर सकते हैं।
* SSML (भाषण संश्लेषण मार्कअप भाषा) समर्थित है (पूर्ण नहीं),
  और HTML भी।
* संविदा आकार। कई भाषाओं सहित कार्यक्रम और उसके डेटा,
  1 Mbytes के योग।
* पाठ को फोनेम कोड में अनुवाद कर सकते हैं, इसलिए इसे एक मोर्चे के रूप में अनुकूलित किया जा सकता है
  एक और भाषण संश्लेषण इंजन के लिए अंत।
* अन्य भाषाओं के लिए संभावित। कई अलग-अलग चरणों में शामिल हैं
  प्रगति की। इन या अन्य भाषाओं के लिए देशी वक्ताओं से मदद मिलती है
  स्वागत किया।
* फोनेमी डेटा के उत्पादन और ट्यूनिंग के लिए उपलब्ध विकास उपकरण।
* C ++ में लिखा गया है।

जबकि eSpeak दिलचस्प प्रतीत होता है, यह वास्तव में "त्वरित शुरुआत" गाइड से लाभ उठा सकता है। हालांकि टिप के लिए धन्यवाद। मैं इसके साथ काम करता रहूंगा।
जिम मैककेथ

ESpeak के लिए +1। मैं लंबे समय से ऐसा करने के लिए एक ऐप की तलाश कर रहा हूं। धन्यवाद महोदय!
axxmasterr
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.