भाषण मान्यता - एमपी 3 से पाठ सॉफ्टवेयर [बंद]


16

मैं एक स्पीकर इंडिपेंडेंट प्रोग्राम (कमर्शियल या फ्री) की तलाश कर रहा हूं, जो मुझे एमपी 3 फाइलों को भाषण रिकॉर्डिंग (विशेष रूप से पॉडकास्ट) से पाठ में बदलने में सक्षम करेगा। मैं ड्रैगन स्वाभाविक रूप से बोलने की कोशिश करना चाहता था, लेकिन ऐसा लगता है कि यह केवल मेरी खुद की भाषण रिकॉर्डिंग का समर्थन करता है। तो फिर विकल्प क्या हैं?


Avi द्वारा टिप्पणी: मेरा मानना ​​है कि यह संभव नहीं है - स्पीकर स्वतंत्र
Ivo Flipse

क्या ऑपरेटिंग सिस्टम?
studiohack

विंडोज या लिनक्स।
पको

जवाबों:


7

ड्रैगन स्वाभाविक रूप से बोलते हुए एमपी 3 फ़ाइलों को आयात करेगा और उन्हें स्थानांतरित करने का प्रयास करेगा। यह व्यक्तिगत स्पीकर को अपनी आवाज की पहचान करने के लिए पसंद करता है, लेकिन ट्यूनिंग के बिना एक उचित काम करता है। यह शायद सबसे अच्छा काम करेगा अगर आपके पॉडकास्ट स्पीकर टॉम ब्रोकॉ की तरह लगेंगे।


2
मैंने ड्रैगन नेचुरली स्पीकिंग की कोशिश की, लेकिन इसने अज्ञात वक्ताओं के साथ पॉडकास्ट के लिए एक भयानक काम किया। यह केवल कार्यक्रम को प्रशिक्षित करने के बाद मेरी अपनी आवाज के साथ काफी अच्छी तरह से काम किया।
पको

1
क्या यह अन्य ऑडियो फाइलों को भी आयात कर सकता है और उन्हें ट्रांसफर कर सकता है?
लैरी मोरिस

4

एक संभावित समाधान यह होगा कि आप अपने वीडियो को Youtube पर अपलोड करें, और स्वचालित कैप्शन को आज़माएं जो आप सक्षम कर सकते हैं ... यह अभी भी सटीक नहीं है, लेकिन आप कैप्शन फ़ाइल को डाउनलोड कर सकते हैं और इसे स्वयं संपादित कर सकते हैं, यदि यह मदद करता है ... के रूप में गीत के लिए कॉपीराइट / पायरेसी के मुद्दों के लिए, यदि आप यह संभव है, तो आप वीडियो को अपनी प्रोफ़ाइल पर निजी बना सकते हैं?


1
@studioback: क्या Youtube द्वारा यह विधि केवल किसी के स्वयं के वीडियो पर लागू होती है, न कि दूसरों द्वारा अपलोड की गई?
टिम

1
@ समय: यह वास्तव में दोनों के लिए है।
studiohack

1
@studiohack: दूसरों द्वारा अपलोड किए गए उन वीडियो के लिए, यह कैसे करना है? मेरा मतलब है, अपने खुद के वीडियो के रूप में डाउनलोड और अपलोड किए बिना?
टिम

1
पर सबसे वीडियो, वहाँ नीचे में एक सीसी आइकन है, यह स्वत: प्रतिलेखन क्लिक करें और फिर ...
studiohack


2

मैं ड्रैगन नेचुरली स्पीकिंग की कोशिश करने के खिलाफ चेतावनी दूंगा - मैंने अपने फोन पर सभी वॉइसमेल फाइलों को अपने पीसी पर फोल्डर में कॉपी / कन्वर्ट करने के लिए अपने जेलब्रेक किए गए आईफोन पर कुछ स्क्रिप्ट लिखी थीं और उनके साथ ड्रैगन नेचुरली स्पीकिंग ट्रांसक्रिप्शन सेवा चलाई थी।

विभिन्न वक्ताओं के साथ फाइलों के खिलाफ प्रतिलेखन चलाने का परिणाम बिल्कुल बेकार था। मैंने खुले स्रोत के कुछ विकल्पों की कोशिश की है, लेकिन स्पीकर-स्वतंत्र आवाज की पहचान अभी भी बहुत छोटे शब्दकोशों तक सीमित है।


1

मैं उपयोग कर रहा हूँ http://www.voicebase.com , पॉडकास्ट के साथ और वीडियो अंग्रेजी पर और यह बहुत अच्छी तरह से काम करता है। यह 50 ऑडियो घंटों के लिए निःशुल्क है।

आप rtf, srt या pdf पर ऑडियो ट्रांसक्रिप्शन डाउनलोड कर सकते हैं।

आप अपलोड करने के लगभग 10-15 मिनट बाद, और कभी-कभी, जल्दी से मशीन ट्रांस्क्रिप्शन डाउनलोड कर सकते हैं।


1

खुला स्रोत: सीएमयू स्फिंक्स

शेयरवेयर: http://www.e-speaking.com/ (विंडोज)

वाणिज्यिक: ड्रैगन स्वाभाविक रूप से (विंडोज़)

यदि आप के साथ कोशिश कर रहे थे तुम भी इस विधि की कोशिश कर सकते OSX जो दुस्साहस और soundflower उपयोग किया जा सकता

आप ओपनसोर्स के लिए कुछ प्रासंगिक लिंक भी प्राप्त कर सकते हैं जो एक और शेयर करने का प्रयास करने के लिए लायक था वोक्सराइटबेक

यदि आप एक .net प्रोग्रामर हैं तो आप इस विधि का उपयोग अपनी किट बनाने के लिए कर सकते हैं


0

पॉडज़िंगर एक महान समाधान होगा, लेकिन मुझे यकीन नहीं है कि रैंप (कंपनी के लिए नया नाम जो एलेजिंग हुआ करता था, जिसने पॉडज़िंगर का उत्पादन किया था) अब मुफ्त में सेवा प्रदान करता है ...

http://en.wikipedia.org/wiki/Podzinger

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.