लिनक्स के तहत सरल भाषण मान्यता


15

किसी को भी लिनक्स के तहत भाषण मान्यता चलाने के लिए एक सरल ट्यूटोरियल है? मैं देखता हूं कि पॉकेटफिनएक्स सॉफ्टवेयर सेंटर में एक बाइनरी डाउनलोड के रूप में उपलब्ध है, लेकिन टर्मिनल से इसे चलाने से यह रिपोर्ट करने में विफल रहता है कि इसे मापदंडों की आवश्यकता है, लेकिन मुझे नहीं पता कि वहां क्या रखा जाए। मैंने सूचीबद्ध सभी वॉयस मॉडल स्थापित करने की कोशिश की, लेकिन मुझे नहीं पता कि वे कहाँ बचते हैं या उन्हें कैसे काम करना है। मुझे यह भी निश्चित नहीं था कि Sphinx3 को या तो काम करने के लिए क्या करना चाहिए। Sphinx3 manpages टूटे हुए लगते हैं और पॉकेटफिनिक्स का एक उदाहरण उपयोग नहीं होता है जो मेरे लिए समझ में आता है।

मैं एक ऐसी चीज़ की तलाश कर रहा हूं, जिसे एक सीमित शब्दावली और शब्दों के साथ माइक्रोफोन इनपुट से 60% सही पहचान मिलती है, और फिर इसे एक पाठ फ़ाइल में लिख सकते हैं - यह सामान 1980 के दशक के अंत में मौजूद था। इसलिए, मुझे पता है कि यह मौजूद है और किसी तरह काम करना चाहिए।

धन्यवाद।

(पुनश्च इंटरनेट कनेक्शन एक नहीं है)


मुझे उबोन पर जाने में परेशानी हो रही थी। पिछली बार मैंने उबंटू में दौड़ने की कोशिश की थी, लेकिन यह काफी समय पहले था, जांच के लायक हो सकता है
david.libremone

1
आप सक्रिय इंटरनेट कनेक्शन की आवश्यकता है या नहीं, यह निर्धारित करना चाहते हैं। Google वॉइस सेवा एक ऑडियो फ़ाइल को स्वीकार करती है और पाठ लौटाती है, लेकिन यह ऑफ़लाइन सक्षम नहीं है।
रोबॉटहैंस

सक्रिय इंटरनेट एक नहीं जाना है।
user2068060

1
अपने प्रश्न में अतिरिक्त जानकारी जोड़ने का सबसे अच्छा तरीका है, इसे संपादित करके , संपादन बटन के साथ। यह उस तरह से बेहतर दिखाई देता है, और टिप्पणियां मुख्य रूप से माध्यमिक, अस्थायी उद्देश्यों के लिए होती हैं। टिप्पणियाँ विभिन्न परिस्थितियों में हटा दी जाती हैं। आपके प्रश्न के लिए महत्वपूर्ण कुछ भी प्रश्न में ही होना चाहिए।
गुंटबर्ट

जवाबों:


4

साइमन लिस्टेंस आज़माएं

साइमन एक ओपन-सोर्स स्पीच रिकग्निशन प्रोग्राम है और माउस और कीबोर्ड की जगह लेता है। इसका डिज़ाइन बहुत लचीला है और किसी भी एप्लिकेशन के लिए अनुकूलन की अनुमति देता है जहां भाषण मान्यता की आवश्यकता होती है।

डाउनलोड करने के लिए और अधिक जानकारी kde.org पर सिमोन पर जाएं



0

सटीकता दर कई कारकों पर निर्भर करती है जैसे उच्चारण, पृष्ठभूमि शोर, रिकॉर्डिंग की गुणवत्ता। पूर्व-प्रशिक्षित मॉडल थोड़ा सीमित हैं, और मेरी प्रतिलेखन परियोजनाओं के लिए लिनक्स में एक वेब ब्राउज़र आधारित भाषण-से-पाठ उपकरण के बजाय ट्रांसक्रिप्बर का उपयोग किया जाता है ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.