speech-recognition पर टैग किए गए जवाब

3
मानव भाषण शोर फिल्टर
क्या किसी को नॉन-स्पीच अटैच करने के लिए किसी फिल्टर का पता है? मैं स्पीच रिकग्निशन सॉफ्टवेयर लिख रहा हूं और हर चीज को फ़िल्टर करना चाहूंगा लेकिन इंसानी स्पीच। इसमें पृष्ठभूमि शोर, एक भद्दा माइक्रोफोन द्वारा निर्मित शोर, या यहां तक ​​कि पृष्ठभूमि संगीत शामिल होगा। मैंने पहले से …

1
यह निर्धारित करना कि मानव भाषण के समान ऑडियो कैसा है
इस समस्या के उत्तर की तलाश करते हुए, मैंने पाया कि यह बोर्ड स्टैक ओवरफ्लो से मेरा इस प्रश्न को पार करने का फैसला करता है । मैं एक ऑडियो सेगमेंट और एक मानवीय आवाज के बीच समानता का निर्धारण करने की एक विधि खोज रहा हूं, जो संख्यात्मक रूप …

1
भाषण मान्यता के लिए शोर में कमी शोर में कमी से भिन्न होती है जो कि भाषण को मनुष्यों के लिए अधिक "बुद्धिमान" बनाने के लिए माना जाता है?
यह एक ऐसा प्रश्न है जो मुझे पिछले कुछ समय से दिलचस्पी ले रहा है, मुख्यतः क्योंकि मैं स्वयं एक मौजूदा भाषण मान्यता प्रणाली के लिए शोर में कमी पर काम कर रहा हूं। शोर कम करने की तकनीक पर अधिकांश कागजात इस बात पर ध्यान केंद्रित करते हैं कि …

1
विभिन्न सोनिक तरंगों के बीच भेदभाव के लिए एक फीचर वेक्टर डिजाइन करना
4 निम्नलिखित तरंग संकेतों पर विचार करें: signal1 = [4.1880 11.5270 55.8612 110.6730 146.2967 145.4113 104.1815 60.1679 14.3949 -53.7558 -72.6384 -88.0250 -98.4607] signal2 = [ -39.6966 44.8127 95.0896 145.4097 144.5878 95.5007 61.0545 47.2886 28.1277 -40.9720 -53.6246 -63.4821 -72.3029 -74.8313 -77.8124] signal3 = [-225.5691 -192.8458 -145.6628 151.0867 172.0412 172.5784 164.2109 160.3817 …

1
फोन कॉल को ऑडियो को साइलेंस / नॉन साइलेंस में कैसे विभाजित करें?
मेरी समस्या यह है कि मुझे पृष्ठभूमि के शोर की ऊर्जा का पता नहीं है, इसलिए मैं सिर्फ ऊर्जा नहीं बढ़ा सकता। प्रसंस्करण वास्तविक समय में किया जाता है, और मुझे तय करने के लिए लगभग 500msec है। आदर्श रूप से, मैं चाहता हूं कि शांत व्यंजन गैर-मौन माना जाए।

2
धीरे-धीरे आधारित परिवर्तन को कैसे लागू किया जाए
मैं एज डिटेक्शन के लिए ह्यूफ ट्रांसफॉर्म का उपयोग करने की कोशिश कर रहा हूं, और आधार के रूप में ढाल छवियों का उपयोग करना चाहूंगा। मैं अब तक क्या किया, छवि को देखते हुए Iआकार के [M,N]और उसके आंशिक डेरिवेटिव gx, gy, के रूप में प्रत्येक पिक्सेल में ढाल …
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.