वॉयस रिकॉग्निशन सॉफ्टवेयर के साथ प्रोग्रामिंग [बंद]


10

मैंने कुछ साल पहले ड्रैगन नेचुरली स्पीकिंग का इस्तेमाल किया था और सोच रहा था कि क्या यह प्रोग्रामिंग के लिए एक व्यवहार्य समाधान होगा?

मैं और अधिक सोच रहा था यदि आप अपने हाथ या कुछ और को तोड़ दें जो प्रोग्रामिंग के लिए एक प्रमुख बाधा होगी।

एसओ पर यह वही सवाल था, लेकिन कभी जवाब नहीं दिया गया।


5
यह एक दिलचस्प विचार है, लेकिन मुझे लगता है कि भाषा वाक्य रचना वास्तव में उस भाषा के लिए काम करने के लिए समर्पित कुछ भी नहीं
करेगी

1
विराम चिह्न समस्या कोडिंग से परे एक बहुत बड़ा संपादन शामिल है, कुछ ऐसा जो ध्वनि नियंत्रण के लिए अच्छा नहीं है।
लोरेन Pechtel

1
अधिकांश प्रोग्रामिंग भाषाओं के लिए आम तौर पर विराम चिह्न के दुरुपयोग की मात्रा के साथ यह कोशिश करने से विक्टर बोरगे के फोनेटिक विराम चिह्न कॉमेडी स्किट का ध्यान आता है।
हॉटपावर 2

आप वी.एस. के साथ स्वत: पूर्ण के साथ काम करने की कल्पना कर सकते हैं?
चाड हैरिसन

1
यह वास्तविक कोडिंग के अलावा अन्य सामानों के लिए ड्रैगन डिक्टेट का उपयोग करने के लिए एक विचार हो सकता है, जैसे संकलित ऐप लॉन्च करना, ईमेल की रचना / उत्तर देना, कुछ सामान्य चीजें जो वास्तविक कोडिंग को विचलित या विलंबित कर सकती हैं।
गोर्ट्रोन

जवाबों:


18

मैं व्यक्तिगत अनुभव से इसका उत्तर दे सकता हूं। कुछ साल पहले, मैंने एक दुर्घटना में दोनों हथियार तोड़ दिए । चूंकि मेरी नौकरी पूर्णकालिक प्रोग्रामिंग थी, इसलिए यह एक समस्या थी। कुछ मदद से, मैंने अपने लैपटॉप पर ड्रैगन स्थापित किया।

यह समय की बर्बादी थी।

कोड प्राकृतिक भाषा की तरह ज्यादा नहीं है; यह मुख्य रूप से लिखा जाता है, बोला नहीं जाता है। मुझे पता है कि y_z = (x < 0 ? -x : x) + 2;इसका क्या मतलब है, फिर भी मुझे नहीं पता कि मैं इसका उच्चारण कैसे करूंगा, और न ही मुझे परवाह है।

लिखित-केवल भाषा होने के नाते, कोड चरित्र स्तर पर बहुत सटीक है। वहाँ बीच एक बड़ा अंतर है (x+2)*3और (x+2*3)। शब्दों पर ध्यान देने के लिए भाषण-से-पाठ कार्यक्रम अच्छे हैं, वर्ण नहीं। विशिष्ट वर्णों को जोड़ने के लिए "बाएं कोष्ठक, x, प्लस चिह्न, दो, दाएं कोष्ठक" जैसी बहुत सी बातें कहनी पड़ती हैं।

जब मैं कोडिंग कर रहा होता हूं, तो मैं बहुत अधिक मूविंग और रीराइटिंग करता हूं। भाषा की एकल धारा के लिए भाषण-से-पाठ अच्छा है। यह सब जगह आगे और पीछे जाने के लिए अच्छा नहीं है।

कोडिंग में बहुत सारे कार्य टाइपिंग के बराबर नहीं हैं, जो कि सभी स्पीच-टू-टेक्स्ट के लिए अच्छा है। इस बारे में सोचें कि आप कोड के किसी अन्य मॉड्यूल को देखने के लिए कितनी बार टैब बदलते हैं, या आप अपने संपादक में एक फ़ंक्शन को कितनी बार मोड़ते और प्रकट करते हैं।

इसलिए यदि आपके पास भाषण-से-पाठ कार्यक्रम है, तो इसे आज़माएं और अपने लिए देखें। मुझे नहीं लगता कि आप बहुत प्रभावित होंगे।


संयोग से, एक ही बार में दोनों बाहों को मत तोड़ो। एक समय में एक को तोड़ो, यह बहुत आसान है।

अगर मेरे पास केवल एक टूटी हुई भुजा होती, तो मैं बस एक बार अपनी सारी कोडिंग कर लेता। यह अभी भी स्पीच-टू-टेक्स्ट सॉफ़्टवेयर का उपयोग करने की तुलना में तेज़ होगा।


मुझे लगता है कि मैं कैसे कार्यक्रम करने जा रहा हूं मेरी चिंताओं की सूची में नहीं होगा अगर मैंने अपनी दोनों भुजाएं तोड़
दीं

3
पहले तो नहीं, पक्का। लेकिन जब आप बेहतर महसूस कर रहे हों, तो घर पर अपना लैपटॉप रखें, फिर भी कुछ महीनों के लिए कार नहीं चला पाएंगे, आप कुछ काम करना चाहेंगे।
जो

13

एक काम करने वाले पेशेवर प्रोग्रामर के लिए (जहां समय पैसा है) गंभीर कार्पल टनल या हाथ की चोटों (आदि) के साथ, यह एक जूनियर / इंटर्न "जोड़ी प्रोग्रामर" को किराए पर लेने के लिए कहीं अधिक कुशल हो सकता है, और उन्हें "आवाज पहचान" करने दें। टाइपिंग।


यह एक अच्छी सोच है। जोड़ी प्रोग्रामिंग के साथ, आप तब भी दो टूटे हुए हथियारों के साथ उत्पादक हो सकते हैं जब तक आप एक साथी के साथ काम कर रहे थे जो जानता था कि कैसे टाइप करना है और कोड कैसे लिखना है।
Kyralessa

4

यहां पाइथन कन्वेंशन के एक वीडियो का लिंक दिया गया है, जहां तावीस रुड बताते हैं कि कैसे उन्होंने ड्रैगन नेचुरली स्पीकिंग को अनुकूलित किया, जो Emacs, vim और टर्मिनल में प्रोग्रामिंग और एडिटिंग के लिए अनुकूल शब्दावली बनाने के लिए अपनी पायथन प्लगइन संरचना का उपयोग करता है। प्रोग्रामिंग और विकास के क्षेत्र में आवाज की पहचान की संभावनाओं पर एक प्रेरणादायक झलक।

ध्वनि द्वारा कोड के लिए पायथन का उपयोग करना

दो साल पहले मैंने Emacs Pinkie (RSI) का एक मामला विकसित किया था ताकि मेरे हाथ सुन्न हो जाएँ और मैं अब टाइप या काम नहीं कर सकती थी। हताश, मैंने आवाज पहचानने की कोशिश की। इसके साथ पहली प्रोग्रामिंग में दर्द धीमा था लेकिन, जैसा कि मैं टाइप नहीं कर सकता था, मैंने दृढ़ता से काम किया। पायथन और एमएसीएस लिस्प में कई महीनों के वोकैब ट्विकिंग और डक्ट-टेप कोडिंग के बाद, मेरे पास एक ऐसी प्रणाली थी जिसने मुझे कभी भी हाथ से जितनी तेजी से और अधिक कुशलता से आवाज देने में सक्षम बनाया।

एक तेज़ गति वाले लाइव डेमो में, मैं पायथन का उपयोग करके एक छोटी प्रणाली बनाऊंगा, साथ ही अच्छे उपाय के लिए कुछ अन्य भाषाएं, और कीबोर्ड को छूने के बिना इसे तैनात करूंगा। डेमो देवता एक निर्धारित उपस्थिति बनाएंगे। मैं आपको विश्वास दिलाने की उम्मीद करता हूं कि आवाज की पहचान विकलांगों के लिए या सादे गद्य तक सीमित नहीं है। यह अब एक अत्यधिक प्रभावी उपकरण है जो सभी प्रोग्रामर को लाभान्वित कर सकता है ...


1
क्या आप इस बारे में अधिक व्याख्या करना चाहेंगे कि यह पूछे गए प्रश्न का उत्तर देने के लिए क्या करता है और इसकी अनुशंसा क्यों करता है? "केवल-लिंक का जवाब देता" काफी स्टैक एक्सचेंज पर स्वागत करते हैं नहीं कर रहे हैं
कुटकी

1
gnat - मैंने पोस्ट को यह प्रतिबिंबित करने के लिए अपडेट किया कि मुझे क्यों लगता है कि यह एक प्रासंगिक और उपयोगी संसाधन है। यदि लिंक प्रारूप के लिए उपयुक्त नहीं हैं, तो मैं इसे हटा दूँगा।
स्टारिनमपॉकेट्स

1

आप वास्तव में ड्रैगन NaturallySpeaking का उपयोग करके वॉयस सॉल्यूशन द्वारा एक प्रोग्रामिंग का निर्माण कर सकते हैं, लेकिन ड्रैगन NaturallySpeaking समग्र समाधान का केवल एक छोटा सा टुकड़ा होने जा रहा है।

आवाज को सफलतापूर्वक प्रोग्राम करने के लिए आपको केवल शब्दों में आवाज बदलने से परे बहुत सारी तकनीक की जरूरत होती है। समस्याओं के कुछ उदाहरण जिन्हें संबोधित किया जाना चाहिए:

आप ostreambuf_iterator जैसे अप्रभावी शब्दों को कैसे दर्ज करते हैं? प्रोग्रामिंग भाषाओं में विराम चिह्न के भारी स्तरों को आप कैसे संभालते हैं? आप खिड़कियों के बीच कैसे स्विच करेंगे?

आमतौर पर वॉयस सॉल्यूशन द्वारा एक प्रोग्रामिंग को बनाने और सीखने में कई महीने लगते हैं। जो जैसे लोगों को उम्मीद है कि एक या दो दिन में काम मिलने की उम्मीद है, वे बुरी तरह निराश होंगे।

आगे-पीछे चलना, आवाज के साथ ठीक काम करता है, जो आज्ञाओं का एक उचित सेट है। उदाहरण के लिए, आप इसकी प्रदर्शित लाइन नंबर मॉड 100 का उपयोग करके आसानी से लक्ष्य रेखा को निर्दिष्ट कर सकते हैं। शब्दों या विराम वर्णों को ले जाना एक लाइन के भीतर जाने के लिए प्रोग्रामिंग भाषाओं के साथ अच्छी तरह से काम करता है।

आप http://vocola.net/programming-by-voice-FAQ.html पर स्थित वॉयस FAQ द्वारा प्रोग्रामिंग में इन मुद्दों के बारे में अधिक जानकारी प्राप्त कर सकते हैं।


0

जो के जवाब के आधार पर जहां समस्या यह है कि आप आगे और पीछे नहीं जा सकते हैं:

आप इस समस्या को हल करने के लिए नेत्र ट्रैकिंग का अतिरिक्त उपयोग कर सकते हैं।

प्रोग्रामिंग भाषाओं को पढ़ा जा सकता है। स्मालटाक काफी पठनीय है।

10 timesRepeat: [
    Transcript show:'hello'.
    Transcript cr.
].

एक प्रोग्रामिंग भाषा की कल्पना करें जो बोलने के लिए अनुकूलित है। यह किया जा सकता है।

अगर मैंने अपने ग्राहकों से पूछा कि वे क्या चाहते हैं तो उन्होंने कहा कि वे और तेज़ घोड़ा होंगे। - हेनरी फोर्ड

इन शब्दों में: एक बोला गया टेक्स्ट इनपुट यह नहीं हो सकता है। लेकिन प्रोग्राम योग्य लक्षणों के साथ एक भाषण नियंत्रित वातावरण एक कदम आगे होगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.