वॉयस रिकॉग्निशन सॉफ्टवेयर के साथ प्रोग्रामिंग [बंद]

10

बंद हो गया । इस प्रश्न पर अधिक ध्यान देने की आवश्यकता है । यह वर्तमान में उत्तर स्वीकार नहीं कर रहा है।

इस प्रश्न को सुधारना चाहते हैं? प्रश्न को अपडेट करें ताकि यह इस पोस्ट को संपादित करके केवल एक समस्या पर केंद्रित हो ।

5 साल पहले बंद हुआ ।

मैंने कुछ साल पहले ड्रैगन नेचुरली स्पीकिंग का इस्तेमाल किया था और सोच रहा था कि क्या यह प्रोग्रामिंग के लिए एक व्यवहार्य समाधान होगा?

मैं और अधिक सोच रहा था यदि आप अपने हाथ या कुछ और को तोड़ दें जो प्रोग्रामिंग के लिए एक प्रमुख बाधा होगी।

एसओ पर यह वही सवाल था, लेकिन कभी जवाब नहीं दिया गया।

productivity

— जिम
स्रोत

5

यह एक दिलचस्प विचार है, लेकिन मुझे लगता है कि भाषा वाक्य रचना वास्तव में उस भाषा के लिए काम करने के लिए समर्पित कुछ भी नहीं

— करेगी

1

विराम चिह्न समस्या कोडिंग से परे एक बहुत बड़ा संपादन शामिल है, कुछ ऐसा जो ध्वनि नियंत्रण के लिए अच्छा नहीं है।

— लोरेन Pechtel

1

अधिकांश प्रोग्रामिंग भाषाओं के लिए आम तौर पर विराम चिह्न के दुरुपयोग की मात्रा के साथ यह कोशिश करने से विक्टर बोरगे के फोनेटिक विराम चिह्न कॉमेडी स्किट का ध्यान आता है।

— हॉटपावर 2

आप वी.एस. के साथ स्वत: पूर्ण के साथ काम करने की कल्पना कर सकते हैं?

— चाड हैरिसन

1

यह वास्तविक कोडिंग के अलावा अन्य सामानों के लिए ड्रैगन डिक्टेट का उपयोग करने के लिए एक विचार हो सकता है, जैसे संकलित ऐप लॉन्च करना, ईमेल की रचना / उत्तर देना, कुछ सामान्य चीजें जो वास्तविक कोडिंग को विचलित या विलंबित कर सकती हैं।

— गोर्ट्रोन

18

मैं व्यक्तिगत अनुभव से इसका उत्तर दे सकता हूं। कुछ साल पहले, मैंने एक दुर्घटना में दोनों हथियार तोड़ दिए । चूंकि मेरी नौकरी पूर्णकालिक प्रोग्रामिंग थी, इसलिए यह एक समस्या थी। कुछ मदद से, मैंने अपने लैपटॉप पर ड्रैगन स्थापित किया।

यह समय की बर्बादी थी।

कोड प्राकृतिक भाषा की तरह ज्यादा नहीं है; यह मुख्य रूप से लिखा जाता है, बोला नहीं जाता है। मुझे पता है कि y_z = (x < 0 ? -x : x) + 2;इसका क्या मतलब है, फिर भी मुझे नहीं पता कि मैं इसका उच्चारण कैसे करूंगा, और न ही मुझे परवाह है।

लिखित-केवल भाषा होने के नाते, कोड चरित्र स्तर पर बहुत सटीक है। वहाँ बीच एक बड़ा अंतर है (x+2)*3और (x+2*3)। शब्दों पर ध्यान देने के लिए भाषण-से-पाठ कार्यक्रम अच्छे हैं, वर्ण नहीं। विशिष्ट वर्णों को जोड़ने के लिए "बाएं कोष्ठक, x, प्लस चिह्न, दो, दाएं कोष्ठक" जैसी बहुत सी बातें कहनी पड़ती हैं।

जब मैं कोडिंग कर रहा होता हूं, तो मैं बहुत अधिक मूविंग और रीराइटिंग करता हूं। भाषा की एकल धारा के लिए भाषण-से-पाठ अच्छा है। यह सब जगह आगे और पीछे जाने के लिए अच्छा नहीं है।

कोडिंग में बहुत सारे कार्य टाइपिंग के बराबर नहीं हैं, जो कि सभी स्पीच-टू-टेक्स्ट के लिए अच्छा है। इस बारे में सोचें कि आप कोड के किसी अन्य मॉड्यूल को देखने के लिए कितनी बार टैब बदलते हैं, या आप अपने संपादक में एक फ़ंक्शन को कितनी बार मोड़ते और प्रकट करते हैं।

इसलिए यदि आपके पास भाषण-से-पाठ कार्यक्रम है, तो इसे आज़माएं और अपने लिए देखें। मुझे नहीं लगता कि आप बहुत प्रभावित होंगे।

संयोग से, एक ही बार में दोनों बाहों को मत तोड़ो। एक समय में एक को तोड़ो, यह बहुत आसान है।

अगर मेरे पास केवल एक टूटी हुई भुजा होती, तो मैं बस एक बार अपनी सारी कोडिंग कर लेता। यह अभी भी स्पीच-टू-टेक्स्ट सॉफ़्टवेयर का उपयोग करने की तुलना में तेज़ होगा।

— जो
स्रोत

मुझे लगता है कि मैं कैसे कार्यक्रम करने जा रहा हूं मेरी चिंताओं की सूची में नहीं होगा अगर मैंने अपनी दोनों भुजाएं तोड़

— दीं

3

पहले तो नहीं, पक्का। लेकिन जब आप बेहतर महसूस कर रहे हों, तो घर पर अपना लैपटॉप रखें, फिर भी कुछ महीनों के लिए कार नहीं चला पाएंगे, आप कुछ काम करना चाहेंगे।

— जो

13

एक काम करने वाले पेशेवर प्रोग्रामर के लिए (जहां समय पैसा है) गंभीर कार्पल टनल या हाथ की चोटों (आदि) के साथ, यह एक जूनियर / इंटर्न "जोड़ी प्रोग्रामर" को किराए पर लेने के लिए कहीं अधिक कुशल हो सकता है, और उन्हें "आवाज पहचान" करने दें। टाइपिंग।

— hotpaw2
स्रोत

यह एक अच्छी सोच है। जोड़ी प्रोग्रामिंग के साथ, आप तब भी दो टूटे हुए हथियारों के साथ उत्पादक हो सकते हैं जब तक आप एक साथी के साथ काम कर रहे थे जो जानता था कि कैसे टाइप करना है और कोड कैसे लिखना है।

— Kyralessa

4

यहां पाइथन कन्वेंशन के एक वीडियो का लिंक दिया गया है, जहां तावीस रुड बताते हैं कि कैसे उन्होंने ड्रैगन नेचुरली स्पीकिंग को अनुकूलित किया, जो Emacs, vim और टर्मिनल में प्रोग्रामिंग और एडिटिंग के लिए अनुकूल शब्दावली बनाने के लिए अपनी पायथन प्लगइन संरचना का उपयोग करता है। प्रोग्रामिंग और विकास के क्षेत्र में आवाज की पहचान की संभावनाओं पर एक प्रेरणादायक झलक।

ध्वनि द्वारा कोड के लिए पायथन का उपयोग करना

दो साल पहले मैंने Emacs Pinkie (RSI) का एक मामला विकसित किया था ताकि मेरे हाथ सुन्न हो जाएँ और मैं अब टाइप या काम नहीं कर सकती थी। हताश, मैंने आवाज पहचानने की कोशिश की। इसके साथ पहली प्रोग्रामिंग में दर्द धीमा था लेकिन, जैसा कि मैं टाइप नहीं कर सकता था, मैंने दृढ़ता से काम किया। पायथन और एमएसीएस लिस्प में कई महीनों के वोकैब ट्विकिंग और डक्ट-टेप कोडिंग के बाद, मेरे पास एक ऐसी प्रणाली थी जिसने मुझे कभी भी हाथ से जितनी तेजी से और अधिक कुशलता से आवाज देने में सक्षम बनाया।

एक तेज़ गति वाले लाइव डेमो में, मैं पायथन का उपयोग करके एक छोटी प्रणाली बनाऊंगा, साथ ही अच्छे उपाय के लिए कुछ अन्य भाषाएं, और कीबोर्ड को छूने के बिना इसे तैनात करूंगा। डेमो देवता एक निर्धारित उपस्थिति बनाएंगे। मैं आपको विश्वास दिलाने की उम्मीद करता हूं कि आवाज की पहचान विकलांगों के लिए या सादे गद्य तक सीमित नहीं है। यह अब एक अत्यधिक प्रभावी उपकरण है जो सभी प्रोग्रामर को लाभान्वित कर सकता है ...

— starsinmypockets
स्रोत

1

क्या आप इस बारे में अधिक व्याख्या करना चाहेंगे कि यह पूछे गए प्रश्न का उत्तर देने के लिए क्या करता है और इसकी अनुशंसा क्यों करता है? "केवल-लिंक का जवाब देता" काफी स्टैक एक्सचेंज पर स्वागत करते हैं नहीं कर रहे हैं

— कुटकी

1

gnat - मैंने पोस्ट को यह प्रतिबिंबित करने के लिए अपडेट किया कि मुझे क्यों लगता है कि यह एक प्रासंगिक और उपयोगी संसाधन है। यदि लिंक प्रारूप के लिए उपयुक्त नहीं हैं, तो मैं इसे हटा दूँगा।

— स्टारिनमपॉकेट्स

1

आप वास्तव में ड्रैगन NaturallySpeaking का उपयोग करके वॉयस सॉल्यूशन द्वारा एक प्रोग्रामिंग का निर्माण कर सकते हैं, लेकिन ड्रैगन NaturallySpeaking समग्र समाधान का केवल एक छोटा सा टुकड़ा होने जा रहा है।

आवाज को सफलतापूर्वक प्रोग्राम करने के लिए आपको केवल शब्दों में आवाज बदलने से परे बहुत सारी तकनीक की जरूरत होती है। समस्याओं के कुछ उदाहरण जिन्हें संबोधित किया जाना चाहिए:

आप ostreambuf_iterator जैसे अप्रभावी शब्दों को कैसे दर्ज करते हैं? प्रोग्रामिंग भाषाओं में विराम चिह्न के भारी स्तरों को आप कैसे संभालते हैं? आप खिड़कियों के बीच कैसे स्विच करेंगे?

आमतौर पर वॉयस सॉल्यूशन द्वारा एक प्रोग्रामिंग को बनाने और सीखने में कई महीने लगते हैं। जो जैसे लोगों को उम्मीद है कि एक या दो दिन में काम मिलने की उम्मीद है, वे बुरी तरह निराश होंगे।

आगे-पीछे चलना, आवाज के साथ ठीक काम करता है, जो आज्ञाओं का एक उचित सेट है। उदाहरण के लिए, आप इसकी प्रदर्शित लाइन नंबर मॉड 100 का उपयोग करके आसानी से लक्ष्य रेखा को निर्दिष्ट कर सकते हैं। शब्दों या विराम वर्णों को ले जाना एक लाइन के भीतर जाने के लिए प्रोग्रामिंग भाषाओं के साथ अच्छी तरह से काम करता है।

आप http://vocola.net/programming-by-voice-FAQ.html पर स्थित वॉयस FAQ द्वारा प्रोग्रामिंग में इन मुद्दों के बारे में अधिक जानकारी प्राप्त कर सकते हैं।

— user2278379
स्रोत

0

जो के जवाब के आधार पर जहां समस्या यह है कि आप आगे और पीछे नहीं जा सकते हैं:

आप इस समस्या को हल करने के लिए नेत्र ट्रैकिंग का अतिरिक्त उपयोग कर सकते हैं।

प्रोग्रामिंग भाषाओं को पढ़ा जा सकता है। स्मालटाक काफी पठनीय है।

10 timesRepeat: [
    Transcript show:'hello'.
    Transcript cr.
].

एक प्रोग्रामिंग भाषा की कल्पना करें जो बोलने के लिए अनुकूलित है। यह किया जा सकता है।

अगर मैंने अपने ग्राहकों से पूछा कि वे क्या चाहते हैं तो उन्होंने कहा कि वे और तेज़ घोड़ा होंगे। - हेनरी फोर्ड

इन शब्दों में: एक बोला गया टेक्स्ट इनपुट यह नहीं हो सकता है। लेकिन प्रोग्राम योग्य लक्षणों के साथ एक भाषण नियंत्रित वातावरण एक कदम आगे होगा।

— उपयोगकर्ता
स्रोत