क्या गणित के समीकरणों को हल करने के लिए तंत्रिका नेटवर्क को प्रशिक्षित करना संभव है?


24

मुझे पता है कि तंत्रिका नेटवर्क संभवतः ऐसा करने के लिए डिज़ाइन नहीं किए गए हैं, हालांकि, काल्पनिक रूप से पूछें, क्या गणित के समीकरणों को हल करने के लिए गहरे तंत्रिका नेटवर्क (या समान) को प्रशिक्षित करना संभव है?

इसलिए 3 इनपुट दिए गए: 1 नंबर, ऑपरेटर साइन नंबर (1 - +, 2 - -, 3 - /, 4 - *, और इसी तरह), और 2 नंबर द्वारा दर्शाया गया है , फिर प्रशिक्षण के बाद नेटवर्क मुझे मान्य परिणाम देना चाहिए।

उदाहरण 1 ( 2+2):

  • इनपुट 1 2:; इनपुट 2: 1( +); इनपुट 3 2:; अपेक्षित उत्पादन:4
  • इनपुट 1 10:; इनपुट 2: 2( -); इनपुट 3 10:; अपेक्षित उत्पादन:0
  • इनपुट 1 5:; इनपुट 2: 4( *); इनपुट 3 5:; अपेक्षित उत्पादन:25
  • इसलिए

उपरोक्त को अधिक परिष्कृत उदाहरणों तक बढ़ाया जा सकता है।

क्या यह संभव है? यदि ऐसा है, तो नेटवर्क किस प्रकार सीख सकता है / प्राप्त कर सकता है?



1
यह प्रासंगिक हो सकता है - github.com/deepmind/mathematics_dataset
गणेशता

जवाबों:


21

हाँ, यह किया गया है!

हालाँकि, एप्लिकेशन कैलकुलेटर या ऐसा कुछ भी बदलने के लिए नहीं हैं। मैं जिस लैब से जुड़ा हुआ हूं, वह यह समझने के लिए समान तर्क के तंत्रिका नेटवर्क मॉडल विकसित करती है कि मनुष्य इन समस्याओं को कैसे हल कर सकता है। यह उस क्षेत्र का एक हिस्सा है जिसे गणितीय संज्ञान के रूप में जाना जाता है । दुर्भाग्य से, हमारी वेबसाइट बहुत जानकारीपूर्ण नहीं है, लेकिन यहाँ एक है लिंक इस तरह के काम का एक उदाहरण है।

इसके अलावा, हाल ही में बाह्य मेमोरी स्टोर (जैसे न्यूरल ट्यूरिंग मशीन) को शामिल करने के लिए तंत्रिका नेटवर्क का विस्तार करने पर काम गणित की समस्याओं को हल करने के लिए अवधारणा का एक अच्छा प्रमाण के रूप में उपयोग करते हैं। ऐसा इसलिए है क्योंकि कई अंकगणित समस्याओं में संग्रहीत मध्यवर्ती परिणामों के साथ लंबी प्रक्रियाएं शामिल हैं। लंबे बाइनरी जोड़ और गुणा पर इस पेपर के अनुभाग देखें ।


मेरे लिए न केवल तंत्रिका जाल बल्कि बाह्य स्मृति के साथ तंत्रिका आर्किटेक्चर हैं। एनटीएम और डीएनसी जैसे आर्किटेक्चर कम से कम पथ जैसे एल्गोरिदम को हल करने के लिए उपयोग कर सकते हैं क्योंकि उनके पास क्या किया जा रहा है, इसका ट्रैक रखते हुए पुनरावृत्ति प्रक्रिया को निष्पादित करने की क्षमता है (कोई भयावह भूल नहीं है)। लेकिन मेरे लिए केवल सुविचारित शिक्षा का उपयोग करना गलत है जैसा कि दूसरे उत्तर में बताया गया है।
शामे सिरियावर्धन

पहला लिंक मृत है, क्या आपके पास प्रतिस्थापन है?
kenorb

दोनों लिंक सिर्फ मेरे लिए काम करते थे, क्या शानदार पेपर था!
ज़क्क डियाज़

8

ज़रुरी नहीं।

छिपे हुए चर होने पर इनपुट के बीच गैर-रैखिक संबंध निर्धारित करने के लिए तंत्रिका नेटवर्क अच्छे हैं। रिश्तों के ऊपर के उदाहरण रैखिक हैं, और कोई छिपे हुए चर नहीं हैं। लेकिन भले ही वे गैर-रेखीय थे, एक पारंपरिक एएनएन डिजाइन इसे पूरा करने के लिए अच्छी तरह से अनुकूल नहीं होगा।

परतों का सावधानीपूर्वक निर्माण करके और कसकर प्रशिक्षण का पर्यवेक्षण करते हुए, आप इनपुट के लिए लगातार उत्पादन करने के लिए एक नेटवर्क प्राप्त कर सकते हैं 4.01, कहते हैं, इनपुट के लिए: 2, 1 (+), और 2, लेकिन यह केवल गलत नहीं है, यह स्वाभाविक रूप से अविश्वसनीय है प्रौद्योगिकी का अनुप्रयोग।


5

1) यह संभव है! वास्तव में, यह लोकप्रिय गहरे सीखने की रूपरेखा केर का एक उदाहरण है। की जाँच करें स्रोत कोड को देखने के लिए इस लिंक पर

2) यह विशेष उदाहरण वर्णों के अनुक्रम के रूप में समस्या को संसाधित करने के लिए एक आवर्तक तंत्रिका नेटवर्क (RNN) का उपयोग करता है, जो वर्णों के अनुक्रम का निर्माण करते हैं जो उत्तर बनाते हैं। ध्यान दें कि यह दृष्टिकोण स्पष्ट रूप से अलग है कि मनुष्य सरल जोड़ समस्याओं को हल करने के बारे में कैसे सोचते हैं, और शायद ऐसा नहीं है कि आप कभी भी इस तरह की समस्या को हल करने के लिए कंप्यूटर चाहते हैं। अधिकतर यह केरस का उपयोग करते हुए अनुक्रम सीखने का एक उदाहरण है। अनुक्रमिक या समय-श्रृंखला इनपुट को संभालते समय, RNN एक लोकप्रिय विकल्प है।


1

हां - ऐसा लगता है कि अब यह हासिल करना संभव हो गया है, उदाहरण के लिए आवश्यक है कि आपने जो पेपर दिया है वह एक डीएल समाधान का वर्णन काफी कठिन समस्या के लिए करता है - प्राकृतिक भाषा में वर्णित प्रोग्राम के लिए स्रोत कोड का निर्माण करना

इन दोनों को प्रतिगमन समस्याओं के रूप में वर्णित किया जा सकता है (अर्थात लक्ष्य सेट पर कुछ हानि फ़ंक्शन को कम करना है), लेकिन प्राकृतिक भाषा के मामले में खोज स्थान बहुत बड़ा है।


0

स्वचालित प्रमेय साबित करने के लिए काफी अच्छी तरह से स्थापित क्षेत्र है । यह सबसे अधिक संभावना है कि समीकरणों को हल करना शामिल है, लेकिन जरूरी नहीं कि इसमें एआई शामिल हो। क्रॉस वैलिडेटेड स्टेक्सएक्सचेंज के इस पोस्ट में विषय पर कुछ और जानकारी है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.