आपने सुना होगा कि तंत्रिका नेटवर्क " सार्वभौमिक फ़ंक्शन सन्निकटन " हैं। संक्षेप में, साइबेंको प्रमेय का कहना है कि किसी भी फ़ंक्शन को वास्तविक से मानचित्रण करने के लिए, आप इसे सिग्मॉइड सक्रियण कार्यों के साथ एक तंत्रिका नेटवर्क के साथ अनुमानित कर सकते हैं। वास्तव में, यह पता चलता है कि तंत्रिका नेटवर्क आपको किसी भी फ़ंक्शन की गणना करने की अनुमति देता है जो कि ट्यूरिंग मशीन द्वारा गणना की जाती है (यानी कुछ भी आप गणना करने के लिए एक एल्गोरिथ्म लिख सकते हैं)। दुर्भाग्य से, ये प्रमाण केवल यह कहते हैं कि न्यूरॉन्स और भार के कुछ परिमित विन्यास के लिए, आप किसी भी फ़ंक्शन का अनुमान लगा सकते हैं।
सिद्धांत सभी अच्छा और बांका है, लेकिन आपका सवाल यह है कि वास्तव में न्यूरॉन्स और वेट के एक सेट में कुछ फ़ंक्शन की गणना को कैसे समझाया जाए, इसकी तर्ज पर अधिक लगता है। उदाहरण के लिए, एक साधारण उदाहरण पर विचार करें - अनन्य-या। XOR दो इनपुट लेता है, उन इनपुट को पास करता है। जब एक और केवल एक इनपुट सक्रिय होता है, तो आउटपुट नोड सक्रिय होता है। दोनों के साथ या कोई भी इनपुट सक्रिय नहीं है, तो आउटपुट नोड सक्रिय नहीं है।
ध्यान दें कि तीन छिपे हुए नोड्स अलग-अलग चीजें करते हैं। बाएं और दाएं सबसे बाएं नोड्स केवल सम्मान इनपुट नोड्स सक्रियण से गुजरते हैं। मध्य न्यूरॉन दो आदानों को लेता है और किसी तरह उन्हें नकार देता है यदि वे दोनों हैं। इनपुट के इस चतुर संयोजन और पुनर्संयोजन अनिवार्य रूप से एक तंत्रिका नेटवर्क में कैसे काम किया जाता है।
स्पष्ट रूप से अधिक जटिल कार्यों के लिए संयोजन और पुनर्संयोजन को अधिक चतुर और जटिल तरीकों से किया जाना चाहिए, लेकिन यह संक्षेप में है कि निम्न स्तर पर क्या होता है। पागल बात यह है कि यह वास्तव में किसी भी कम्प्यूटेशनल फ़ंक्शन की गणना करने की आवश्यकता है! तो फिर, ट्यूरिंग मशीनें भी भ्रामक रूप से सरल हो जाती हैं ...
समस्या यह है कि हमारे पास वास्तव में तंत्रिका नेटवर्क को उत्पन्न करने का एक तरीका नहीं है जो कुछ मनमाने फ़ंक्शन की गणना करता है। प्रमाण केवल हमें बताते हैं कि वहाँ कुछ नेटवर्क है जो यह कर सकता है। जब हम अपने तंत्रिका नेटवर्क को प्रशिक्षित करते हैं, तो हम बस एक नेटवर्क खोजने की कोशिश कर रहे हैं जो बहुत करीब है।
छवि मान्यता के संदर्भ में, आप नेटवर्क में एन्कोडिंग पैटर्न की कल्पना कर सकते हैं। उदाहरण के लिए, संख्या '1' को पहचानने के लिए, आप एक छिपे हुए नोड की कल्पना कर सकते हैं, जो कि पिक्सेल के एक स्तंभ की अपेक्षा करता है, जिसमें अधिकतर या सभी सक्रिय होते हैं, जिसमें पड़ोसी पिक्सेल बंद होते हैं। यह छिपा नोड उस विशेष कॉलम में एक सीधी रेखा को पहचानने में काफी अच्छा हो सकता है। इनमें से पर्याप्त को एक साथ रखो और बहुत जल्द ही आपको नोड्स का एक गुच्छा मिला है जो आपकी छवि के पर्याप्त स्थानों में ऐसा करता है कि अगर मैं नेटवर्क को एक दिखाता हूं, तो पर्याप्त सीधी रेखा छिपा नोड सक्रिय हो जाएगा, जो '1' का संकेत देता है। पाठ्यक्रम की समस्या नेटवर्क को सामान्य बनाने की है ताकि यह विभिन्न प्रकार के इनपुट को पहचान सके।
उम्मीद है कि यह आपको कम या ज्यादा समझने में मदद करता है कि तंत्रिका नेटवर्क कैसे संगणना कर सकता है। हालांकि, आपने एक ऐसे बिंदु पर मारा है जो तंत्रिका नेटवर्क के बारे में महत्वपूर्ण है: सामान्य तौर पर यह समझना मुश्किल है कि नेटवर्क किसी विशेष आउटपुट को क्यों थूकता है, खासकर जब आप मानते हैं कि छवि मान्यता जैसी किसी चीज के लिए, नेटवर्क आमतौर पर होते हैं इतना बड़ा कि मनुष्य के पास मशीन के चलने वाले हिस्सों में से प्रत्येक को समझने में कठिन समय है। इस मामले को और उलझाते हुए कि सामान्य रूप से अधिकांश तंत्रिका नेटवर्क में वास्तव में प्रत्येक छोटी सुविधा के लिए एक छिपा हुआ नोड नहीं होता है जो नेटवर्क डेटा के बारे में सीख सकता है। इसके बजाय, संख्या 1 को वर्गीकृत करने के लिए एक सीधी रेखा की तरह कुछ का पता लगाना कई छिपे हुए नोड्स पर गैर-केंद्रीकृत तरीके से होगा। अन्य एल्गोरिदम,
यदि आप अधिक पढ़ने की तलाश कर रहे हैं, तो मैं अति जंक पर इस ट्यूटोरियल के माध्यम से पढ़ने की सलाह देता हूं । यह आपको बताता है कि कैसे एक तंत्रिका नेटवर्क काम करता है और यहां तक कि एक लक्ष्य की ओर एक टैंक ड्राइव करने के लिए तंत्रिका नेटवर्क प्राप्त करने के लिए एक सरल कोड उदाहरण देता है। ट्यूटोरियल हालांकि बैकप्रॉपैगैशन को कवर नहीं करता है, जो तंत्रिका नेटवर्क के प्रशिक्षण का सबसे आम तरीका है, और इसके बजाय एक सरल आनुवंशिक एल्गोरिथ्म का उपयोग करता है। एक बार जब वह जेनेटिक्स पर बात करना शुरू कर दे, मुझे लगता है कि आप पढ़ना बंद कर सकते हैं ...