एक ब्लैक-बॉक्स के रूप में एक तंत्रिका नेटवर्क का मतलब?


19

मैं अक्सर लोगों को न्यूरल नेटवर्क के बारे में एक ब्लैक-बॉक्स के रूप में बात करते हुए सुनता हूं जो आपको समझ में नहीं आता है कि यह क्या करता है या उनका क्या मतलब है। मैं वास्तव में समझ नहीं पा रहा हूं कि वे इससे क्या मतलब रखते हैं! यदि आप समझते हैं कि बैक-प्रचार कैसे काम करता है, तो यह ब्लैक-बॉक्स कैसे है?

क्या उनका मतलब यह है कि हम यह नहीं समझ सकते हैं कि कैसे वजन की गणना की गई या क्या?


1
शायद यह मदद करेगा: colah.github.io/posts/2014-03-NN-Manifolds-Topology यह लेख एक सामयिक दृष्टिकोण से तंत्रिका नेटवर्क के अंतर्निहित तंत्र को उजागर करने की कोशिश करता है, यह प्रदर्शन को समझाने के लिए बहुत ही शानदार अंतर्दृष्टि प्रदान करता है। तंत्रिका जाल।
सोल

मुझे जैक को बिंदु जोड़ना पसंद है, जब हम मशीन लर्निंग पॉइंट में एमएलपी को देखते हैं, तो तंत्रिका नेटवर्क ब्लैक बॉक्स नहीं होते हैं। सरल सिग्मोइड फ़ंक्शन के साथ हम एक समीकरण के साथ इनपुट और आउट रिलेशन की व्याख्या करने में सक्षम होंगे।

जवाबों:


38

एक तंत्रिका नेटवर्क इस अर्थ में एक ब्लैक बॉक्स है, जबकि यह किसी भी फ़ंक्शन को अनुमानित कर सकता है, इसकी संरचना का अध्ययन आपको फ़ंक्शन की संरचना पर कोई जानकारी नहीं देगा।

एक उदाहरण के रूप में, बैंकिंग व्यवसाय पर तंत्रिका नेटवर्क का एक सामान्य उपयोग ऋणदाताओं को "अच्छे भुगतानकर्ताओं" और "खराब भुगतानकर्ताओं" पर वर्गीकृत करना है। आपके पास इनपुट विशेषताओं सी (सेक्स, आयु, आय, आदि) और परिणामों के एक वेक्टर आर ("डिफ़ॉल्ट", "डिफ़ॉल्ट नहीं", आदि) का एक मैट्रिक्स है । जब आप इसे एक तंत्रिका नेटवर्क का उपयोग करके मॉडल करते हैं, तो आप मान रहे हैं कि गणितीय फ़ंक्शन के उचित अर्थ में एक फ़ंक्शन (सी)=आर । यह फ़ंक्शन f मनमाने ढंग से जटिल हो सकता है, और व्यवसाय के विकास के अनुसार बदल सकता है, इसलिए आप इसे हाथ से प्राप्त नहीं कर सकते।

तो फिर आप तंत्रिका नेटवर्क का उपयोग सन्निकटन का निर्माण करने के लिए करते हैं जिसमें एक त्रुटि दर है जो आपके आवेदन के लिए स्वीकार्य है। यह काम करता है, और सटीक मनमाने ढंग से छोटा हो सकता है - आप नेटवर्क का विस्तार कर सकते हैं, अपने प्रशिक्षण मापदंडों को ठीक कर सकते हैं और अधिक डेटा प्राप्त कर सकते हैं जब तक कि सटीक आपके लक्ष्यों को हिट नहीं करता।

ब्लैक बॉक्स का मुद्दा यह है: तंत्रिका नेटवर्क द्वारा दिए गए अनुमान आपको एफ के रूप में कोई जानकारी नहीं देंगे। वजन और फ़ंक्शन के बीच कोई सरल लिंक नहीं है। यहां तक ​​कि विश्लेषण जिसमें इनपुट विशेषता अप्रासंगिक है, एक खुली समस्या है (इस लिंक को देखें )।

इसके अलावा, पारंपरिक आंकड़ों के दृष्टिकोण से, एक तंत्रिका नेटवर्क एक गैर-पहचान योग्य मॉडल है: एक डेटासेट और नेटवर्क टोपोलॉजी को देखते हुए, अलग-अलग भार और एक ही परिणाम के साथ दो तंत्रिका नेटवर्क हो सकते हैं। यह विश्लेषण को बहुत कठिन बनाता है।

"गैर-ब्लैक बॉक्स मॉडल", या "व्याख्यात्मक मॉडल" के उदाहरण के रूप में, आपके पास प्रतिगमन समीकरण और निर्णय पेड़ हैं। पहला आपको एफ का एक बंद रूप सन्निकटन देता है जहां प्रत्येक तत्व का महत्व स्पष्ट है, दूसरा एक कुछ रिश्तेदार जोखिमों के अंतर का विवरण है।


जैसा कि यह एक पुराना उत्तर है, यह कुछ नए विकसित किए गए उपकरण प्रदान करने के लिए कुछ के लिए उपयोगी हो सकता है: "तंत्रिका नेटवर्क द्वारा दिए गए अनुमान आपको एफ के रूप में कोई अंतर्दृष्टि नहीं देंगे" - मैं कहूंगा कि अब SHAP एक करता है तंत्रिका जाल के लिए भी मॉडल की व्याख्या के महान काम। "यहां तक ​​कि विश्लेषण जिसमें इनपुट विशेषता अप्रासंगिक है, एक खुली समस्या है" - क्रमबद्धता महत्व के साथ-साथ एसएचएपी जैसे पतंगे, अब इस समस्या से बहुत अच्छी तरह से निपटते हैं।
बोबसन दुगनट

3

Google ने Inception-v3 प्रकाशित किया है । यह इमेज वर्गीकरण एल्गोरिदम के लिए एक न्यूरल नेटवर्क (एनएन) है (एक कुत्ते से एक बिल्ली कह रही है)।

कागज में वे छवि वर्गीकरण की वर्तमान स्थिति के बारे में बात करते हैं

उदाहरण के लिए, GoogleNet ने केवल 5 मिलियन मापदंडों को नियोजित किया, जिसने अपने पूर्ववर्ती एलेक्सनेट के संबंध में 12x की कमी का प्रतिनिधित्व किया, जिसमें 60 मिलियन मापदंडों का उपयोग किया गया था। इसके अलावा, VGGNet ने एलेक्सनेट की तुलना में लगभग 3x अधिक मापदंडों को नियोजित किया था।

और यही कारण है कि हम मूल रूप से एनएन को ब्लैक बॉक्स कहते हैं। अगर मैं एक छवि वर्गीकरण मॉडल को प्रशिक्षित करता हूं - 10 मिलियन मापदंडों के साथ - और इसे आपको सौंप देता हूं। तुम्हारे द्वारा इससे क्या किया जा सकता है?

आप निश्चित रूप से इसे चला सकते हैं और छवियों को वर्गीकृत कर सकते हैं। यह बहुत अच्छा काम करेगा! लेकिन आप सभी भारों, गैसों और नेटवर्क संरचना का अध्ययन करके निम्नलिखित प्रश्नों में से किसी का भी उत्तर नहीं दे सकते हैं।

  • क्या यह नेटवर्क पूडल से एक हुस्की को बता सकता है?
  • एल्गोरिथ्म के लिए कौन सी वस्तुओं को वर्गीकृत करना आसान है, जो मुश्किल है?
  • कुत्ते का कौन सा भाग सही ढंग से वर्गीकृत करने में सक्षम होने के लिए सबसे महत्वपूर्ण है? पूंछ या पैर?
  • अगर मैं एक कुत्ते पर सिर काटता हूँ, तो क्या होता है, और क्यों?

आप शायद केवल एनएन चलाकर प्रश्नों का उत्तर दे सकते हैं और परिणाम (ब्लैक बॉक्स) देख सकते हैं, लेकिन आपके पास यह समझने का कोई बदलाव नहीं है कि यह किनारे के मामलों में ऐसा क्यों व्यवहार कर रहा है।


मुझे लगता है कि कम से कम एक प्रश्न ('कुत्ते का कौन सा भाग सही तरीके से वर्गीकृत किया जा सकता है? पूंछ या पैर?') के लिए सबसे महत्वपूर्ण है, यदि आप डिक ज़ेनिलिटोनल पर मैट ज़ायलर के लेख और वीडियो को देखते हैं? नेटवर्क
एलेक्स
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.