लेनेट में न्यूरॉन्स का ग्रहणशील क्षेत्र


9

मैं सीएनएन के ग्रहणशील क्षेत्रों को बेहतर ढंग से समझने की कोशिश कर रहा हूं। ऐसा करने के लिए मैं लेनेट में प्रत्येक न्यूरॉन के ग्रहणशील क्षेत्र की गणना करना चाहूंगा। एक सामान्य एमएलपी के लिए यह आसान है ( http://deeplearning.net/tutorial/lenet.html#sparse-connectivity देखें ), लेकिन एक या एक से अधिक संक्रामक परतों के बाद एक परत में न्यूरॉन के ग्रहणशील क्षेत्र की गणना करना अधिक कठिन है और पूलिंग परतें।

2 में एक न्यूरॉन का ग्रहणशील क्षेत्र क्या है। दृढ़ परत? निम्नलिखित सबसम्पलिंग / पूलिंग लेयर में यह कितना बड़ा है? और इनकी गणना के लिए सूत्र क्या है?


1
संबंधित साइडबार ने इस सवाल का सुझाव दिया , जो उस तरह की चीज के लिए प्रासंगिक है जिसके बारे में आप सोच रहे हैं और दिलचस्प है।
डगल

जवाबों:


2

यदि आप एक मानक एमएलपी के उदाहरण के रूप में एक दृढ़ जाल के बारे में सोचते हैं, तो आप उसी तरह से ग्रहणशील क्षेत्रों का पता लगा सकते हैं जैसे कि आपके द्वारा जुड़े उदाहरण के रूप में।

याद रखें कि एक संकेंद्रित परत अनिवार्य रूप से कई दोहराया पैटर्न के साथ एक परत के लिए शॉर्टहैंड है, जैसा कि इस छवि में है ( इस उत्तर से , मूल रूप से यहां से ):

दृढ़ संकल्प का दृश्य उदाहरण

उस छवि के प्रत्येक "गंतव्य पिक्सेल" एक न्यूरॉन से मेल खाते हैं जिनके इनपुट स्रोत छवि में नीले वर्ग हैं। हो सकता है कि आपके नेटवर्क आर्किटेक्चर के आधार पर कॉन्फोल्यूशन बिल्कुल उस तरह के पिक्सल के अनुरूप न हो, लेकिन यह एक ही विचार है। उन सभी विवादास्पद न्यूरॉन्स के लिए इनपुट के रूप में उपयोग किए जाने वाले वजन बंधे हैं, लेकिन आप यहां क्या सोच रहे हैं, इसके लिए अप्रासंगिक है।

पूलिंग न्यूरॉन्स को उसी तरह से सोचा जा सकता है, जो उनके प्रत्येक इनपुट के ग्रहणशील क्षेत्रों को मिलाते हैं।


अच्छा दृश्य! आपका उदाहरण एकदम सही समझ में आता है। अगर मैंने कन्वेक्शन लेयर के बाद 2x2 पूलिंग लेयर जोड़ी है, तो पूलिंग लेयर में प्रत्येक न्यूरॉन में केवल 4x4 का एक ग्रहणशील क्षेत्र होगा, जबकि कंफ्यूजन लेयर ओवरलैप में न्यूरॉन्स के रूप में चार 3x3 फील्ड को मिक्स करने के बावजूद। मैं आसानी से इसके चारों ओर अपना सिर प्राप्त कर सकता हूं और पूलिंग आकार आदि के आधार पर ग्रहणशील क्षेत्र के लिए कुछ सरल सूत्र तैयार कर सकता हूं। हालांकि, यह निम्नलिखित जटिल परत के लिए अधिक जटिल हो जाता है क्योंकि ग्रहणशील क्षेत्र अब प्रदूषक परत के लिए स्ट्राइड पर भी निर्भर करता है। RF के लिए कौन सा सूत्र इसे ध्यान में रखता है?
पीर

तो स्रोत पिक्सेल में ग्रहणशील क्षेत्र के आकार में नीला वर्ग है?
चार्ली पार्कर

मेरा एक ही प्रश्न है, "फास्टर आर-सीएनएन: टुवर्ड्स रियल-टाइम ऑब्जेक्ट डिटेक्शन विथ रीजन प्रपोजल नेटवर्क्स", यह खंड 3.1 में कहता है, ZF और VGG16 का ग्रहणशील क्षेत्र 171 और 228 है। नेटवर्क कॉन्फ़िगरेशन से। आशा है कि कोई मेरे लिए यह स्पष्ट कर सकता है।
किम

0

फास्टर-आरएनएन में, प्रभावी ग्रहणशील क्षेत्र की गणना निम्नानुसार की जा सकती है (VGG16):

Img->
Conv1 (3) -> Conv1 (3) -> Pool1 (2) ==>
Conv2 (3) -> Conv2 (3) -> Pool2 (2) ==>
Conv3 (3) -> Conv3 (3) ) -> Conv3 (3) -> Pool3 (2) ==
Conv4 (3) -> Conv4 (3) -> Conv4 (3) -> Pool4 (2) ==>
Conv5 (3) -> Conv5 (3) ) -> Conv5 (3) ====>
सुविधा नक्शे में एक 3 * 3 खिड़की।
चलो सादगी के लिए एक आयाम लेते हैं। यदि हम आकार 3 से वापस प्राप्त करते हैं, तो मूल ग्रहणशील क्षेत्र:
1)। Conv5 की शुरुआत में: 3 + 2 + 2 + 2 = 9
2)। Conv4 की शुरुआत में: 9 * 2 + 2 + 2 + 2 = 24
3)। Conv3 की शुरुआत में: 24 * 2 + 2 + 2 + 2 = 54
4)। Conv2 की शुरुआत में: 54 * 2 + 2 + 2 = 112
5)। Conv1 (मूल इनपुट) की शुरुआत में: 112 * 2 + 2 + 2 = 228

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.