आपके द्वारा पोस्ट किया गया दूसरा दृढ़ तंत्रिका नेटवर्क (CNN) आर्किटेक्चर इस पेपर से आता है । पेपर में लेखक S2 और C3 की परतों के बीच क्या होता है, का विवरण देते हैं। उनकी व्याख्या हालांकि बहुत स्पष्ट नहीं है। मैं कहूंगा कि यह सीएनएन आर्किटेक्चर 'मानक' नहीं है, और यह सीएनएन के लिए पहले उदाहरण के रूप में काफी भ्रामक हो सकता है।
सबसे पहले, यह स्पष्ट करने की आवश्यकता है कि फ़ीचर मैप कैसे बनाए जाते हैं और फ़िल्टर के साथ उनका क्या संबंध है। एक फ़ीचर मैप एक फ़ीचर मैप के साथ फ़िल्टर के कनविक्शन का परिणाम है। आइए INPUT और C1 की परतों को एक उदाहरण के रूप में लेते हैं। सबसे आम मामले में, आकार C1 में के आकार के 6 फ़ीचर मानचित्र प्राप्त करने के लिए आपको आकार के 6 फ़िल्टर्स की ज़रूरत है ( आकार की छवि के 'मान्य' कनवल्शन का परिणाम एक के साथ आकार के फिल्टर , यह मानते हुए , आकार की है२ × २ 28५ × ५म× एमएन× एनम≥ एन( एम- एन+ 1 ) × ( एम- एन+ 1 )। हालाँकि, आप 6 फ़िल्टरों को 6 या उससे अधिक फ़िल्टरों द्वारा निर्मित फ़ीचर मानचित्रों के संयोजन द्वारा निर्मित कर सकते हैं (जैसे कि उन्हें संक्षेप में कहें)। कागज में, परत C1 के लिए हालांकि छंटनी का कुछ भी निहित नहीं है।
परत S2 और परत C3 के बीच क्या होता है, निम्नलिखित है। परत S2 में 6 फ़ीचर मानचित्रों से निर्मित परत C3 में 16 फ़ीचर मानचित्र हैं। परत C3 में फिल्टर की संख्या वास्तव में स्पष्ट नहीं है। वास्तव में, केवल आर्किटेक्चर आरेख से, कोई यह निर्धारित नहीं कर सकता है कि उन 16 फ़ीचर मानचित्रों का निर्माण करने वाले फ़िल्टर की सही संख्या क्या है। कागज के लेखक निम्नलिखित तालिका प्रदान करते हैं (पृष्ठ 8):
तालिका के साथ वे निम्नलिखित स्पष्टीकरण प्रदान करते हैं (पृष्ठ 7 का नीचे):
Layer C3 16 फ़ीचर मैप्स के साथ एक संकेंद्रित परत है। प्रत्येक फ़ीचर मैप में प्रत्येक यूनिट S2 के फ़ीचर मैप्स के सबसेट में समान स्थानों पर कई पड़ोस से जुड़ी होती है ।५ × ५
तालिका में लेखक दिखाते हैं कि परत C3 में प्रत्येक फीचर मैप 3 या अधिक फीचर मैप्स (पेज 8) के संयोजन द्वारा निर्मित है:
पहले छह C3 फीचर मैप्स S2 में तीन फीचर मैप्स के प्रत्येक सन्निहित सबसेट से इनपुट लेते हैं। अगले छह चार में से प्रत्येक सन्निहित सबसेट से इनपुट लेते हैं। अगले तीन चार के कुछ बंद सबसेट से इनपुट लेते हैं। अंत में, अंतिम सभी S2 फीचर मैप से इनपुट लेता है।
अब, परत C3 में कितने फिल्टर हैं? दुर्भाग्य से, वे इसे स्पष्ट नहीं करते हैं। दो सरल संभावनाएं होंगी:
- C3 फ़ीचर मैप के अनुसार S2 फ़ीचर मैप में एक फ़िल्टर होता है, यानी समान C3 फ़ीचर मैप से जुड़े S2 फ़ीचर मैप्स के बीच कोई फ़िल्टर शेयरिंग नहीं होती है।
- प्रति C3 फ़ीचर मैप में एक फ़िल्टर होता है, जो कि S2 लेयर के 3 (3 या अधिक) फ़ीचर मैप के साथ साझा किया जाता है।
दोनों मामलों में, 'संयोजन' का अर्थ होगा कि प्रति S2 सुविधा मानचित्र समूह के प्रतिरूपण के परिणाम, को C3 फीचर मानचित्रों के निर्माण के लिए संयोजित करना होगा। लेखक यह निर्दिष्ट नहीं करते हैं कि यह कैसे किया जाता है, लेकिन इसके अलावा एक आम पसंद है (उदाहरण के लिए इस पृष्ठ के मध्य के पास एनिमेटेड जिफ देखें ।
लेखक हालांकि कुछ अतिरिक्त जानकारी देते हैं, जो हमें वास्तुकला को समझने में मदद कर सकती हैं। वे कहते हैं कि 'लेयर C3 में 1,516 ट्रेन योग्य पैरामीटर हैं' (पृष्ठ 8)। हम इस जानकारी का उपयोग उपरोक्त मामलों (1) और (2) के बीच निर्णय लेने के लिए कर सकते हैं।
मामले में (1) हमारे पास फिल्टर हैं। फ़िल्टर का आकार । इस मामले में ट्रेन करने योग्य मापदंडों की संख्या ट्रेन करने योग्य पैरामीटर होगी। यदि हम प्रति C3 सुविधा मानचित्र में एक पूर्वाग्रह इकाई मानते हैं, तो हमें पैरामीटर मिलते हैं , जो कि लेखकों का कहना है। पूर्णता के लिए, मामले में (2) हमारे पास पैरामीटर होगा, जो कि मामला नहीं है।( ६ × ३ ) + ( ९ × ४ ) + ( १ × ६ ) = ६०( 14 - 10 + 1 ) × ( 14 - 10 + 1 ) = 5 × 55 × 5 × 60 = 1 , 5001 , 500 + 16 = 1 , 516( ५ × ५ × १६ ) + १६ = ४१६
इसलिए, यदि हम ऊपर तालिका I पर फिर से देखते हैं, तो प्रत्येक S2 सुविधा मानचित्र (इस प्रकार कुल 60 विशिष्ट फ़िल्टर) से जुड़े 10 अलग C3 फ़िल्टर हैं।
लेखक इस प्रकार की व्याख्या करते हैं:
अलग-अलग फ़ीचर मैप्स [इन लेयर C3] को अलग-अलग (उम्मीद के साथ पूरक) फीचर्स निकालने के लिए मजबूर किया जाता है क्योंकि उन्हें इनपुट के अलग-अलग सेट मिलते हैं।
मुझे उम्मीद है कि इससे स्थिति स्पष्ट होगी।