हम एक टोंटी आर्किटेक्चर को परिभाषित करते हैं जैसे कि रेसनेट पेपर में पाया जाने वाला प्रकार [दो 3x3 कन्टेस्ट लेयर] को [एक 1x1 कनव, एक 3x3 कन्ट और दूसरी 1x1 कन्टेन लेयर] से बदल दिया जाता है।
मैं समझता हूं कि 1x1 दृढ़ परतों का उपयोग आयाम में कमी (और बहाली) के रूप में किया जाता है, जिसे किसी अन्य पोस्ट में समझाया गया है । हालांकि, मैं इस बारे में स्पष्ट नहीं हूं कि यह संरचना मूल लेआउट के रूप में क्यों प्रभावी है।
कुछ अच्छी व्याख्याओं में शामिल हो सकते हैं: किस स्ट्राइड लंबाई का उपयोग किया जाता है और किन परतों पर? प्रत्येक मॉड्यूल के उदाहरण इनपुट और आउटपुट आयाम क्या हैं? ऊपर दिए गए आरेख में 56x56 फीचर मानचित्र कैसे दर्शाए गए हैं? क्या 64-d फ़िल्टर की संख्या को संदर्भित करता है, यह 256-d फ़िल्टर से भिन्न क्यों है? प्रत्येक परत पर कितने वज़न या FLOP का उपयोग किया जाता है?
किसी भी चर्चा काफी सराहना की है!