मैं मान रहा हूं कि जब आप कहते हैं कि 11x11x10
आपका मतलब है कि आपके पास 10, 11x11 फिल्टर के साथ एक परत है। तो आपके द्वारा किए जा रहे संकल्पों की संख्या केवल 10 है, आपके फ़िल्टर बैंक में प्रति फ़िल्टर 2 डी असतत सजा। तो, मान लें कि आपके पास एक नेटवर्क है:
480x480x1 # your input image of 1 channel
11x11x10 # your first filter bank of 10, 11x11 filters
5x5x20 # your second filter bank of 20, 5x5 filters
4x4x100 # your final filter bank of 100, 4x4 filters
आप ऐसा करने जा रहे हैं: मल्टी चैनल २ डी कन्वेंशन प्रत्येक क्रमशः १, १०, और २० की गहराई के साथ। जैसा कि आप देख सकते हैं, पिछली परत से इनपुट वॉल्यूम की गहराई के एक फ़ंक्शन के रूप में प्रत्येक कनवल्शन की गहराई बदलने जा रही है।10+20+100=130
10+200+2000=2,210
अब यह केवल आपको बताता है कि आप कितने एक चैनल 2 डी convolutions कर रहे हैं, कैसे नहीं कंप्यूटेशनल रूप से संवेदनशील प्रत्येक घुमाव है, प्रत्येक घुमाव के संगणक तीव्रता सहित मानकों की एक किस्म पर निर्भर करेगा image_size
, image_depth
, filter_size
, अपने stride
(आप प्रत्येक व्यक्ति के बीच कितनी दूर कदम फ़िल्टर गणना), आपके पास पूलिंग परतों की संख्या, आदि।