सीएनएन में दृढ़ संचालक की संख्या का निर्धारण कैसे करें?

कंप्यूटर विज़न टास्क में, जैसे कि ऑब्जेक्ट क्लासिफिकेशन, कन्वर्सेशनल न्यूरल नेटवर्क्स (CNN) के साथ, नेटवर्क एक आकर्षक प्रदर्शन प्रदान करता है। लेकिन मुझे यकीन नहीं है कि कैसे मापदंडों को परतों में सेट किया जाए। उदाहरण के लिए, एक ग्रेस्केल छवि ( 480x480), पहली कनफोलेंशियल लेयर एक कन्वेन्शियल ऑपरेटर का उपयोग कर सकती है 11x11x10, जैसे कि संख्या 10 का अर्थ है, संख्‍यात्‍मक संचालकों की संख्‍या।

सवाल यह है कि सीएनएन में संचालक संचालकों की संख्या का निर्धारण कैसे किया जाए?

— झी लू
स्रोत

मैं मान रहा हूं कि जब आप कहते हैं कि 11x11x10आपका मतलब है कि आपके पास 10, 11x11 फिल्टर के साथ एक परत है। तो आपके द्वारा किए जा रहे संकल्पों की संख्या केवल 10 है, आपके फ़िल्टर बैंक में प्रति फ़िल्टर 2 डी असतत सजा। तो, मान लें कि आपके पास एक नेटवर्क है:

480x480x1    # your input image of 1 channel
11x11x10     # your first filter bank of 10, 11x11 filters
5x5x20       # your second filter bank of 20, 5x5 filters
4x4x100      # your final filter bank of 100, 4x4 filters

आप ऐसा करने जा रहे हैं: मल्टी चैनल २ डी कन्वेंशन प्रत्येक क्रमशः १, १०, और २० की गहराई के साथ। जैसा कि आप देख सकते हैं, पिछली परत से इनपुट वॉल्यूम की गहराई के एक फ़ंक्शन के रूप में प्रत्येक कनवल्शन की गहराई बदलने जा रही है। $10 + 20 + 100 = 130$

$10 + 200 + 2000 = 2,210$

अब यह केवल आपको बताता है कि आप कितने एक चैनल 2 डी convolutions कर रहे हैं, कैसे नहीं कंप्यूटेशनल रूप से संवेदनशील प्रत्येक घुमाव है, प्रत्येक घुमाव के संगणक तीव्रता सहित मानकों की एक किस्म पर निर्भर करेगा image_size, image_depth, filter_size, अपने stride(आप प्रत्येक व्यक्ति के बीच कितनी दूर कदम फ़िल्टर गणना), आपके पास पूलिंग परतों की संख्या, आदि।

— sabalaba
स्रोत