Inception v2 और Inception v3 के बीच अंतर क्या है?


18

दीक्षांत समारोह में जाने वाले पेपर में GoogleNet का वर्णन किया गया है जिसमें मूल स्थापना मॉड्यूल शामिल हैं:

यहाँ छवि विवरण दर्ज करें

इनसेप्शन v2 में परिवर्तन यह था कि उन्होंने 5x5 कनफोल्यूशंस को दो क्रमिक 3x3 कनवल्शन द्वारा बदल दिया और पूलिंग लागू किया:

यहाँ छवि विवरण दर्ज करें

Inception v2 और Inception v3 के बीच अंतर क्या है?


क्या यह बस सामान्यीकरण है? या Inception v2 में पहले से ही बैच सामान्य है?
मार्टिन थॉमा

github.com/SKKSaikia/CNN-GoogLeNet यह रिपॉजिटरी GoogLeNet के सभी संस्करणों और उनके अंतर को रखती है। कोशिश करो।
अमर्त्य रंजन सैकिया

जवाबों:


22

पेपर बैच नॉर्मलाइजेशन , सर्गेई एट अल, 2015 में। प्रस्तावित इनसेप्शन-v1 आर्किटेक्चर जो कि पेपर में GoogleNet का एक प्रकार है, जो संकल्पों के साथ गहराई में जा रहा है , और इस बीच उन्होंने इंसेप्शन (बीएन-इनसेप्शन) में बैच नॉर्मलाइज़ेशन की शुरुआत की।

(Szegedy et al।, 2014) में वर्णित नेटवर्क का मुख्य अंतर यह है कि 5x5 कन्वेन्शनल लेयर्स को 3x3 के दो लगातार लेयर द्वारा प्रतिस्थापित किया जाता है जिसमें 128 फिल्टर तक होते हैं।

और कंप्यूटर विज़न के लिए इनसेप्शन आर्किटेक्चर रीथिंकिंग पेपर में , लेखकों ने इन्सेप्शन-वी 2 और इनसेप्शन-वी 3 प्रस्तावित किया।

में स्थापना के समय-वी 2 , वे Factorization (छोटे convolutions में खंड करना convolutions) और स्थापना के समय-v1 में कुछ मामूली परिवर्तन की शुरुआत की।

ध्यान दें कि हमने पारंपरिक 7x7 कनवल्शन को तीन 3x3 कनवल्शन में फैक्टर किया है

के रूप में स्थापना के समय-v3 , यह स्थापना के समय-वी 2 का एक प्रकार है जो बी एन-सहायक जोड़ता है।

बीएन सहायक उस संस्करण को संदर्भित करता है जिसमें सहायक क्लासिफायर की पूरी तरह से जुड़ी परत भी सामान्यीकृत है, न कि केवल संकल्प। हम मॉडल [Inception-v2 + BN सहायक] को Inception-v3 के रूप में संदर्भित कर रहे हैं।


3

बगल में जो Daoliker द्वारा उल्लेख किया गया था

स्थापना v2 गहराई 64 की पहली परत के रूप में वियोज्य कन्वेंशन का उपयोग किया

कागज से बोली

हमारे मॉडल ने पहली दृढ़ परत पर गहराई गुणक 8 के साथ वियोज्य कन्वेंशन को नियोजित किया । यह प्रशिक्षण के समय मेमोरी की खपत को बढ़ाते हुए कम्प्यूटेशनल लागत को कम करता है।

यह महत्वपूर्ण क्यों है? क्योंकि यह v3 और v4 और स्थापना के resnet, लेकिन फिर से शुरू की में हटा दिया गया था और भारी में इस्तेमाल mobilenet बाद में।


1

इसका उत्तर गोइंग डीपल्स इन द कॉन्फोल्यूशन पेपर: https://arxiv.org/pdf/1512.00567v3.pdf से पाया जा सकता है।

चैक टेबल 3. इंसेप्शन v2 गोइंग में वर्णित आर्किटेक्चर है जो कि संकल्प पत्र के साथ गहरा गया है। विभिन्न प्रशिक्षण एल्गोरिथ्म (RMSprop, लेबल स्मूथिंग रेग्युलर, एक सहायक हेड को बैच मानदंड के साथ जोड़कर प्रशिक्षण में सुधार करने के लिए) एक ही आर्किटेक्चर (मामूली बदलाव) है।


1

दरअसल, ऊपर दिए गए जवाब गलत लग रहे हैं। दरअसल, यह नामकरण के साथ एक बड़ी गड़बड़ थी। हालांकि, ऐसा लगता है कि यह पेपर में तय किया गया था जो इंसेप्शन-वी 4 (परिचय: "इंसेप्शन-वी 4, इनसेप्शन-रेसनेट और लर्निंग पर अवशिष्ट कनेक्शन का प्रभाव") को प्रस्तुत करता है:

इनसेप्शन डी-कंस्यूटेशनल आर्किटेक्चर को GoogLeNet के रूप में पेश किया गया था (Szegedy et al। 2015a), यहाँ Inception-v1 नाम दिया गया है। बाद में विभिन्न प्रकारों में इंसेप्शन आर्किटेक्चर को परिष्कृत किया गया, पहले बैच सामान्यीकरण (आईऑफ़े और सेज़ेडी 2015) की शुरुआत (इंसेप्शन-वी 2)। बाद में तीसरे पुनरावृत्ति (Szegedy et al। 2015b) में अतिरिक्त गुणन विचारों द्वारा जो इस रिपोर्ट में इन्सेप्शन-वी 3 के रूप में संदर्भित किया जाएगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.