अधिकांश सामान्य दृढ़ तंत्रिका नेटवर्क में आउटपुट सुविधाओं के आयामों को कम करने के लिए पूलिंग परतें होती हैं। मैं केवल समान परत के स्ट्राइड को बढ़ाने के द्वारा एक ही चीज क्यों हासिल नहीं कर सका? पूलिंग लेयर क्या आवश्यक है?
अधिकांश सामान्य दृढ़ तंत्रिका नेटवर्क में आउटपुट सुविधाओं के आयामों को कम करने के लिए पूलिंग परतें होती हैं। मैं केवल समान परत के स्ट्राइड को बढ़ाने के द्वारा एक ही चीज क्यों हासिल नहीं कर सका? पूलिंग लेयर क्या आवश्यक है?
जवाबों:
आप वास्तव में ऐसा कर सकते हैं, स्ट्रेटिंग फॉर सिंपलिसिटी: द ऑल कन्व्यूशनल नेट देखें । पूलिंग से आपको कुछ मात्रा में अनुवाद की अनुमति मिलती है, जो सहायक हो सकती है या नहीं भी। इसके अलावा, पूलिंग दृढ़ संकल्पों की तुलना में तेज है। फिर भी, आप हमेशा स्ट्राइड के साथ कनविक्शन द्वारा पूलिंग को बदलने की कोशिश कर सकते हैं और देख सकते हैं कि बेहतर क्या काम करता है।
कुछ वर्तमान कार्य औसत पूलिंग ( वाइड रेजिडेंशियल नेटवर्क्स , डेंसनेट्स ) का उपयोग करते हैं, अन्य स्ट्राइड ( डेल्यूज़नेट्स ) के साथ कन्वेंशन का उपयोग करते हैं
जाहिरा तौर पर अधिकतम पूलिंग में मदद मिलती है क्योंकि यह एक छवि की तेज विशेषताओं को निकालता है। इसलिए एक छवि दी गई है, सबसे तेज़ विशेषताएं एक छवि का सबसे निचले स्तर का प्रतिनिधित्व हैं। https://www.quora.com/What-is-the-benefit-of-using-average-pooling-rather-than-max-pooling
लेकिन एंड्रयू एनजी के डीप लर्निंग लेक्चर के अनुसार, अधिकतम पूलिंग अच्छी तरह से काम करती है, लेकिन कोई नहीं जानता कि क्यों। Quote -> "लेकिन मुझे स्वीकार करना होगा, मुझे लगता है कि मुख्य कारण लोग अधिकतम पूलिंग का उपयोग करते हैं क्योंकि यह अच्छी तरह से काम करने के लिए बहुत सारे प्रयोगों में पाया गया है, ... मैं किसी को पूरी तरह से नहीं जानता कि क्या असली है अंतर्निहित कारण। "