सीएनएन में पूरी तरह से जुड़ी हुई परतें क्या करती हैं?


19

मैं दृढ़ और पूलिंग परतों को समझता हूं, लेकिन मैं सीएनएन में पूरी तरह से जुड़ी परत का कारण नहीं देख सकता। पिछली परत सीधे आउटपुट परत से क्यों नहीं जुड़ी है?

जवाबों:


31

दृढ़ परतों से आउटपुट डेटा में उच्च-स्तरीय विशेषताओं का प्रतिनिधित्व करता है। हालांकि उस आउटपुट को चपटा किया जा सकता है और आउटपुट लेयर से कनेक्ट किया जा सकता है, पूरी तरह से कनेक्टेड लेयर को जोड़ना (आमतौर पर) इन विशेषताओं के गैर-रेखीय संयोजनों को सीखने का सस्ता तरीका है।

अनिवार्य रूप से दृढ़ परतें एक सार्थक, निम्न-आयामी और कुछ हद तक अपरिवर्तनीय सुविधा स्थान प्रदान कर रही हैं, और पूरी तरह से जुड़ी परत उस स्थान में एक (संभवतः गैर-रैखिक) कार्य सीख रही है।

नोट: यह FC परतों से रूपांतरण परतों में परिवर्तित करने के लिए तुच्छ है। इन शीर्ष FC लेयर्स को कन्वर्सेशन लेयर्स में बदलना इस पृष्ठ के अनुसार सहायक हो सकता है ।


आपके उत्तर के लिए धन्यवाद जेम्स। तो हम पीठ के प्रसार के साथ जुड़े परतों के बीच वजन सीख रहे हैं, क्या यह सही है?
जेफ

हां त्रुटि पूरी तरह से जुड़े परत के माध्यम से जटिल और पूलिंग परतों में वापस फैलती है।
jamesmf

ठीक है। तो गैर-रैखिक PCA की तरह fc लेयर का उद्देश्य सोचा जा सकता है, यह "अच्छे" फीचर्स को सुधारता है और वेट के पूरे सेट को सीखकर दूसरों को कम कर देता है।
जेफ

1
यह ज्यादातर आपको सुविधाओं के गैर-रैखिक संयोजन की अनुमति देता है। सभी सुविधाएँ अच्छी हो सकती हैं (यह मानते हुए कि आपके पास "मृत" सुविधाएँ नहीं हैं), लेकिन उन विशेषताओं का संयोजन और भी बेहतर हो सकता है।
jamesmf 3

@jamesmf: एक मृत विशेषता क्या है? और जिन विशेषताओं के बारे में आप बात कर रहे हैं उनके संयोजन क्या हैं? एक गैर रेखीय संयोजन से आपका क्या मतलब है? क्या पूरी तरह से कनेक्टेड परत का उपयोग करना cnn में अनिवार्य है? या इसे सटीकता पर किसी भी प्रतिकूल प्रभाव के बिना प्रतिस्थापित किया जा सकता है? आपका अग्रिम रूप से बोहोत धन्यवाद। यदि आप मेरे द्वारा पूछे गए प्रश्नों पर अंतर्ज्ञान दे सकते हैं, तो मैं आपका आभारी हूं।
रीका

4

मुझे यह जवाब अनिल-शर्मा द्वारा क्वोरा सहायक पर मिला।

हम पूरे नेटवर्क को (वर्गीकरण के लिए) दो भागों में विभाजित कर सकते हैं:

  • फ़ीचर निष्कर्षण : पारंपरिक वर्गीकरण एल्गोरिदम में, एसवीएम की तरह, हम वर्गीकरण का काम करने के लिए डेटा से सुविधाएँ निकालते थे। कन्वेन्शनल लेयर्स सुविधा निष्कर्षण के समान उद्देश्य की सेवा कर रहे हैं। CNN डेटा के बेहतर प्रतिनिधित्व पर कब्जा करते हैं और इसलिए हमें फीचर इंजीनियरिंग करने की आवश्यकता नहीं है।

  • वर्गीकरण : फीचर निष्कर्षण के बाद हमें डेटा को विभिन्न वर्गों में वर्गीकृत करने की आवश्यकता है, यह पूरी तरह से जुड़ा हुआ (एफसी) तंत्रिका नेटवर्क का उपयोग करके किया जा सकता है। पूरी तरह से जुड़े परतों के स्थान पर, हम एसवीएम जैसे पारंपरिक क्लासिफायरियर का भी उपयोग कर सकते हैं। लेकिन हम आम तौर पर मॉडल को एंड-टू-एंड ट्रेन बनाने के लिए एफसी परतों को जोड़ते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.