कुलपति आयाम हमें गहरी शिक्षा के बारे में क्या बताता है?


15

बुनियादी मशीन सीखने में हमें "अंगूठे के नियम" सिखाए जाते हैं:

ए) आपके डेटा का आकार आपके परिकल्पना सेट के वीसी आयाम के कम से कम 10 गुना होना चाहिए।

बी) एन कनेक्शन के साथ एक तंत्रिका नेटवर्क में लगभग एन का कुलपति आयाम है।

इसलिए जब एक गहन शिक्षण तंत्रिका नेटवर्क ने कहा है, लाखों इकाइयाँ, तो क्या इसका मतलब है कि हमारे पास, अरबों डेटा बिंदु होने चाहिए? क्या आप कृपया इस पर कुछ प्रकाश डाल सकते हैं?


एक गहरी तंत्रिका नेटवर्क में लाखों इकाइयाँ नहीं होंगी जैसा कि आप बताते हैं। हालांकि, इसके लाखों कनेक्शन होंगे। मैं मानूंगा कि आपके अंगूठे का दूसरा नियम इन नेटवर्कों के लिए नहीं है, मुख्य रूप से उनके नियमित स्वभाव के कारण (जैसे ड्रॉपआउट के साथ सीएनएन)।
पीर

मुझे लगता है कि यह महत्वपूर्ण है कि वीसी बाउंड अनंत नहीं है। यदि यह परिमित है, तो पीएसी सिद्धांत हमें बताता है कि सीखना संभव है। कितना डेटा, यह एक और सवाल है।
व्लादिस्लाव डोभालगसेप्स

जवाबों:


4

आपके द्वारा बात की गई अंगूठे का नियम तंत्रिका नेटवर्क पर लागू नहीं किया जा सकता है।

एक तंत्रिका नेटवर्क के कुछ बुनियादी पैरामीटर हैं, अर्थात इसके वजन और पूर्वाग्रह। भार की संख्या नेटवर्क परतों के बीच कनेक्शन की संख्या पर निर्भर करती है और पूर्वाग्रह की संख्या न्यूरॉन्स की संख्या पर निर्भर होती है।

अत्यधिक आवश्यक डेटा का आकार इस पर निर्भर करता है -

  1. तंत्रिका नेटवर्क का प्रकार
  2. नेट में नियमितीकरण तकनीकों का उपयोग किया जाता है
  3. नेट प्रशिक्षण में उपयोग की जाने वाली सीखने की दर।

यह कहा जा रहा है, यह जानने का अधिक उचित और सुनिश्चित तरीका है कि क्या मॉडल ओवरफिटिंग है यह जांचने के लिए कि क्या सत्यापन त्रुटि प्रशिक्षण त्रुटि के करीब है। यदि हाँ, तो मॉडल ठीक काम कर रहा है। यदि नहीं, तो मॉडल सबसे अधिक संभावना है और इसका मतलब है कि आपको अपने मॉडल के आकार को कम करने या नियमितीकरण तकनीकों को पेश करने की आवश्यकता है।


जब आप कहते हैं कि आप मजाक कर रहे हैं, तो यह समझने का सबसे अच्छा तरीका है कि मॉडल ओवरफिट हो रहा है या नहीं, यह जांचने के लिए कि सत्यापन त्रुटि प्रशिक्षण त्रुटि के करीब है या नहीं।
nbro

6
@nbro, यदि आपके पास सत्यापन त्रुटि की जांच करने के लिए एक उचित होल्ड-आउट सेट है, तो यह आमतौर पर बहुत-ढीले वीसी सीमा से गुजरने की तुलना में आपके विशेष प्रशिक्षित नेटवर्क के लिए ओवरफिटिंग का एक अधिक विश्वसनीय उपाय है।
डगगल

@ डगल आप अपने उत्तर में कही गई बात को दोहरा रहे हैं।
nbro

3
मेरा जवाब नहीं @nbro। लेकिन एक मान्यता सेट दिया गया है, तो आप होएडिंग या समान के साथ सही सामान्यीकरण त्रुटि पर बाध्य एक उच्च-संभाव्यता प्राप्त कर सकते हैं, जबकि वीसी सीमा के माध्यम से बहुत सारे ढीले ऊपरी सीमाएं शामिल हैं जो आपके लिए विशेष डेटासेट और नेटवर्क के लिए विशिष्ट नहीं हैं। हाथ।
डगगल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.