बहुत अच्छा सवाल है, क्योंकि अभी तक इस सवाल का सटीक जवाब मौजूद नहीं है। यह शोध का एक सक्रिय क्षेत्र है।
अंततः, आपके नेटवर्क की वास्तुकला आपके डेटा की गतिशीलता से संबंधित है। चूंकि तंत्रिका नेटवर्क सार्वभौमिक सन्निकटनकर्ता होते हैं, जब तक आपका नेटवर्क पर्याप्त बड़ा होता है, इसमें आपके डेटा को फिट करने की क्षमता होती है।
वास्तव में यह जानने का एकमात्र तरीका है कि कौन सा वास्तुकला सबसे अच्छा काम करता है, उन सभी को आज़माना है, और फिर सबसे अच्छा चुनना है। लेकिन निश्चित रूप से, तंत्रिका नेटवर्क के साथ, यह काफी मुश्किल है क्योंकि प्रत्येक मॉडल को प्रशिक्षित करने में काफी समय लगता है। कुछ लोग जो करते हैं वह पहले एक मॉडल को प्रशिक्षित करता है जो उद्देश्य पर "बहुत बड़ा" होता है, और फिर इसे वजन को हटाकर prune करता है जो नेटवर्क में ज्यादा योगदान नहीं देता है।
क्या होगा अगर मेरा नेटवर्क "बहुत बड़ा" है
यदि आपका नेटवर्क बहुत बड़ा है, तो यह या तो ओवरफिट हो सकता है या फिर कन्वर्ज करने के लिए संघर्ष कर सकता है। सहज रूप से, क्या होता है कि आपका नेटवर्क आपके डेटा को जितना संभव हो उससे अधिक जटिल तरीके से समझाने की कोशिश कर रहा है। यह एक प्रश्न का उत्तर देने की कोशिश करने जैसा है जिसे 10-पृष्ठ के निबंध के साथ एक वाक्य के साथ उत्तर दिया जा सकता है। इस तरह के लंबे उत्तर की संरचना करना कठिन हो सकता है, और इसमें फेंके गए अनावश्यक तथ्य भी हो सकते हैं। ( इस प्रश्न को देखें )
क्या होगा अगर मेरा नेटवर्क "बहुत छोटा" है
दूसरी ओर, यदि आपका नेटवर्क बहुत छोटा है, तो यह आपके डेटा को कम करेगा और इसलिए। यह एक वाक्य के साथ उत्तर देने जैसा होगा जब आपको 10-पृष्ठ का निबंध लिखना चाहिए था। आपका उत्तर जितना अच्छा होगा, आपको कुछ प्रासंगिक तथ्य याद आ रहे होंगे।
नेटवर्क के आकार का अनुमान लगाना
यदि आप अपने डेटा की गतिशीलता जानते हैं, तो आप बता सकते हैं कि आपका नेटवर्क पर्याप्त बड़ा है या नहीं। अपने डेटा की गतिशीलता का अनुमान लगाने के लिए, आप इसकी रैंक की गणना करने का प्रयास कर सकते हैं। यह एक मुख्य विचार है कि कैसे लोग नेटवर्क के आकार का अनुमान लगाने की कोशिश कर रहे हैं।
हालाँकि, यह उतना सरल नहीं है। दरअसल, यदि आपके नेटवर्क को 64-आयामी होने की आवश्यकता है, तो क्या आप आकार 64 की एक छिपी हुई परत या आकार 8 की दो परतों का निर्माण करते हैं? यहां, मैं आपको कुछ अंतर्ज्ञान देने जा रहा हूं कि दोनों मामलों में क्या होगा।
गहराई तक जा रहे हैं
गहरे जाने का अर्थ है अधिक छिपी हुई परतों को जोड़ना। यह क्या करता है कि यह नेटवर्क को अधिक जटिल सुविधाओं की गणना करने की अनुमति देता है। उदाहरण के लिए, संवैधानिक तंत्रिका नेटवर्क में, यह अक्सर दिखाया गया है कि पहली कुछ परतें "निम्न-स्तरीय" विशेषताओं का प्रतिनिधित्व करती हैं, जैसे कि किनारों, और अंतिम परतें "उच्च-स्तरीय" सुविधाओं का प्रतिनिधित्व करती हैं जैसे चेहरे, शरीर के अंग आदि।
यदि आपका डेटा बहुत ही असंरचित (एक छवि की तरह) है तो आपको आमतौर पर गहराई तक जाने की आवश्यकता है और उपयोगी जानकारी को इससे निकालने से पहले काफी संसाधित होने की आवश्यकता है।
व्यापक हो रहा है
गहराई में जाने का अर्थ है अधिक जटिल सुविधाएँ बनाना, और "व्यापक" जाने का अर्थ है कि इनमें से अधिक सुविधाएँ बनाना। यह हो सकता है कि आपकी समस्या को बहुत सरल सुविधाओं द्वारा समझाया जा सकता है, लेकिन उनमें से कई होने की आवश्यकता है। आमतौर पर, परतें नेटवर्क के अंत की ओर सरल कारण के लिए संकीर्ण होती जा रही हैं कि जटिल विशेषताएं साधारण लोगों की तुलना में अधिक जानकारी लेती हैं, और इसलिए आपको उतने की आवश्यकता नहीं है।