deep-learning पर टैग किए गए जवाब

मशीन लर्निंग का एक क्षेत्र डेटा के पदानुक्रमित अभ्यावेदन सीखने से संबंधित है, जो मुख्य रूप से गहरे तंत्रिका नेटवर्क के साथ किया जाता है।

2
मॉडल की सटीकता को ट्रैक करने के लिए बैच सामान्यीकरण कैसे और क्यों चलती औसत का उपयोग करता है क्योंकि यह ट्रेन है?
मैं बैच सामान्यीकरण (बीएन) पेपर (1) पढ़ रहा था और मॉडल की सटीकता को ट्रैक करने के लिए मूविंग एवरेज का उपयोग करने की आवश्यकता नहीं समझता था और भले ही मैंने स्वीकार कर लिया कि यह सही काम करना है, मुझे समझ नहीं आ रहा है वे वास्तव में …

2
वैरिएबल स्केलिंग इनिशियलाइज़र और जेवियर इनिशियलाइज़र के बीच अंतर क्या है?
की Tensorflow के क्रियान्वयन में ResNet , मैं वे विचरण स्केलिंग प्रारंभकर्ता उपयोग करते हैं, मैं भी जेवियर खोजने के प्रारंभकर्ता लोकप्रिय है पाते हैं। मुझे इस पर बहुत अधिक अनुभव नहीं है, जो अभ्यास में बेहतर है?

2
गहरी शिक्षा कहाँ और क्यों चमकती है?
इन दिनों गहन सीखने के बारे में सभी मीडिया चर्चा और प्रचार के साथ, मैंने इसके बारे में कुछ प्राथमिक चीजें पढ़ीं। मैंने अभी पाया कि डेटा से पैटर्न सीखने के लिए यह सिर्फ एक और मशीन लर्निंग विधि है। लेकिन मेरा सवाल यह है: यह विधि कहां और क्यों …

3
गहरे तंत्रिका नेटवर्क के प्रशिक्षण के लिए शुरुआती रोक का ठीक से उपयोग कैसे करें?
मेरे पास एक गहरा तंत्रिका नेटवर्क मॉडल है और मुझे इसे अपने डेटासेट पर प्रशिक्षित करने की आवश्यकता है जिसमें लगभग 100,000 उदाहरण हैं, मेरे सत्यापन डेटा में लगभग 1000 उदाहरण हैं। क्योंकि प्रत्येक उदाहरण (प्रत्येक उदाहरण के लिए लगभग 0.5s) को प्रशिक्षित करने के लिए समय लगता है और …

2
तंत्रिका जाल में, अन्य मेटाह्योरिस्टिक्स के बजाय ढाल विधियों का उपयोग क्यों करें?
गहरे और उथले तंत्रिका नेटवर्क के प्रशिक्षण में, अन्य मेटाफ्यूरिस्टिक्स के विपरीत ग्रेडिएंट मेथड्स (जैसे ग्रेडिएंट डिसेंट, नेस्टरोव, न्यूटन-राफसन) का आमतौर पर इस्तेमाल क्यों किया जाता है? मेटाह्यूरिस्टिक्स से मेरा मतलब है कि नकली एनालिंग, चींटी कॉलोनी ऑप्टिमाइज़ेशन आदि जैसे तरीके, जो एक स्थानीय मिनीमा में अटकने से बचने के …

4
जब एक ऑटोकेनोडर के विपरीत मुझे एक वैरिएबल ऑटोकेनर का उपयोग करना चाहिए?
मैं परिवर्तनशील ऑटोकेन्डर और सामान्य (नियतात्मक) ऑटोकेनोडर और उनके पीछे के गणित की मूल संरचना को समझता हूं, लेकिन मैं कब और क्यों एक प्रकार के ऑटोकेनर को दूसरे के लिए पसंद करूंगा? सभी मेरे बारे में सोच सकते हैं कि परिवर्तनशील ऑटोकेनोडर के अव्यक्त चर का पूर्व वितरण हमें …

3
तंत्रिका नेटवर्क में पूर्वाग्रह नोड का महत्व
मैं यह जानने के लिए उत्सुक हूं कि आधुनिक तंत्रिका नेटवर्क की प्रभावशीलता के लिए पूर्वाग्रह नोड कितना महत्वपूर्ण है। मैं आसानी से समझ सकता हूं कि यह केवल कुछ इनपुट चर के साथ उथले नेटवर्क में महत्वपूर्ण हो सकता है। हालांकि, आधुनिक तंत्रिका जाल जैसे कि गहरी शिक्षा में …

2
सीएनएन में पूरी तरह से जुड़ी हुई परतें क्या करती हैं?
मैं दृढ़ और पूलिंग परतों को समझता हूं, लेकिन मैं सीएनएन में पूरी तरह से जुड़ी परत का कारण नहीं देख सकता। पिछली परत सीधे आउटपुट परत से क्यों नहीं जुड़ी है?

5
'ट्रांसफर लर्निंग' और 'डोमेन अनुकूलन' में क्या अंतर है?
क्या 'ट्रांसफर लर्निंग' और 'डोमेन अनुकूलन' में कोई अंतर है? मुझे संदर्भ के बारे में नहीं पता है, लेकिन मेरी समझ यह है कि हमारे पास कुछ डेटासेट 1 हैं और उस पर प्रशिक्षण दिया गया है, जिसके बाद हमारे पास एक और डेटासेट 2 है, जिसके लिए हम अपने …

2
दृढ़ तंत्रिका नेटवर्क में अधिकतम पूलिंग क्यों आवश्यक है?
अधिकांश सामान्य दृढ़ तंत्रिका नेटवर्क में आउटपुट सुविधाओं के आयामों को कम करने के लिए पूलिंग परतें होती हैं। मैं केवल समान परत के स्ट्राइड को बढ़ाने के द्वारा एक ही चीज क्यों हासिल नहीं कर सका? पूलिंग लेयर क्या आवश्यक है?

3
तंत्रिका नेटवर्क के प्रतिष्ठित (खिलौना) मॉडल
ग्रेड स्कूल में मेरी भौतिकी के प्राध्यापक, और साथ ही नोबल पुरस्कार विजेता फेनमैन, हमेशा प्रस्तुत करते थे कि उन्होंने भौतिकी में बुनियादी अवधारणाओं और तरीकों को चित्रित करने के लिए खिलौना मॉडल कहा था, जैसे हार्मोनिक थरथरानवाला, पेंडुलम, कताई शीर्ष, और ब्लैक बॉक्स। तंत्रिका नेटवर्क के अनुप्रयोग में अंतर्निहित …

2
गहरी शिक्षा बनाम निर्णय के पेड़ और बढ़ावा देने के तरीके
मैं ऐसे पत्रों या ग्रंथों की तलाश कर रहा हूं, जिनकी तुलना और चर्चा (अनुभवजन्य या सैद्धांतिक रूप से): बढ़ाने और निर्णय के पेड़ जैसे एल्गोरिदम रैंडम वन या AdaBoost , और GentleBoost निर्णय वृक्ष के लिए आवेदन किया। साथ में डीप लर्निंग मेथड्स जैसे रिस्ट्रिक्टेड बोल्ट्जमैन मशीन , हायरार्चिकल …

2
क्या गहरी खोज के लिए खोज विधि का उपयोग किया जाता है? क्यों नहीं?
बहुत सारे ट्यूटोरियल ऑनलाइन ग्रेडिएंट डिसेंट के बारे में बात करते हैं और लगभग सभी एक निश्चित स्टेप साइज (सीखने की दर ) का उपयोग करते हैं। लाइन सर्च का कोई उपयोग क्यों नहीं होता है (जैसे कि बैकट्रैकिंग लाइन सर्च या सटीक लाइन सर्च)?αα\alpha

2
क्या मिनी-बैच प्रशिक्षण के लिए बेतरतीब ढंग से खींचे गए नमूने को तंत्रिका जाल को प्रतिस्थापन के बिना खींचा जाना चाहिए?
हम सभी उपलब्ध प्रशिक्षण नमूनों की संपूर्णता के माध्यम से एक युग को परिभाषित करते हैं, और मिनी-बैच के आकार को उन नमूनों की संख्या के रूप में दर्शाते हैं जिनके आधार पर हम ढाल को नीचे करने के लिए आवश्यक भार / पूर्वाग्रहों के अपडेट को खोजने के लिए …

4
सीएनएन, गुठली और स्केल / रोटेशन इनवेरियन के बारे में
मेरे पास कुछ सवाल हैं जो मुझे सीएनएन के बारे में भ्रमित कर रहे हैं। 1) CNN का उपयोग करके निकाली गई विशेषताएँ पैमाने और घूर्णन अपरिवर्तनीय हैं? 2) अपने डेटा के साथ हम जिन गुठली का उपयोग करते हैं, वे पहले से ही साहित्य में परिभाषित हैं? ये गुठली …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.