deep-learning पर टैग किए गए जवाब

मशीन लर्निंग का एक क्षेत्र डेटा के पदानुक्रमित अभ्यावेदन सीखने से संबंधित है, जो मुख्य रूप से गहरे तंत्रिका नेटवर्क के साथ किया जाता है।

3
कई LSTM को ढेर करने के क्या फायदे हैं?
फायदे क्या हैं, क्यों एक-एक नेटवर्क में, कई LSTM का उपयोग किया जाएगा, एक-एक करके, एक तरफ? मैं एक इनपुट के अनुक्रम का प्रतिनिधित्व करने के लिए एक LSTM का उपयोग कर रहा हूं। इसलिए एक बार मेरे पास यह एकल प्रतिनिधित्व है - मैं इसे फिर से क्यों पास …

1
क्यों सुधारा गया रैखिक इकाइयों को गैर-रैखिक माना जाता है?
रेक्टिफाइड रैखिक इकाइयों (ReLU) के सक्रियण कार्यों को गैर-रैखिक क्यों माना जाता है? च( x ) = अधिकतम ( 0 , x )च(एक्स)=अधिकतम(0,एक्स) f(x) = \max(0,x) जब इनपुट सकारात्मक होता है तो वे रैखिक होते हैं और गहरी नेटवर्क की प्रतिनिधि शक्ति को अनलॉक करने के लिए मेरी समझ से …

1
परिवर्तनशील ऑटोएन्कोडर्स क्या हैं और उनका उपयोग किन शिक्षण कार्यों के लिए किया जाता है?
के अनुसार इस और इस सवाल का जवाब, autoencoders एक तकनीक आयाम कम करने के लिए तंत्रिका नेटवर्क का उपयोग करता है होने लगते हैं। मैं अतिरिक्त पता है कि एक है चाहते हैं परिवर्तन संबंधी autoencoder (अपने मुख्य अंतर / एक "पारंपरिक" autoencoders से अधिक लाभ) है और यह …

3
क्या कारण है कि एडम ऑप्टिमाइज़र को अपने उच्च मापदंडों के मूल्य के लिए मजबूत माना जाता है?
मैं डीप लर्निंग के लिए एडम ऑप्टिमाइज़र के बारे में पढ़ रहा था और बेंगियो, गुडफेलो और कोर्टविल की नई किताब डीप लर्निंग में निम्नलिखित वाक्य आया : एडम को आमतौर पर हाइपर मापदंडों के चुनाव के लिए काफी मजबूत माना जाता है, हालांकि सीखने की दर को कभी-कभी सुझाए …

2
पहली परत में Krizhevsky के '12 CNN को 253,440 न्यूरॉन्स कैसे मिलते हैं?
में एलेक्स Krizhevsky, एट अल। गहरी सजातीय तंत्रिका नेटवर्क के साथ Imagenet वर्गीकरण वे प्रत्येक परत में न्यूरॉन्स की संख्या की गणना करते हैं (नीचे आरेख देखें)। नेटवर्क का इनपुट 150,528-आयामी है, और नेटवर्क की शेष परतों में न्यूरॉन्स की संख्या 253,440–186,624–64,896–64,896–43,264- 4096–4096-1000 द्वारा दी गई है। एक 3D दृश्य …

2
फ़िल्टर मैट्रिक्स के तत्वों को कैसे आरंभ करें?
मैं पाइथन कोड लिखकर बेहतर ढंग से कन्वेन्शियल न्यूरल नेटवर्क्स को समझने की कोशिश कर रहा हूँ, जो पुस्तकालयों पर निर्भर नहीं है (जैसे कि कॉननेट या टेन्सरफ्लो), और मैं कर्नेल मैट्रिक्स के मूल्यों को चुनने के तरीके पर साहित्य में अटक रहा हूँ, जब एक छवि पर एक दृढ़ …

3
स्टैक्ड कंफ्यूजनल ऑटोकेनोडर का आर्किटेक्चर क्या है?
तो मैं मनुष्यों की छवियों पर प्रचलित करने की कोशिश कर रहा हूं, जो कि संकेतन जाल का उपयोग कर रही हैं। मैं कागज (पेपर 1 और पेपर 2 ) और इस स्टैकओवरफ्लो लिंक को पढ़ता हूं, लेकिन मुझे यकीन नहीं है कि मैं नेट की संरचना को समझ रहा …

1
वास्तव में ध्यान तंत्र क्या हैं?
ध्यान तंत्र का उपयोग पिछले कुछ वर्षों में विभिन्न डीप लर्निंग पेपर में किया गया है। इल्या सुतकीवर, ओपन एआई के शोध प्रमुख, ने उत्साहपूर्वक उनकी प्रशंसा की: https://towardsdatascience.com/the-fall-of-rnn-lstm-2d1594c74ce0 पर्ड्यू विश्वविद्यालय में यूजीनियो क्यूलुरसेलो ने दावा किया है कि आरएनएन और एलएसटीएम को पूरी तरह से ध्यान आधारित तंत्रिका नेटवर्क …

3
क्या छवि प्रारूप (png, jpg, gif) प्रभावित करता है कि एक छवि मान्यता तंत्रिका जाल कैसे प्रशिक्षित किया जाता है?
मुझे पता है कि गहरी, जटिल तंत्रिका जाल के साथ छवि मान्यता, छवि वर्गीकरण आदि के संबंध में बहुत सारे अग्रिम हैं। लेकिन अगर मैं पीएनजी छवियों पर एक शुद्ध प्रशिक्षण देता हूं, तो क्या यह केवल इतनी एनकोडेड छवियों के लिए काम करेगा ? क्या अन्य छवि गुण इसे …

2
कन्वेन्शनल न्यूरल नेटवर्क हाइपरपामेटर्स के चयन के नियम
क्या कोई अच्छा कागजात है जो फ़िल्टर के लिए आयामों को चुनने, इकाइयों को पूल करने और दोषपूर्ण परतों की संख्या का निर्धारण करने के कुछ तरीके को कवर करता है?


4
डीप लर्निंग मॉडल के लिए सॉफ्टमैक्स आउटपुट एक अच्छा अनिश्चितता मापक क्यों नहीं है?
मैं पिछले कुछ समय से कन्वेंशनल न्यूरल नेटवर्क्स (CNNs) के साथ काम कर रहा हूं, ज्यादातर सिमेंटिक सेगमेंटेशन / इंस्टेंसेशन के लिए इमेज डेटा पर। मैंने अक्सर "हीट मैप" के रूप में नेटवर्क आउटपुट के सॉफ्टमैक्स की कल्पना की है, यह देखने के लिए कि एक निश्चित वर्ग के लिए …

2
प्रतिबंधित बोल्ट्ज़मन मशीन: इसका उपयोग मशीन सीखने में कैसे किया जाता है?
पृष्ठभूमि: हां, प्रतिबंधित बोल्ट्जमन मशीन (आरबीएम) का उपयोग तंत्रिका नेटवर्क के भार को आरंभ करने के लिए किया जा सकता है। इसके अलावा इसका उपयोग "लेयर-बाय-लेयर" तरीके से एक गहरी विश्वास नेटवर्क बनाने के लिए किया जा सकता है (यानी, -th लेयर को -th लेयर के शीर्ष पर , और …

2
तंत्रिका नेटवर्क को बढ़ावा देना
हाल ही में मैं एडॉबॉस्ट, ग्रेडिएंट बूस्ट जैसे बूस्टिंग एल्गोरिदम सीखने पर काम कर रहा था, और मैंने इस तथ्य को जाना है कि सबसे आम इस्तेमाल किया जाने वाला कमजोर-सीखने वाला पेड़ है। मैं वास्तव में जानना चाहता हूं कि बेस लर्नर के रूप में तंत्रिका नेटवर्क का उपयोग …

2
तंत्रिका नेटवर्क में टोंटी आर्किटेक्चर कैसे काम करते हैं?
हम एक टोंटी आर्किटेक्चर को परिभाषित करते हैं जैसे कि रेसनेट पेपर में पाया जाने वाला प्रकार [दो 3x3 कन्टेस्ट लेयर] को [एक 1x1 कनव, एक 3x3 कन्ट और दूसरी 1x1 कन्टेन लेयर] से बदल दिया जाता है। मैं समझता हूं कि 1x1 दृढ़ परतों का उपयोग आयाम में कमी …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.