deep-learning पर टैग किए गए जवाब

मशीन लर्निंग अनुसंधान का एक नया क्षेत्र जो डेटा के पदानुक्रमित अभ्यावेदन सीखने के लिए उपयोग की जाने वाली तकनीकों से संबंधित है, मुख्य रूप से गहरे तंत्रिका नेटवर्क (यानी दो या अधिक छिपी परतों के साथ नेटवर्क) के साथ किया जाता है, लेकिन कुछ प्रकार के प्रोबेबिलिस्टिक ग्राफिकल मॉडल के साथ भी।

5
तंत्रिका नेटवर्क में "मर रहा है ReLU" समस्या क्या है?
दृश्य मान्यता के लिए संवैधानिक तंत्रिका नेटवर्क पर स्टैनफोर्ड पाठ्यक्रम नोट्स का उल्लेख करते हुए , एक पैराग्राफ कहता है: "दुर्भाग्य से, प्रशिक्षण के दौरान ReLU इकाइयाँ नाजुक हो सकती हैं और" मर "सकती हैं। उदाहरण के लिए, एक ReLU न्यूरॉन के माध्यम से बहने वाली एक बड़ी ढाल इस …

6
LSTM पर GRU का उपयोग कब करें?
एक GRU और एक LSTM के बीच मुख्य अंतर यह है कि एक GRU में दो गेट ( रीसेट और अपडेट गेट्स) होते हैं जबकि एक LSTM में तीन गेट होते हैं (जैसे इनपुट , आउटपुट और गेट्स भूल जाते हैं)। जब हम स्पष्ट रूप से LSTM मॉडल के माध्यम …

8
एक सीखने की दर का चयन
मैं वर्तमान में स्टोकेस्टिक ग्रैडिएंट डिसेंट को लागू करने पर काम कर रहा हूं, SGDपीछे के प्रसार का उपयोग करते हुए तंत्रिका जाल के लिए, और जब मैं इसके उद्देश्य को समझता हूं तो मुझे कुछ सवाल हैं कि सीखने की दर के लिए मूल्यों का चयन कैसे करें। क्या …

15
आप तंत्रिका नेटवर्क आर्किटेक्चर की कल्पना कैसे करते हैं?
जब एक पेपर लिखना / किसी विषय के बारे में प्रस्तुति देना जो तंत्रिका नेटवर्क के बारे में है, तो आमतौर पर नेटवर्क वास्तुकला की कल्पना करता है। स्वचालित रूप से सामान्य आर्किटेक्चर की कल्पना करने के अच्छे / सरल तरीके क्या हैं?

5
डीप लर्निंग नेटवर्क आर्किटेक्चर आरेख कैसे बनाएं?
मैंने अपना मॉडल बनाया है। अब मैं अपने शोध पत्र के लिए नेटवर्क आर्किटेक्चर आरेख को आकर्षित करना चाहता हूं। उदाहरण नीचे दिखाया गया है:

5
ARIMA बनाम LSTM का उपयोग करके समय श्रृंखला की भविष्यवाणी
जिस समस्या से मैं निपट रहा हूं, वह समय श्रृंखला मूल्यों की भविष्यवाणी कर रही है। मैं एक समय में एक श्रृंखला देख रहा हूं और उदाहरण के लिए 15% इनपुट डेटा पर आधारित हूं, मैं इसके भविष्य के मूल्यों की भविष्यवाणी करना चाहता हूं। अब तक मैं दो मॉडल …

2
कब उपयोग करना है (वह या ग्लोरोट) एक समान इनिट पर सामान्य इनिशियलाइज़ेशन? और बैच सामान्यीकरण के साथ इसके प्रभाव क्या हैं?
मुझे पता था कि अवशिष्ट नेटवर्क (ResNet) ने उन्हें सामान्य आरंभीकरण को लोकप्रिय बना दिया था। ResNet में, वह सामान्य इनिशियलाइज़ेशन का उपयोग करता है , जबकि पहली परत He यूनिफॉर्म इनिशियलाइज़ेशन का उपयोग करती है। मैंने ResNet पेपर और "डिलीटिंग डीप इन रेक्टिफायर्स" पेपर (उन्होंने इनिशियलाइज़ेशन पेपर) के माध्यम …

3
गहरे तंत्रिका जाल में कैसे लड़ना है
जब मैंने कृत्रिम तंत्रिका नेटवर्क (एनएन) के साथ शुरुआत की, तो मुझे लगा कि मुझे मुख्य समस्या के रूप में ओवरफिटिंग से लड़ना होगा। लेकिन व्यवहार में मैं अपना NN 20% त्रुटि दर अवरोध को पास करने के लिए भी नहीं कर सकता। मैं भी यादृच्छिक जंगल पर अपने स्कोर …

3
एक LSTM मॉडल में मापदंडों की संख्या
सिंगल स्टैक्ड LSTM के कितने पैरामीटर हैं? मापदंडों की संख्या आवश्यक प्रशिक्षण उदाहरणों की संख्या पर कम बाध्य करती है और प्रशिक्षण के समय को भी प्रभावित करती है। इसलिए मापदंडों की संख्या को जानना एलएसटीएम का उपयोग करके प्रशिक्षण मॉडल के लिए उपयोगी है।

4
समय श्रृंखला मॉडल LSTM में सुविधाएँ जोड़ना
LSTM और समय श्रृंखला के लिए उनके उपयोग पर थोड़ा पढ़ रहा है और एक ही समय में दिलचस्प लेकिन मुश्किल है। एक बात जो मुझे समझ में आई है वह यह है कि अतिरिक्त सुविधाओं को जोड़ने के लिए दृष्टिकोण क्या पहले से ही समय श्रृंखला सुविधाओं की सूची …

4
सभी प्रशिक्षण डेटा के साथ मिनी बैच का आकार एक एकल "बैच" से बेहतर क्यों है?
मैं अक्सर पढ़ता हूं कि डीप लर्निंग मॉडल के मामले में सामान्य अभ्यास कई प्रशिक्षण युगों में मिनी बैच (आमतौर पर एक छोटा, 32/64) लागू करना है। मैं वास्तव में इसके पीछे का कारण नहीं समझ सकता। जब तक मैं गलत नहीं हूँ, बैच का आकार एक प्रशिक्षण पुनरावृत्ति के …

3
क्या Keras में बैच_साइज़ का परिणाम की गुणवत्ता में कोई प्रभाव पड़ता है?
मैं 2-3 मिलियन लेखों के साथ एक बड़े LSTM नेटवर्क को प्रशिक्षित करने और मेमोरी एरर के साथ संघर्ष कर रहा हूं (मैं AWS EC2 g2x2large का उपयोग करता हूं)। मुझे पता चला कि इसका एक समाधान कम करना है batch_size। हालांकि, मुझे यकीन नहीं है कि यह पैरामीटर केवल …

3
"अनुवाद करने के लिए समानार्थी" और "अनुवाद करने के लिए अपरिवर्तनीय" में क्या अंतर है
मैं अनुवाद करने के लिए अनुवाद और अपरिवर्तनीय के बीच के अंतर को समझने में परेशानी महसूस कर रहा हूं । पुस्तक डीप लर्निंग में । एमआईटी प्रेस, 2016 (आई। गुडफेलो, ए। कोर्टविल, और वाई। बेंगियो), कोई भी व्यक्ति नेटवर्क पर पा सकता है: [...] पैरामीटर शेयरिंग का विशेष रूप …

13
डेटा विज्ञान से संबंधित मजेदार उद्धरण
यह अलग-अलग समुदायों के उपयोगकर्ताओं के लिए उनके क्षेत्रों के बारे में मज़ेदार बातें उद्धृत करने के लिए प्रथागत है । मशीन लर्निंग, डीप लर्निंग, डेटा साइंस और हर दिन आपके सामने आने वाली चीजों के बारे में अपनी मज़ेदार बातें साझा करना मज़ेदार हो सकता है!

6
क्रॉस-एन्ट्रापी लॉस स्पष्टीकरण
मान लीजिए कि मैं वर्गीकरण के लिए एक एनएन का निर्माण करता हूं। अंतिम परत सॉफ्टमेक्स सक्रियण के साथ घनी परत है। मेरे पास वर्गीकृत करने के लिए पांच अलग-अलग वर्ग हैं। एक भी प्रशिक्षण उदाहरण के लिए मान लीजिए, true labelहै [1 0 0 0 0]जबकि भविष्यवाणियों हो [0.1 …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.