deep-learning पर टैग किए गए जवाब

मशीन लर्निंग अनुसंधान का एक नया क्षेत्र जो डेटा के पदानुक्रमित अभ्यावेदन सीखने के लिए उपयोग की जाने वाली तकनीकों से संबंधित है, मुख्य रूप से गहरे तंत्रिका नेटवर्क (यानी दो या अधिक छिपी परतों के साथ नेटवर्क) के साथ किया जाता है, लेकिन कुछ प्रकार के प्रोबेबिलिस्टिक ग्राफिकल मॉडल के साथ भी।


4
LSTM समय श्रृंखला पूर्वानुमान के आसपास भविष्यवाणी अंतराल
LSTM (या अन्य आवर्तक) तंत्रिका नेटवर्क से एक समय श्रृंखला पूर्वानुमान के आसपास भविष्यवाणी अंतराल (संभावना वितरण) की गणना करने के लिए एक विधि है? उदाहरण के लिए, मैं भविष्य में 10 नमूनों की भविष्यवाणी कर रहा हूं (टी + 1 से टी + 10), पिछले 10 देखे गए नमूनों …

1
CNN में अपसम्पलिंग और द्वि-लीनियर अपसम्पलिंग के बीच अंतर क्या है?
मैं इस पेपर को समझने की कोशिश कर रहा हूं और इस बात को लेकर अनिश्चित हूं कि द्वि-रैखिक उतार-चढ़ाव क्या है। क्या कोई इसे उच्च स्तर पर समझा सकता है? https://arxiv.org/abs/1606.00915

4
हर आशावादी के लिए ग्रेडिएंट डिसेंट सेंट्रल है?
मैं जानना चाहता हूं कि ग्रैडिएंट वंशज आदमियों, आदमगढ़, आरएमएसप्रॉप और कई अन्य आशावादियों जैसे ऑप्टिमाइज़र में उपयोग किया जाने वाला मुख्य एल्गोरिदम है या नहीं।

2
गहरी तंत्रिका नेटवर्क प्रशिक्षण की कल्पना करना
मैं प्रशिक्षण के दौरान वेट प्लॉट करने के लिए बहुपरत नेटवर्क के लिए Hinton आरेखों के बराबर खोजने की कोशिश कर रहा हूं। प्रशिक्षित नेटवर्क कुछ हद तक डीप एसआरएन के समान है, अर्थात इसमें कई वेट मैट्रिसेस की अधिक संख्या है जो कई हिंटन आरेखों के एक साथ भूखंड …

5
ड्रॉपआउट परत को जोड़ने से गहरी / मशीन सीखने के प्रदर्शन में सुधार क्यों होता है, यह देखते हुए कि ड्रॉपआउट मॉडल से कुछ न्यूरॉन्स को दबा देता है?
यदि कुछ न्यूरॉन्स को हटाने से बेहतर प्रदर्शन करने वाला मॉडल होता है, तो पहली परत में कम परतों और कम न्यूरॉन्स के साथ एक सरल तंत्रिका नेटवर्क का उपयोग क्यों नहीं किया जाता है? शुरुआत में एक बड़ा, अधिक जटिल मॉडल क्यों बनाएं और बाद में इसके कुछ हिस्सों …

2
वजन और पूर्वाग्रह के आरंभ को 0 के आसपास क्यों चुना जाना चाहिए?
मैंने इसे पढ़ा: हमारे तंत्रिका नेटवर्क को प्रशिक्षित करने के लिए, हम प्रत्येक पैरामीटर W (l) ijWij (l) और प्रत्येक b (l) ibi (l) को शून्य के पास एक छोटे से यादृच्छिक मूल्य पर कहेंगे (सामान्य के अनुसार कहें) (0, to2) सामान्य (0) , ϵϵ2) कुछ छोटे ϵϵ के लिए …

3
क्यों कनवल्शन हमेशा फ़िल्टर_साइज़ के रूप में विषम-संख्याओं का उपयोग करते हैं
यदि हमारे पास सीएनएन (कन्वेंशन) का उपयोग करके प्रकाशित 90-99% कागज़ात हैं। उनमें से अधिकांश बहुमत विषम संख्याओं के फ़िल्टर आकार का उपयोग करते हैं : {1, 3, 5, 7} सबसे अधिक उपयोग के लिए। यह स्थिति कुछ समस्या पैदा कर सकती है: इन फ़िल्टर आकारों के साथ, आमतौर पर …

1
डीप लर्निंग में 1D कन्वेंशनल लेयर क्या है?
मुझे 2D या 3D कार्यान्वयन के मामले में इमेज प्रोसेसिंग के लिए डीप लर्निंग में भूमिका की परतों की एक अच्छी समझ है - वे "बस" छवियों में 3 डी पैटर्न (3 डी के मामले में चैनलों) को पकड़ने की कोशिश करते हैं। लेकिन हाल ही में मैं नेचुरल लैंग्वेज …

3
क्या मुझे इंजेक्शन के लिए GPU या CPU का उपयोग करना चाहिए?
मैं एक डीप लर्निंग न्यूरल नेटवर्क चला रहा हूं जिसे GPU द्वारा प्रशिक्षित किया गया है। अब मैं इसे कई मेजबानों के लिए तैनात करना चाहता हूं। सवाल यह है कि मुझे यह तय करने की शर्तें क्या हैं कि क्या मुझे जीपीआर या सीपीयू का इस्तेमाल करना चाहिए? नीचे …

3
4 साल पहले (2012) में मैंने जो अध्ययन किया है, उससे अलग एनएनएस अब (2016) कैसे अलग हैं?
विकिपीडिया और deeplearning4j में कहा गया है कि डीप-लर्निंग एनएन (DLNN) NN है जिसमें> 1 छिपी हुई परत है। इस तरह के एनएन मेरे लिए विश्वविद्यालय में मानक थे, जबकि अभी डीएलएनएन बहुत सम्मोहित हैं। वहाँ गया, किया कि - क्या बड़ी बात है? मैंने यह भी सुना है कि …

2
क्या केरस में अर्ली स्टॉपिंग कॉलबैक द्वारा उपयोग किए जाने वाले मीट्रिक को बदलने के लिए दूर है?
जब कुछ मीट्रिक (आमतौर पर सत्यापन हानि) नहीं बढ़ रहा है, तो केरस प्रशिक्षण में प्रारंभिक रोक कॉलबैक का उपयोग करना बंद हो जाता है। क्या सत्यापन हानि के बजाय किसी अन्य मीट्रिक (जैसे सटीक, याद, एफ-माप) का उपयोग करने का कोई तरीका है? अब तक मैंने जितने भी उदाहरण …

1
केरस में मल्टी टास्क लर्निंग
मैं केरस में साझा परतों को लागू करने की कोशिश कर रहा हूं। मैं देख रहा हूं कि केरस के पास है keras.layers.concatenate, लेकिन मैं इसके उपयोग के बारे में प्रलेखन से अनिश्चित हूं। क्या मैं इसे कई साझा परतों को बनाने के लिए उपयोग कर सकता हूं? एक सरल …

1
गहरी शिक्षा में वर्ग छवियों का कारण
वीजीजी, रेसनेट आदि जैसे अधिकांश उन्नत गहन शिक्षण मॉडल में इनपुट के रूप में चौकोर चित्रों की आवश्यकता होती है, आमतौर पर पिक्सेल आकार के ।224 x 224224x224224x224 वहाँ एक कारण है कि इनपुट, बराबर आकार के हो गया है या मैं कहना के साथ एक convnet मॉडल का निर्माण …

2
सत्यापन हानि और सटीकता स्थिर रहती है
मैं मेडिकल इमेज के सेट पर इस पेपर को लागू करने की कोशिश कर रहा हूं । मैं इसे कैरस में कर रहा हूं। नेटवर्क में अनिवार्य रूप से 4 कनैक्ट और अधिकतम-पूल लेयर होते हैं, जिसके बाद पूरी तरह से कनेक्टेड लेयर और सॉफ्ट मैक्स क्लासिफायर होता है। जहां …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.