deep-learning पर टैग किए गए जवाब

मशीन लर्निंग का एक क्षेत्र डेटा के पदानुक्रमित अभ्यावेदन सीखने से संबंधित है, जो मुख्य रूप से गहरे तंत्रिका नेटवर्क के साथ किया जाता है।

3
अंतरिक्ष में एक मनमाना बिंदु की ओर एल 2 नियमितीकरण को कैसे लागू किया जाए?
यहाँ कुछ मैंने इयान गुडफेलो की पुस्तक डीप लर्निंग में पढ़ा है । तंत्रिका नेटवर्क के संदर्भ में, "L2 पैरामीटर मानक जुर्माना आमतौर पर वजन क्षय के रूप में जाना जाता है। यह नियमितीकरण रणनीति मूल [...] के करीब वजन ड्राइव करती है। अधिक सामान्यतः, हम किसी भी विशिष्ट बिंदु …

2
क्या अवशिष्ट नेटवर्क ग्रैडिएंट बूस्टिंग से संबंधित हैं?
हाल ही में, हमने अवशिष्ट तंत्रिका नेट के उद्भव को देखा, जिसमें, प्रत्येक परत में एक कम्प्यूटेशनल मॉड्यूल और एक शॉर्टकट कनेक्शन होता है, जो परत को इनपुट को संरक्षित करता है जैसे कि ith लेयर का आउटपुट प्रदर्शित करता है: नेटवर्क अवशिष्ट सुविधाओं को निकालने की अनुमति देता है …

3
Word2Vec का स्किप-ग्राम मॉडल आउटपुट वैक्टर कैसे उत्पन्न करता है?
मुझे Word2Vec एल्गोरिथ्म के स्किप-ग्राम मॉडल को समझने में समस्या हो रही है। निरंतर बैग में शब्दों को देखना आसान है कि संदर्भ शब्द तंत्रिका नेटवर्क में "फिट" कैसे हो सकते हैं, क्योंकि आप मूल रूप से इनपुट मैट्रिक्स डब्ल्यू के साथ एक-गर्म एन्कोडिंग अभ्यावेदन के प्रत्येक को गुणा करने …

2
आंशिक रूप से "अज्ञात" डेटा के साथ वर्गीकरण
मान लीजिए मैं एक क्लासिफायरियर सीखना चाहता हूं जो इनपुट के रूप में संख्याओं का वेक्टर लेता है, और आउटपुट के रूप में एक क्लास लेबल देता है। मेरे प्रशिक्षण डेटा में बड़ी संख्या में इनपुट-आउटपुट जोड़े हैं। हालाँकि, जब मैं कुछ नए डेटा पर परीक्षण करने आता हूं, तो …

2
फ़िल्टर और एक्टिवेशन मैप्स कन्वेन्शनल न्यूरल नेटवर्क्स में कैसे जुड़े हैं?
उस लेयर के फिल्टर से जुड़े लेयर पर एक्टिवेशन मैप्स कैसे हैं? मैं फ़िल्टर और सक्रियण मानचित्र के बीच एक संवैधानिक संचालन करने के बारे में नहीं पूछ रहा हूं, मैं इन दोनों के संपर्क के प्रकार के बारे में पूछ रहा हूं। उदाहरण के लिए, मान लीजिए कि आप …

1
क्या मैं एक्टिवेशन फंक्शन के रूप में ऑटोएनकोडर में ReLU का उपयोग कर सकता हूं?
तंत्रिका नेटवर्क के साथ एक ऑटोएन्कोडर को लागू करते समय, अधिकांश लोग सिग्माइड को सक्रियण फ़ंक्शन के रूप में उपयोग करेंगे। क्या हम इसके बजाय ReLU का उपयोग कर सकते हैं? (चूँकि ReLU की ऊपरी सीमा की कोई सीमा नहीं है, मूल रूप से इसका मतलब है कि इनपुट छवि …

4
हम सिर्फ हाइपर मापदंडों को क्यों नहीं सीखते हैं?
मैं एक बहुत ही लोकप्रिय पेपर " एक्सप्लेनिंग और हार्नेसिंग एडिशनल एग्जामिनेशन " लागू कर रहा था और पेपर में, यह एक प्रतिकूल उद्देश्य फ़ंक्शन को प्रशिक्षित करता है J '' (') = αJ (+) + (1 - α) J' (θ)। यह α को एक हाइपरपरमीटर के रूप में मानता …

1
डीएई और स्टोकेस्टिक बैकप्रोपेगेशन के बीच डीप जेनेरेटिव मॉडल्स में क्या अंतर है?
डीप जेनेरेशन मॉडल्स के लिए ऑटो-एन्कोडिंग वेरिएशन बेस और स्टोचैस्टिक बैकप्रोपैजेशन में क्या अंतर है ? क्या दोनों तरीकों से अनुमान लगाने से परिणाम समान होते हैं? मुझे दो तरीकों के बीच किसी भी स्पष्ट तुलना की जानकारी नहीं है, इसके बावजूद कि लेखकों के दोनों समूह एक-दूसरे का हवाला …

1
एक seq2seq RNN मॉडल को स्कोर करने के लिए मुझे किस हानि कार्य का उपयोग करना चाहिए?
मैं चो 2014 पेपर के माध्यम से काम कर रहा हूं जिसने seq2seq मॉडलिंग के लिए एनकोडर-डिकोडर आर्किटेक्चर पेश किया। कागज में, वे दिए गए आउटपुट इनपुट की संभावना (या यह नकारात्मक-लॉग-संभावना) का उपयोग करते हैं, लंबाई इनपुट और लंबाई आउटपुट के लिए नुकसान फ़ंक्शन के रूप में :एम वाई …

4
तंत्रिका नेटवर्क और गहरी सीखने के बीच अंतर
तंत्रिका नेटवर्क और गहन सीखने के बीच अंतर के संदर्भ में, हम कई वस्तुओं को सूचीबद्ध कर सकते हैं, जैसे कि अधिक परतें शामिल हैं, प्रशिक्षण जटिल मॉडल को संभव बनाने के लिए बड़े पैमाने पर डेटा सेट, शक्तिशाली कंप्यूटर हार्डवेयर। इनके अलावा, क्या NN और DL के बीच अंतर …

1
सीखने की दर और छिपी हुई परतों की संख्या के बीच संबंध?
क्या तंत्रिका नेटवर्क की गहराई और सीखने की दर के बीच अंगूठे का कोई नियम है? मैं देख रहा हूँ कि नेटवर्क जितना गहरा है, सीखने की दर उतनी ही कम होनी चाहिए। यदि यह सही है, तो ऐसा क्यों है?

3
क्या एक निश्चित शैली में चित्र बनाने के लिए तंत्रिका नेटवर्क को प्रशिक्षित करना संभव है?
क्या निश्चित शैली में चित्र बनाने के लिए तंत्रिका नेटवर्क को प्रशिक्षित करना संभव है? (इसलिए यह एक छवि लेता है और इसे एक शैली में बदल देता है जिसे इसके लिए प्रशिक्षित किया गया था।) क्या इस तरह की चीज़ के लिए कोई स्वीकृत तकनीक है? मुझे डीपआर्ट एल्गोरिथ्म …

1
गहरी तंत्रिका नेटवर्क को प्रशिक्षित करते समय धीरे-धीरे क्लिपिंग
आरएनएन या सीएनएन का प्रशिक्षण लेते समय ग्रेडिंग क्लिपिंग कब करना चाहते हैं? मुझे विशेष रूप से बाद में दिलचस्पी है। क्लिपिंग के लिए एक अच्छा प्रारंभिक मूल्य क्या होगा? (यह निश्चित रूप से ट्यून किया जा सकता है)

1
सीएनएन में दृढ़ संचालक की संख्या का निर्धारण कैसे करें?
कंप्यूटर विज़न टास्क में, जैसे कि ऑब्जेक्ट क्लासिफिकेशन, कन्वर्सेशनल न्यूरल नेटवर्क्स (CNN) के साथ, नेटवर्क एक आकर्षक प्रदर्शन प्रदान करता है। लेकिन मुझे यकीन नहीं है कि कैसे मापदंडों को परतों में सेट किया जाए। उदाहरण के लिए, एक ग्रेस्केल छवि ( 480x480), पहली कनफोलेंशियल लेयर एक कन्वेन्शियल ऑपरेटर का …

2
वेवनेट वास्तव में एक पतला दृढ़ संकल्प नहीं है, क्या यह है?
हाल ही के वेवनेट पेपर में, लेखक अपने मॉडल का संदर्भ देते हैं, जिसमें पतले संकल्पों की परतें होती हैं। वे निम्नलिखित चार्ट भी बनाते हैं, जो 'नियमित' संकल्पों और पतले संकल्पों के बीच के अंतर को समझाते हैं। नियमित रूप से दृढ़ संकल्प ऐसा दिखता है कि यह 2 …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.