deep-learning पर टैग किए गए जवाब

मशीन लर्निंग का एक क्षेत्र डेटा के पदानुक्रमित अभ्यावेदन सीखने से संबंधित है, जो मुख्य रूप से गहरे तंत्रिका नेटवर्क के साथ किया जाता है।

3
और असामान्य रूप से लॉग संभावनाओं के साथ शुरू होने वाले तंत्रिका नेटवर्क में सिग्मॉइड आउटपुट इकाइयों को प्रेरित करना
बैकग्राउंड: मैं इयान गुडफेलो और योशुआ बेंगियो और आरोन कोर्टविल द्वारा डीप लर्निंग के अध्याय 6 का अध्ययन कर रहा हूं। खंड 6.2.2.2 में (183 के पृष्ठ 182 जो यहां देखे जा सकते हैं ) आउटपुट लिए सिग्मॉइड का उपयोग प्रेरित है।पी( y= 1 | x )P(y=1|x)P(y=1|x) सक्रियण के लागू …

2
'रेगुलर' लीनियर रिग्रेशन और डीप लर्निंग लीनियर रिग्रेशन में क्या अंतर है?
मैं "रेगुलर लर्निंग" सेटिंग में रेगुलर मशीन लर्निंग एनालिसिस और लीनियर रिग्रेशन में लीनियर रिग्रेशन में अंतर जानना चाहता हूं। गहरी लर्निंग सेटिंग में रेखीय प्रतिगमन के लिए कौन से एल्गोरिदम का उपयोग किया जाता है।

1
डीप लर्निंग में डीप अवशिष्ट नेटवर्क के संदर्भ में वास्तव में एक अवशिष्ट लर्निंग ब्लॉक क्या है?
मैं इमेज रिकग्निशन के लिए डीप रेजिडेंशल लर्निंग पेपर पढ़ रहा था और मुझे 100% निश्चितता के साथ समझने में कठिनाइयाँ थीं कि अवशिष्ट ब्लॉक कम्प्यूटेशनल रूप से क्या कहता है। उनके पेपर पढ़ने से उनका आंकड़ा 2 है: जो बताता है कि एक अवशिष्ट ब्लॉक क्या माना जाता है। …

2
मशीन लर्निंग में अनुकूलन उद्देश्य के रूप में पियर्सन के सहसंबंध गुणांक का उपयोग करें
मशीन लर्निंग (प्रतिगमन समस्याओं के लिए) में, मैं अक्सर मीन-स्क्वेर्ड-एरर (MSE) या मीन-एब्सोल्यूट-एरर (MAE) को कम से कम करने के लिए एरर फंक्शन के रूप में उपयोग किया जाता है (साथ ही रेगुलराइजेशन टर्म)। मैं सोच रहा हूँ कि क्या ऐसी परिस्थितियाँ हैं जहाँ सहसंबंध गुणांक का उपयोग करना अधिक …

3
तंत्रिका नेटवर्क के लिए दिनांक / समय (चक्रीय डेटा) एन्कोडिंग
एक तंत्रिका नेटवर्क के लिए एक घटना की तारीख और समय को कैसे सांकेतिक शब्दों में बदलना है? मेरे पास निरंतर समय श्रृंखला नहीं है, लेकिन तारीख और समय के साथ कुछ घटनाएं हैं, और मैं किसी तरह की रुचि का विश्लेषण करता हूं। यह रुचि सुबह और शाम के …

3
गणितीय रूप से तंत्रिका नेटवर्क को चित्रमय मॉडल के रूप में मॉडलिंग करना
मैं एक तंत्रिका नेटवर्क और एक ग्राफिकल मॉडल के बीच गणितीय संबंध बनाने के लिए संघर्ष कर रहा हूं। ग्राफिकल मॉडल में यह विचार सरल है: संभाव्यता वितरण ग्राफ में क्लोन के अनुसार फैक्टर करता है, जिसमें संभावित रूप से घातीय परिवार होते हैं। क्या तंत्रिका नेटवर्क के लिए एक …

2
CNN में फ़िल्टर आकार, स्ट्राइड्स आदि चुनना?
मैं स्टैनफोर्ड के CS231N व्याख्यानों को देख रहा हूं और मैं CNN आर्किटेक्चर में कुछ मुद्दों पर अपना सिर लपेटने की कोशिश कर रहा हूं। मैं जो समझने की कोशिश कर रहा हूं वह यह है कि क्या कनवल्शन फिल्टर साइज़ को चुनने के लिए कुछ सामान्य दिशा-निर्देश हैं और …

4
गहरे सीखने में MLE और क्रॉस एन्ट्रॉपी के बीच का संबंध कितना सार्थक है?
मैं समझता हूँ कि स्वतंत्र प्रेक्षणों का एक सेट दिया गया है अधिकतम संभावना अनुमानक (या, समतुल्य रूप, फ्लैट के साथ मानचित्र / वर्दी पहले) कि पहचान करता मापदंडों \ mathbf {θ} कि मॉडल वितरण उत्पादन P_ {मॉडल} \ बाएँ (\, \ cdot \;; \ mathbf {c} \ right) जो …

3
खेल सिद्धांत और सुदृढीकरण सीखने के बीच क्या संबंध है?
मैं (डीप) सुदृढीकरण लर्निंग (आरएल) में रुचि रखता हूं । इस क्षेत्र में गोता लगाने से पहले मुझे गेम थ्योरी (जीटी) में एक कोर्स करना चाहिए ? जीटी और आरएल कैसे संबंधित हैं?

3
एक अलौकिक तंत्रिका नेटवर्क में अंतिम सॉफ्टमैक्स परत से पहले गैर-रैखिकता
मैं अध्ययन कर रहा हूं और विवादास्पद तंत्रिका नेटवर्क को लागू करने की कोशिश कर रहा हूं, लेकिन मुझे लगता है कि यह सवाल बहुपरत अवधारणात्मक रूप से सामान्य रूप से लागू होता है। मेरे नेटवर्क में आउटपुट न्यूरॉन्स प्रत्येक वर्ग की सक्रियता का प्रतिनिधित्व करते हैं: सबसे सक्रिय न्यूरॉन …

4
क्या गहन शिक्षण मॉडल पैरामीट्रिक हैं? या गैर पैरामीट्रिक?
मुझे नहीं लगता कि सभी डीप लर्निंग मॉडल्स का एक ही जवाब हो सकता है। गहरे शिक्षण मॉडल में से कौन-से पैरामीट्रिक हैं और कौन-से गैर पैरामीट्रिक हैं और क्यों?

4
ऑटोएन्कोडर्स और टी-एसएनई के बीच अंतर क्या हैं?
जहाँ तक मुझे पता है, दोनों ऑटोएन्कोडर्स और टी-एसएनई का उपयोग नॉनलाइनियर डायनेमिटी में कमी के लिए किया जाता है। उनके बीच क्या अंतर हैं और मुझे एक बनाम दूसरे का उपयोग क्यों करना चाहिए?

5
सीएनएन में फेस / नॉन-फेस डिटेक्शन में बाइनरी डिटेक्शन के लिए मुझे किस नुकसान का उपयोग करना चाहिए?
मैं फेस / नॉन-फेस बाइनरी डिटेक्शन को प्रशिक्षित करने के लिए डीप लर्निंग का उपयोग करना चाहता हूं, मुझे किस नुकसान का उपयोग करना चाहिए, मुझे लगता है कि यह सिग्मोइडक्रॉसइंटरप्रॉपली या हिंग-लॉस है । क्या यह सही है, लेकिन मुझे भी आश्चर्य है कि मुझे सॉफ्टमैक्स का उपयोग करना …

1
नुकसान के कार्य का दूसरा क्रम सन्निकटन (गहरी शिक्षा पुस्तक, 7.33)
गुडफेलो की (2016) पुस्तक में गहन अध्ययन पर, उन्होंने L2 नियमितीकरण ( https://www.deeplearningbook.org/contents/ अनियमितization.html पृष्ठ 247) पर शीघ्र रोक लगाने की बात की । लागत समारोह का द्विघात अनुमान है:jjj J^(θ)=J(w∗)+12(w−w∗)TH(w−w∗)J^(θ)=J(w∗)+12(w−w∗)TH(w−w∗)\hat{J}(\theta)=J(w^*)+\frac{1}{2}(w-w^*)^TH(w-w^*) जहां हेसियन मैट्रिक्स (Eq। 7.33) है। क्या यह बीच का शब्द याद आ रहा है? टेलर विस्तार होना चाहिए: …

4
संभावना-मुक्त अनुमान - इसका क्या अर्थ है?
हाल ही में मुझे साहित्य में 'संभावना-मुक्त' तरीकों के बारे में पता चला है। हालाँकि मैं इस बात पर स्पष्ट नहीं हूँ कि अनुमान या अनुकूलन विधि के लिए इसका मतलब क्या है, संभावना-रहित है । मशीन लर्निंग में लक्ष्य आम तौर पर एक फ़ंक्शन को फिट करने के लिए …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.