deep-learning पर टैग किए गए जवाब

मशीन लर्निंग अनुसंधान का एक नया क्षेत्र जो डेटा के पदानुक्रमित अभ्यावेदन सीखने के लिए उपयोग की जाने वाली तकनीकों से संबंधित है, मुख्य रूप से गहरे तंत्रिका नेटवर्क (यानी दो या अधिक छिपी परतों के साथ नेटवर्क) के साथ किया जाता है, लेकिन कुछ प्रकार के प्रोबेबिलिस्टिक ग्राफिकल मॉडल के साथ भी।

3
एनएलपी और मशीन लर्निंग समुदाय गहरी शिक्षा में क्यों रुचि रखते हैं?
मुझे आशा है कि आप मेरी मदद कर सकते हैं, क्योंकि इस विषय पर मेरे कुछ प्रश्न हैं। मैं गहरी शिक्षा के क्षेत्र में नया हूं, और जब मैंने कुछ ट्यूटोरियल किए, तो मैं एक दूसरे से अवधारणाओं को संबंधित या अलग नहीं कर सकता।

3
ग्रेडिएंट डिसेंट और स्टोचस्टिक ग्रेडिएंट डिसेंट के बीच अंतर क्या है?
ग्रेडिएंट डिसेंट और स्टोचस्टिक ग्रेडिएंट डिसेंट के बीच अंतर क्या है? मैं इनसे बहुत परिचित नहीं हूं, क्या आप एक छोटे से उदाहरण के साथ अंतर का वर्णन कर सकते हैं?

6
दीप सीखना मूल बातें
मैं एक पेपर की तलाश कर रहा हूं जो गहन शिक्षा के मूल सिद्धांतों का विवरण दे। आदर्श रूप से गहन शिक्षा के लिए एंड्रयू एनजी पाठ्यक्रम। क्या आप जानते हैं कि मुझे यह कहां मिल सकता है?

6
दृढ़ तंत्रिका तंत्रिका नेटवर्क क्यों काम करते हैं?
मैंने अक्सर लोगों को यह कहते हुए सुना है कि क्यों जटिल तंत्रिका नेटवर्क अभी भी खराब समझे जाते हैं। क्या यह ज्ञात है कि दृढ़ तंत्रिका नेटवर्क हमेशा परतों के रूप में बढ़ते परिष्कृत सुविधाओं को सीखते हैं? किस कारण से वे इस तरह की विशेषताओं का ढेर बनाते …

4
एक केरास मॉडल के लिए सटीकता, एफ 1, परिशुद्धता और रिकॉल कैसे प्राप्त करें?
मैं अपने बाइनरी KerasClassifier मॉडल के लिए सटीक, रिकॉल और F1-स्कोर की गणना करना चाहता हूं, लेकिन कोई समाधान नहीं ढूंढता। यहाँ मेरा वास्तविक कोड है: # Split dataset in train and test data X_train, X_test, Y_train, Y_test = train_test_split(normalized_X, Y, test_size=0.3, random_state=seed) # Build the model model = Sequential() …

1
क्या मिनी-बैच के आकार को चुनने के लिए कोई नियम हैं?
तंत्रिका नेटवर्क का प्रशिक्षण करते समय, एक हाइपरपरमीटर एक मिनीबैच का आकार होता है। आम विकल्प 32, 64 और 128 तत्व प्रति मिनी बैच हैं। क्या कोई नियम / दिशानिर्देश हैं कि मिनी-बैच कितना बड़ा होना चाहिए? कोई प्रकाशन जो प्रशिक्षण पर प्रभाव की जांच करता है?

4
क्या ढाल मूल हमेशा एक इष्टतम में परिवर्तित होता है?
मैं सोच रहा हूं कि क्या कोई ऐसा परिदृश्य है जिसमें ढाल मूल न्यूनतम में परिवर्तित नहीं होता है। मुझे पता है कि धीरे-धीरे वंशज को वैश्विक अनुकूलता में परिवर्तित करने की गारंटी नहीं है। मुझे यह भी पता है कि यह एक इष्टतम से विचलन हो सकता है अगर, …

2
ReLU को सक्रियण फ़ंक्शन के रूप में क्यों उपयोग किया जाता है?
सक्रियण कार्यों का उपयोग w * x + bतंत्रिका नेटवर्क में प्रकार के रैखिक उत्पादन में गैर-रैखिकता को पेश करने के लिए किया जाता है । जिसे मैं सिग्माइड जैसे सक्रियण कार्यों के लिए सहज रूप से समझने में सक्षम हूं। मैं ReLU के फायदों को समझता हूं, जो बैकप्रोपैजेशन …

2
केरस के बैकएंड के रूप में टेन्सरफ्लो या थीनो के बीच चयन
Keras दोनों का समर्थन करता है TensorFlow और थेनो बैकएंड के रूप में: एक अन्य बनाम चयन करते समय, तथ्य यह है कि वर्तमान में नहीं सभी कार्यों TensorFlow बैकएंड के साथ लागू कर रहे हैं के अलावा के पेशेवरों / विपक्ष क्या हैं?

3
डीप लर्निंग लाइब्रेरी का उपयोग करके टेक्स्ट से कीवर्ड / वाक्यांश निष्कर्षण
शायद यह बहुत व्यापक है, लेकिन मैं एक पाठ संक्षेपण कार्य में गहन सीखने का उपयोग करने के संदर्भों की तलाश कर रहा हूं। मैंने पहले ही मानक शब्द-आवृत्ति दृष्टिकोण और वाक्य-रैंकिंग का उपयोग करके पाठ संक्षेपण लागू कर दिया है, लेकिन मैं इस कार्य के लिए गहन शिक्षण तकनीकों …

2
केरस बनाम tf.keras
मैं थोड़ा के बीच चुनने में उलझन में हूँ Keras (keras टीम / keras) और tf.keras (tensorflow / tensorflow / अजगर / keras /) अपने नए अनुसंधान परियोजना के लिए। ऐसी बहस चल रही है कि केरस किसी के स्वामित्व में नहीं है, इसलिए लोग इसमें योगदान करने के लिए …

1
LSTM का उपयोग करके टाइम सीरीज़ की भविष्यवाणी: समय श्रृंखला को स्थिर बनाने का महत्व
स्टेशनैरिटी और डिफरेंसिंग के इस लिंक में , यह उल्लेख किया गया है कि ARIMA जैसे मॉडलों को पूर्वानुमान के लिए एक स्थिर समय श्रृंखला की आवश्यकता होती है क्योंकि यह सांख्यिकीय गुण जैसे माध्य, भिन्नता, निरंकुशता आदि समय के साथ स्थिर होते हैं। चूंकि RNN में गैर-रेखीय संबंधों को …

4
केआरएस (पायथन) का उपयोग करते हुए LSTM-RNN के लिए हाइपरपरमेट सर्च
केर आरएनएन ट्यूटोरियल से: " आरएनएन मुश्किल हैं। बैच आकार की पसंद महत्वपूर्ण है, नुकसान की पसंद और ऑप्टिमाइज़र महत्वपूर्ण है, आदि। कुछ विन्यास अभिसरण नहीं करेंगे।" इसलिए यह केरस पर एक LSTM-RNN के हाइपरपैरमीटर को ट्यून करने के बारे में एक सामान्य प्रश्न है। मैं आपके RNN के सर्वोत्तम …

2
स्थानीय मिनिमा बनाम काठी गहरी सीखने की ओर इशारा करती है
मैंने एंड्रयू एनजी को सुना (एक वीडियो में मैं दुर्भाग्य से अब और नहीं मिल सकता है) इस बारे में बात करें कि गहरी सीखने की समस्याओं में स्थानीय मिनीमाता की समझ इस अर्थ में बदल गई है कि उन्हें अब कम समस्याग्रस्त माना जाता है क्योंकि उच्च-आयामी रिक्त स्थान …

1
कैरस अंतर बीट्विन वेल_लॉस और प्रशिक्षण के दौरान नुकसान
केरस में प्रशिक्षण के दौरान val_lossऔर lossउसके बीच क्या अंतर है ? उदाहरण के लिए Epoch 1/20 1000/1000 [==============================] - 1s - loss: 0.1760, val_loss: 0.2032 कुछ साइटों पर मैंने पढ़ा कि सत्यापन पर, ड्रॉपआउट काम नहीं कर रहा था।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.