deep-learning पर टैग किए गए जवाब

डीप लर्निंग मशीन लर्निंग का एक क्षेत्र है जिसका लक्ष्य विशेष तंत्रिका नेटवर्क आर्किटेक्चर का उपयोग करके जटिल कार्यों को सीखना है जो "गहरे" (कई परतों से मिलकर) हैं। इस टैग का उपयोग गहन शिक्षण आर्किटेक्चर के कार्यान्वयन के बारे में प्रश्नों के लिए किया जाना चाहिए। सामान्य मशीन लर्निंग प्रश्नों को "मशीन लर्निंग" टैग किया जाना चाहिए। प्रासंगिक सॉफ़्टवेयर लाइब्रेरी (जैसे, "केरस", "टेंसोरफ़्लो", "पाइटोरच", "फास्ट.आई" और आदि) के लिए एक टैग शामिल है।


4
मल्टी-लेयर परसेप्ट्रॉन (MLP) आर्किटेक्चर: छिपी हुई परतों की संख्या और छिपी हुई परत के आकार को चुनने के लिए मानदंड?
यदि हमारे पास 10 ईजेनवेक्टर हैं तो हमारे पास इनपुट लेयर में 10 न्यूरल नोड्स हो सकते हैं। यदि हमारे पास 5 आउटपुट क्लासेस हैं तो हमारे पास आउटपुट लेयर में 5 नोड्स हो सकते हैं। लेकिन एक एमएलपी में छिपे हुए लेयर की संख्या चुनने के लिए क्या मापदंड …

5
क्यों हम pytorch में दृश्यों "पैक" करते हैं?
मैं दोहराने की कोशिश कर रहा था कि rnn के लिए चर-लंबाई अनुक्रम इनपुट के लिए पैकिंग का उपयोग कैसे करें लेकिन मुझे लगता है कि मुझे यह समझने की आवश्यकता है कि हमें अनुक्रम को "पैक" करने की आवश्यकता क्यों है। मैं समझता हूं कि हमें उन्हें "पैड" करने …

1
शुरुआती रोक के लिए कौन से मापदंडों का उपयोग किया जाना चाहिए?
मैं अपने प्रोजेक्ट के लिए केरस का उपयोग करके एक तंत्रिका नेटवर्क का प्रशिक्षण दे रहा हूं केरस ने शुरुआती रोक के लिए एक समारोह प्रदान किया है। क्या मुझे पता है कि मेरे तंत्रिका नेटवर्क को जल्दी रोकने का उपयोग करके ओवरफिटिंग से बचने के लिए कौन से मापदंडों …

6
TensorFlow में ढाल क्लिपिंग कैसे लागू करें?
उदाहरण कोड को ध्यान में रखते हुए । मैं जानना चाहता हूं कि आरएनएन पर इस नेटवर्क पर ग्रेडिएंट क्लिपिंग कैसे लागू करें जहां ग्रेडिएंट्स में विस्फोट होने की संभावना है। tf.clip_by_value(t, clip_value_min, clip_value_max, name=None) यह एक उदाहरण है जिसका उपयोग किया जा सकता है लेकिन मैं इसे कहां प्रस्तुत …

5
मॉडल को मान्य करते समय केरस में क्रिया का क्या उपयोग है?
मैं पहली बार LSTM मॉडल चला रहा हूं। यहाँ मेरा मॉडल है: opt = Adam(0.002) inp = Input(...) print(inp) x = Embedding(....)(inp) x = LSTM(...)(x) x = BatchNormalization()(x) pred = Dense(5,activation='softmax')(x) model = Model(inp,pred) model.compile(....) idx = np.random.permutation(X_train.shape[0]) model.fit(X_train[idx], y_train[idx], nb_epoch=1, batch_size=128, verbose=1) मॉडल का प्रशिक्षण करते समय क्रिया का …

6
TensorFlow में पूर्व-प्रशिक्षित शब्द एम्बेडिंग (word2vec या Glove) का उपयोग करना
मैंने हाल ही में दृढ़ पाठ वर्गीकरण के लिए एक दिलचस्प कार्यान्वयन की समीक्षा की है । हालाँकि, मैंने जो सभी TensorFlow कोड की समीक्षा की है, वे निम्न की तरह एक यादृच्छिक (पूर्व-प्रशिक्षित नहीं) एम्बेडिंग वैक्टर का उपयोग करते हैं: with tf.device('/cpu:0'), tf.name_scope("embedding"): W = tf.Variable( tf.random_uniform([vocab_size, embedding_size], -1.0, …

6
PyTorch - सन्निहित ()
मैं जीथब (लिंक) पर एक LSTM भाषा मॉडल के इस उदाहरण से गुजर रहा था । यह सामान्य रूप से मेरे लिए बहुत स्पष्ट है। लेकिन मैं अभी भी समझने में संघर्ष कर रहा हूं कि कॉलिंग क्या contiguous()करता है, जो कोड में कई बार होता है। उदाहरण के लिए, …

10
TensorFlow में नियमितीकरण कैसे जोड़ें?
मैंने TensorFlow का उपयोग करके लागू किए गए कई उपलब्ध न्यूरल नेटवर्क कोड में पाया कि नियमितीकरण शर्तों को अक्सर मैन्युअल रूप से नुकसान के मूल्य में एक अतिरिक्त शब्द जोड़कर लागू किया जाता है। मेरे प्रश्न हैं: मैन्युअल रूप से करने की तुलना में नियमितीकरण का अधिक सुरुचिपूर्ण या …

4
Tensorflow में global_step का क्या अर्थ है?
इस TensorFlow वेबसाइट से ट्यूटोरियल कोड है, किसी को समझाने में मदद कर सकता है क्या global_stepमतलब है? मैंने Tensorflow वेबसाइट पर लिखा है कि वैश्विक कदम का उपयोग गिनती प्रशिक्षण चरणों में किया जाता है , लेकिन मुझे इसका बिल्कुल मतलब नहीं है। साथ ही, सेट करते समय नंबर …

2
जब चित्र आकार में भिन्न हों, तो प्रशिक्षण / भविष्यवाणी के लिए छवि डेटा को कैसे प्रारूपित करें?
मैं अपने मॉडल को प्रशिक्षित करने की कोशिश कर रहा हूं जो छवियों को वर्गीकृत करता है। मेरे पास जो समस्या है, उनके अलग-अलग आकार हैं। मुझे अपनी छवियों / या मॉडल वास्तुकला को कैसे प्रारूपित करना चाहिए?

5
केरस, एक मॉडल को प्रशिक्षित करने के बाद मैं कैसे भविष्यवाणी करता हूं?
मैं रायटर-उदाहरण डाटासेट के साथ खेल रहा हूं और यह ठीक चलता है (मेरा मॉडल प्रशिक्षित है)। मैंने एक मॉडल को बचाने के तरीके के बारे में पढ़ा, इसलिए मैं इसे बाद में फिर से उपयोग करने के लिए लोड कर सकता था। लेकिन मैं एक नए पाठ की भविष्यवाणी …

5
प्रशिक्षण के दौरान नैन के सामान्य कारण
मैंने देखा है कि प्रशिक्षण के दौरान अक्सर होने वाली घटना NANको पेश किया जा रहा है। अक्सर कई बार ऐसा लगता है कि यह इनर-प्रोडक्ट / फुल-कनेक्टेड या कनवल्शन लेयर्स में वज़न बढ़ा रहा है। क्या ऐसा इसलिए हो रहा है क्योंकि ढाल की संगणना बह रही है? या …

4
Pkl फाइल को कैसे अनपैक करें?
मेरे पास MNIST डेटासेट से एक pkl फ़ाइल है, जिसमें हस्तलिखित अंकों की छवियां हैं। मैं उन अंकों की छवियों में से प्रत्येक पर एक नज़र रखना चाहता हूं, इसलिए मुझे pkl फ़ाइल को अनपैक करने की आवश्यकता है, सिवाय इसके कि मैं कैसे पता नहीं लगा सकता। वहाँ एक …

1
कैरस में टाइमडिस्ट्रिब्यूटेड लेयर की क्या भूमिका है?
मैं कायरों में TimeDistributed आवरण क्या करता है समझ की कोशिश कर रहा हूँ। मुझे लगता है कि TimeDistributed "एक इनपुट के हर लौकिक टुकड़ा पर एक परत लागू होता है।" लेकिन मैंने कुछ प्रयोग किए और ऐसे परिणाम मिले जिन्हें मैं समझ नहीं सकता। संक्षेप में, LSTM परत के …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.