optimization पर टैग किए गए जवाब

आँकड़ों के भीतर अनुकूलन के किसी भी उपयोग के लिए इस टैग का उपयोग करें।

1
स्टोकेस्टिक ग्रेडिएंट डिसेंट्रेंट कैसे मानक ढाल डिसेंट की तुलना में समय बचा सकता है?
मानक ढाल वंश पूरे प्रशिक्षण डाटासेट के लिए ढाल की गणना करेगा। for i in range(nb_epochs): params_grad = evaluate_gradient(loss_function, data, params) params = params - learning_rate * params_grad युगों की पूर्व-निर्धारित संख्या के लिए, हम पहले संपूर्ण डाटासेट के लिए नुकसान फ़ंक्शन के ग्रेडिएंट वेक्टर वेट्स_ग्रेड की गणना करते हैं, …


1
"आराम से लासो" को मानक लासो से अलग क्यों किया जाता है?
यदि हम डेटा सेट से शुरू करते हैं , तो इसके लिए Lasso को लागू करें और β L का समाधान प्राप्त करें , हम Lasso को फिर से डेटा सेट ( X S , Y ) पर लागू कर सकते हैं , जहां S , गैर-शून्य का सेट है …

1
क्या GLM में लॉग लाइबिलिटी ने वैश्विक मैक्सिमा के अभिसरण की गारंटी दी है?
मेरे प्रश्न हैं: क्या सामान्यीकृत रैखिक मॉडल (GLM) को वैश्विक अधिकतम में परिवर्तित करने की गारंटी है? यदि हां, तो क्यों? इसके अलावा, उत्तलता का बीमा करने के लिए लिंक समारोह में क्या अड़चनें हैं? GLMs के बारे में मेरी समझ यह है कि वे एक अत्यधिक नॉनलाइनियर संभावना फ़ंक्शन …

2
सही अनुकूलन एल्गोरिदम कैसे चुनें?
मुझे एक फ़ंक्शन का न्यूनतम पता लगाने की आवश्यकता है। Http://docs.scipy.org/doc/scipy/reference/optimize.html पर डॉक्स पढ़ने से मुझे लगता है कि कई एल्गोरिदम हैं जो एक ही काम करते हैं, यानी न्यूनतम पाते हैं। मुझे कैसे पता चलेगा कि मुझे कौन सा चुनना चाहिए? कुछ एल्गोरिथ्म सूचीबद्ध हैं डाउनहिल सिम्प्लेक्स एल्गोरिथ्म का …

2
क्यों मिश्रण मॉडल के लिए उम्मीद अधिकतमकरण महत्वपूर्ण है?
मिश्रण के मॉडल (मिक्सचर ऑफ गॉसियन, हिडन मार्कोव मॉडल इत्यादि) पर एक्सपेक्टेशन मैक्सिमाइजेशन मेथड पर जोर देने वाले कई साहित्य हैं। क्यों महत्वपूर्ण है EM? EM केवल अनुकूलन करने का एक तरीका है और व्यापक रूप से ग्रेडिएंट आधारित विधि (ग्रेडिएंट सभ्य या न्यूटन / क्वासी-न्यूटन विधि) या अन्य ग्रेडिएंट …

1
पेरीसेप्टन नियम बनाम ग्रैडिएंट डिसेंट बनाम स्टोचैस्टिक ग्रैडिएंट डिसेंट कार्यान्वयन के बारे में स्पष्टीकरण
मैंने विभिन्न पेरेसेप्ट्रॉन कार्यान्वयन के साथ थोड़ा सा प्रयोग किया और यह सुनिश्चित करना चाहता हूं कि क्या मैं "पुनरावृत्तियों" को सही ढंग से समझ पाऊं। रोसेनब्लैट का मूल अवधारणात्मक नियम जहाँ तक मुझे समझ में आता है, रोसेनब्लैट के क्लासिक परसेप्ट्रोन एल्गोरिथ्म में, वेटिंग को एक साथ हर प्रशिक्षण …

2
हाथ से ARIMA का अनुमान
मैं यह समझने की कोशिश कर रहा हूं कि ARIMA मॉडलिंग / बॉक्स जेनकिंस (BJ) में मापदंडों का अनुमान कैसे लगाया जाता है। दुर्भाग्य से, मेरे द्वारा सामना की गई पुस्तकों में से कोई भी अनुमान प्रक्रिया का वर्णन नहीं करता है जैसे कि लॉग-लिकेलिहुड अनुमान प्रक्रिया विस्तार से। मुझे …

1
सीएनएन कैसे लुप्त होती क्रमिक समस्या से बचता है
मैं कंफर्टेबल न्यूरल नेटवर्क के बारे में बहुत कुछ पढ़ता रहा हूं और सोच रहा था कि वे गायब होने वाली ढाल की समस्या से कैसे बचें। मुझे पता है कि गहरे विश्वास वाले नेटवर्क एकल स्तर के ऑटो-एनकोडर या अन्य पूर्व-प्रशिक्षित उथले नेटवर्क को रोकते हैं और इस प्रकार …

1
मैं गॉस-न्यूटन एल्गोरिथ्म के मैनुअल कार्यान्वयन के साथ ग्लैमर (परिवार = द्विपद) आउटपुट का मिलान क्यों नहीं कर सकता?
मैं एक खिलौना द्विपद उदाहरण के साथ lmer (वास्तव में ग्लैमर) के आउटपुट से मेल खाना चाहता हूं। मैंने विगनेट्स पढ़े हैं और मुझे विश्वास है कि मैं समझता हूं कि क्या हो रहा है। लेकिन जाहिर है मैं नहीं। अटक जाने के बाद, मैंने यादृच्छिक प्रभावों के संदर्भ में …

1
एक एकल ReLU एक ReLU क्यों नहीं सीख सकता है?
मेरे न्यूरल नेटवर्क के फॉलो-अप के रूप में यूक्लिडियन दूरी भी नहीं सीखी जा सकती है, मैंने इसे और भी सरल बना दिया और एक एकल ReLU के लिए एक एकल ReLU (यादृच्छिक वजन के साथ) को प्रशिक्षित करने की कोशिश की। यह सबसे सरल नेटवर्क है, और फिर भी …

1
डीप लर्निंग के लिए एडम ऑप्टिमाइज़र के लिए पूर्वाग्रह सुधार शब्द शामिल करना क्यों महत्वपूर्ण है?
मैं डीप लर्निंग के लिए एडम ऑप्टिमाइज़र के बारे में पढ़ रहा था और बेग्नियो, गुडफेलो और कोर्टविल की नई किताब डीप लर्निंग में निम्नलिखित वाक्य आया था : एडम में पहले क्रम के क्षणों (संवेग शब्द) और मूल (उनके अप्रतिबंधित) दूसरे क्रम के क्षणों के अनुमानों में पूर्वाग्रह सुधार …

3
सामान्यीकृत ढाल और ढाल का उपयोग करने में अंतर
ढाल वंश एल्गोरिथ्म के सामान्य सेटिंग में, हमारे पास जहां एक्स एन वर्तमान बिंदु है, η कदम आकार है और जी आर एक घ मैं ई n t x n , x n पर ग्रेडिएंट का मूल्यांकन है । एक्सएन + १= एक्सn- η∗ जीआर एक घमैं ई एनटीएक्सnएक्सn+1=एक्सn-η*जीआरएघमैंइnटीएक्सnx_{n+1} = …

4
मशीन लर्निंग पाइप लाइन में फ़ीचर सेलेक्शन और हाइपरपैरिमेट ऑप्टिमाइज़ेशन का आदेश कैसे दिया जाना चाहिए?
मेरा उद्देश्य सेंसर संकेतों को वर्गीकृत करना है। मेरे समाधान की अब तक की अवधारणा है: i) कच्चे सिग्नल से इंजीनियरिंग सुविधाएँ ii) राहत के साथ प्रासंगिक सुविधाओं का चयन और क्लस्टरिंग दृष्टिकोण iii) एनएन, रैंडम फ़ॉरेस्ट और एसवीएम लागू करें हालांकि मैं एक दुविधा में फंसा हुआ हूं। Ii) …

1
L-BFGS कैसे काम करता है?
कागज का उद्देश्य नियमित रूप से लॉग-लाइबिलिटी को अधिकतम करके कुछ मापदंडों का अनुकूलन करना था। फिर वे आंशिक व्युत्पत्ति की गणना करते हैं। और फिर लेखकों का उल्लेख है कि वे एल-बीएफजीएस का उपयोग करके समीकरण का अनुकूलन करते हैं, कई चर (अधिक विवरण नहीं) के चिकनी कार्यों को …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.