सांख्यिकी और बिग डेटा optimization

1

स्टोकेस्टिक ग्रेडिएंट डिसेंट्रेंट कैसे मानक ढाल डिसेंट की तुलना में समय बचा सकता है?

मानक ढाल वंश पूरे प्रशिक्षण डाटासेट के लिए ढाल की गणना करेगा। for i in range(nb_epochs): params_grad = evaluate_gradient(loss_function, data, params) params = params - learning_rate * params_grad युगों की पूर्व-निर्धारित संख्या के लिए, हम पहले संपूर्ण डाटासेट के लिए नुकसान फ़ंक्शन के ग्रेडिएंट वेक्टर वेट्स_ग्रेड की गणना करते हैं, …

16 machine-learning optimization gradient-descent computational-statistics sgd

2

अधिकतम संभावना अनुमान और ग्रेडिएंट डिसेंट के बीच अंतर क्या है?

दोनों विधियों के समर्थक और विपक्ष क्या हैं?

16 maximum-likelihood predictive-models optimization gradient-descent

1

"आराम से लासो" को मानक लासो से अलग क्यों किया जाता है?

यदि हम डेटा सेट से शुरू करते हैं , तो इसके लिए Lasso को लागू करें और β L का समाधान प्राप्त करें , हम Lasso को फिर से डेटा सेट ( X S , Y ) पर लागू कर सकते हैं , जहां S , गैर-शून्य का सेट है …

16 regression optimization lasso regularization shrinkage

1

क्या GLM में लॉग लाइबिलिटी ने वैश्विक मैक्सिमा के अभिसरण की गारंटी दी है?

मेरे प्रश्न हैं: क्या सामान्यीकृत रैखिक मॉडल (GLM) को वैश्विक अधिकतम में परिवर्तित करने की गारंटी है? यदि हां, तो क्यों? इसके अलावा, उत्तलता का बीमा करने के लिए लिंक समारोह में क्या अड़चनें हैं? GLMs के बारे में मेरी समझ यह है कि वे एक अत्यधिक नॉनलाइनियर संभावना फ़ंक्शन …

16 generalized-linear-model optimization convergence exponential-family

2

सही अनुकूलन एल्गोरिदम कैसे चुनें?

मुझे एक फ़ंक्शन का न्यूनतम पता लगाने की आवश्यकता है। Http://docs.scipy.org/doc/scipy/reference/optimize.html पर डॉक्स पढ़ने से मुझे लगता है कि कई एल्गोरिदम हैं जो एक ही काम करते हैं, यानी न्यूनतम पाते हैं। मुझे कैसे पता चलेगा कि मुझे कौन सा चुनना चाहिए? कुछ एल्गोरिथ्म सूचीबद्ध हैं डाउनहिल सिम्प्लेक्स एल्गोरिथ्म का …

16 optimization

2

क्यों मिश्रण मॉडल के लिए उम्मीद अधिकतमकरण महत्वपूर्ण है?

मिश्रण के मॉडल (मिक्सचर ऑफ गॉसियन, हिडन मार्कोव मॉडल इत्यादि) पर एक्सपेक्टेशन मैक्सिमाइजेशन मेथड पर जोर देने वाले कई साहित्य हैं। क्यों महत्वपूर्ण है EM? EM केवल अनुकूलन करने का एक तरीका है और व्यापक रूप से ग्रेडिएंट आधारित विधि (ग्रेडिएंट सभ्य या न्यूटन / क्वासी-न्यूटन विधि) या अन्य ग्रेडिएंट …

15 machine-learning optimization expectation-maximization gaussian-mixture

1

पेरीसेप्टन नियम बनाम ग्रैडिएंट डिसेंट बनाम स्टोचैस्टिक ग्रैडिएंट डिसेंट कार्यान्वयन के बारे में स्पष्टीकरण

मैंने विभिन्न पेरेसेप्ट्रॉन कार्यान्वयन के साथ थोड़ा सा प्रयोग किया और यह सुनिश्चित करना चाहता हूं कि क्या मैं "पुनरावृत्तियों" को सही ढंग से समझ पाऊं। रोसेनब्लैट का मूल अवधारणात्मक नियम जहाँ तक मुझे समझ में आता है, रोसेनब्लैट के क्लासिक परसेप्ट्रोन एल्गोरिथ्म में, वेटिंग को एक साथ हर प्रशिक्षण …

15 optimization gradient-descent perceptron

2

हाथ से ARIMA का अनुमान

मैं यह समझने की कोशिश कर रहा हूं कि ARIMA मॉडलिंग / बॉक्स जेनकिंस (BJ) में मापदंडों का अनुमान कैसे लगाया जाता है। दुर्भाग्य से, मेरे द्वारा सामना की गई पुस्तकों में से कोई भी अनुमान प्रक्रिया का वर्णन नहीं करता है जैसे कि लॉग-लिकेलिहुड अनुमान प्रक्रिया विस्तार से। मुझे …

15 time-series forecasting arima optimization box-jenkins

1

सीएनएन कैसे लुप्त होती क्रमिक समस्या से बचता है

मैं कंफर्टेबल न्यूरल नेटवर्क के बारे में बहुत कुछ पढ़ता रहा हूं और सोच रहा था कि वे गायब होने वाली ढाल की समस्या से कैसे बचें। मुझे पता है कि गहरे विश्वास वाले नेटवर्क एकल स्तर के ऑटो-एनकोडर या अन्य पूर्व-प्रशिक्षित उथले नेटवर्क को रोकते हैं और इस प्रकार …

15 machine-learning optimization deep-learning gradient-descent

1

मैं गॉस-न्यूटन एल्गोरिथ्म के मैनुअल कार्यान्वयन के साथ ग्लैमर (परिवार = द्विपद) आउटपुट का मिलान क्यों नहीं कर सकता?

मैं एक खिलौना द्विपद उदाहरण के साथ lmer (वास्तव में ग्लैमर) के आउटपुट से मेल खाना चाहता हूं। मैंने विगनेट्स पढ़े हैं और मुझे विश्वास है कि मैं समझता हूं कि क्या हो रहा है। लेकिन जाहिर है मैं नहीं। अटक जाने के बाद, मैंने यादृच्छिक प्रभावों के संदर्भ में …

15 r mixed-model optimization lme4-nlme

1

एक एकल ReLU एक ReLU क्यों नहीं सीख सकता है?

मेरे न्यूरल नेटवर्क के फॉलो-अप के रूप में यूक्लिडियन दूरी भी नहीं सीखी जा सकती है, मैंने इसे और भी सरल बना दिया और एक एकल ReLU के लिए एक एकल ReLU (यादृच्छिक वजन के साथ) को प्रशिक्षित करने की कोशिश की। यह सबसे सरल नेटवर्क है, और फिर भी …

15 machine-learning neural-networks optimization keras

1

डीप लर्निंग के लिए एडम ऑप्टिमाइज़र के लिए पूर्वाग्रह सुधार शब्द शामिल करना क्यों महत्वपूर्ण है?

मैं डीप लर्निंग के लिए एडम ऑप्टिमाइज़र के बारे में पढ़ रहा था और बेग्नियो, गुडफेलो और कोर्टविल की नई किताब डीप लर्निंग में निम्नलिखित वाक्य आया था : एडम में पहले क्रम के क्षणों (संवेग शब्द) और मूल (उनके अप्रतिबंधित) दूसरे क्रम के क्षणों के अनुमानों में पूर्वाग्रह सुधार …

15 machine-learning neural-networks optimization conv-neural-network adam

3

सामान्यीकृत ढाल और ढाल का उपयोग करने में अंतर

ढाल वंश एल्गोरिथ्म के सामान्य सेटिंग में, हमारे पास जहां एक्स एन वर्तमान बिंदु है, η कदम आकार है और जी आर एक घ मैं ई n t x n , x n पर ग्रेडिएंट का मूल्यांकन है । एक्सएन + १= एक्सn- η∗ जीआर एक घमैं ई एनटीएक्सnएक्सn+1=एक्सn-η*जीआरएघमैंइnटीएक्सnx_{n+1} = …

15 algorithms optimization

4

मशीन लर्निंग पाइप लाइन में फ़ीचर सेलेक्शन और हाइपरपैरिमेट ऑप्टिमाइज़ेशन का आदेश कैसे दिया जाना चाहिए?

मेरा उद्देश्य सेंसर संकेतों को वर्गीकृत करना है। मेरे समाधान की अब तक की अवधारणा है: i) कच्चे सिग्नल से इंजीनियरिंग सुविधाएँ ii) राहत के साथ प्रासंगिक सुविधाओं का चयन और क्लस्टरिंग दृष्टिकोण iii) एनएन, रैंडम फ़ॉरेस्ट और एसवीएम लागू करें हालांकि मैं एक दुविधा में फंसा हुआ हूं। Ii) …

15 feature-selection hyperparameter optimization

1

L-BFGS कैसे काम करता है?

कागज का उद्देश्य नियमित रूप से लॉग-लाइबिलिटी को अधिकतम करके कुछ मापदंडों का अनुकूलन करना था। फिर वे आंशिक व्युत्पत्ति की गणना करते हैं। और फिर लेखकों का उल्लेख है कि वे एल-बीएफजीएस का उपयोग करके समीकरण का अनुकूलन करते हैं, कई चर (अधिक विवरण नहीं) के चिकनी कार्यों को …

15 algorithms optimization

optimization पर टैग किए गए जवाब