machine-learning पर टैग किए गए जवाब

मशीन लर्निंग एल्गोरिदम प्रशिक्षण डेटा का एक मॉडल बनाते हैं। "मशीन लर्निंग" शब्द अस्पष्ट रूप से परिभाषित है; इसमें सांख्यिकीय अधिगम, सुदृढीकरण अधिगम, अप्राप्य अधिगम, इत्यादि को भी शामिल किया जाता है।

2
तंत्रिका नेटवर्क के विश्वास की भविष्यवाणी करना
माना कि मैं वर्गीकरण या प्रतिगमन करने के लिए एक गहरे तंत्रिका नेटवर्क को प्रशिक्षित करना चाहता हूं, लेकिन मैं जानना चाहता हूं कि भविष्यवाणी कितनी भरोसेमंद होगी। मैं इसे कैसे हासिल कर सकता हूं? मेरा विचार प्रत्येक प्रशिक्षण डेटम के लिए क्रॉस एन्ट्रॉपी की गणना करना है, जो ऊपर …

1
ReLU न्यूरॉन्स के लिए इनपुट सामान्यीकरण
के अनुसार "कुशल Backprop" LeCun एट अल (1998) से यह सब जानकारी के इतना है कि वे अधिक से अधिक दूसरा व्युत्पन्न की सीमा के भीतर चारों ओर 0 और झूठ केंद्रित कर रहे हैं को सामान्य बनाने में अच्छा अभ्यास है। इसलिए उदाहरण के लिए हम "तन" फ़ंक्शन के …

2
अभ्यास में गहरी सीखने को लागू करने की अड़चन
बहुत सारे गहरे शिक्षण पत्रों को पढ़ने के बाद, एक प्रकार की खुरदरी भावना यह है कि बेहतर-सामान्य प्रदर्शन प्राप्त करने के लिए नेटवर्क को प्रशिक्षित करने में बहुत सारी चालें मौजूद हैं। उद्योग एप्लिकेशन के नजरिए से, बड़ी तकनीकी कंपनियों, जैसे, Google या फेसबुक में उन कुलीन अनुसंधान समूहों …

1
क्या किसी कार्य के लिए रोचक विशेषताएं हैं प्रतिगमन के ?
मैं प्रतिगमन की एक सामान्य सेटअप, यह है कि, एक सतत समारोह मान एक परिवार से चुना जाता है दिए गए डेटा फिट करने के लिए ( किसी भी स्थान जैसे घन या वास्तव में किसी भी उचित टोपोलॉजिकल स्पेस) में कुछ प्राकृतिक मानदंडों के अनुसार हो सकता है।hθ:X→Rnhθ:X→Rnh_\theta:X\to \mathbb …

1
लसो के लिए सादे उप-विधायक तरीकों के बजाय समीपस्थ ढाल वंश क्यों?
मैं वेनिला उपनगर विधियों के माध्यम से लासो को हल करने के लिए सोच रहा था। लेकिन मैंने लोगों को समीपवर्ती ढाल वंश का उपयोग करने का सुझाव देते हुए पढ़ा है। क्या कोई यह उजागर कर सकता है कि लास्सो के लिए वेनिला उपनगर विधियों के बजाय समीपस्थ जीडी …

1
इस ऑटोएन्कोडर नेटवर्क फ़ंक्शन को ठीक से नहीं बना सकते हैं (विस्मय और अधिकतम परतों के साथ)
Autoencoder नेटवर्क को सामान्य क्लासिफायर MLP नेटवर्क की तुलना में अधिक पेचीदा लगता है। Lasagne का उपयोग करने के कई प्रयासों के बाद, जो मुझे पुन: निर्मित आउटपुट में प्राप्त होता है, वह कुछ ऐसा है जो एमएनआईएसटीटी डेटाबेस की सभी छवियों का एक धुँधली औसत से मिलता-जुलता है, जो …

2
एसवीएम का उपयोग करते समय, मुझे विशेषताओं को स्केल करने की आवश्यकता क्यों है?
स्टैंडर्ड -क्लेर ऑब्जेक्ट के दस्तावेज़ के अनुसार scikit-learn: उदाहरण के लिए, लर्निंग एल्गोरिथम के उद्देश्य फ़ंक्शन में उपयोग किए जाने वाले कई तत्व (जैसे कि समर्थन वेक्टर मशीनों के आरबीएफ कर्नेल या रैखिक मॉडल के एल 1 और एल 2 नियमितकर्ता) यह मानते हैं कि सभी सुविधाएँ 0 के आसपास …

1
पुनर्निमित बूस्टेड रिग्रेशन ट्री (BRT), सामान्यीकृत बूस्टेड मॉडल (GBM), और ग्रेडिएंट बूस्टिंग मशीन (GBM)
प्रशन: बूस्टेड रिग्रेशन ट्री (बीआरटी) और सामान्यीकृत बूस्टेड मॉडल (जीबीएम) के बीच अंतर क्या है? क्या उनका परस्पर उपयोग किया जा सकता है? क्या एक दूसरे का विशिष्ट रूप है? रिडवे ने "सामान्यीकृत बूस्ट रिग्रेशन मॉडल" (जीबीएम) वाक्यांश का उपयोग क्यों किया, यह बताने के लिए कि फ्राइडमैन ने पहले …

1
मानदंड के साथ निरंतर चर के लिए इष्टतम विवेक का पता लगाने और मूल्यांकन करने के लिए कैसे ?
मेरे पास निरंतर चर और द्विआधारी लक्ष्य चर (0 और 1) के साथ एक डेटा सेट है। मुझे लक्ष्य चर के संबंध में और इस विवशता के साथ निरंतर चर (लॉजिस्टिक रिग्रेशन के लिए) को अलग करने की आवश्यकता है कि प्रत्येक अंतराल में अवलोकन की आवृत्ति संतुलित होनी चाहिए। …

2
बूस्ट आउट करने के लिए बैग त्रुटि का अनुमान?
रैंडम फ़ॉरेस्ट में, प्रत्येक पेड़ को डेटा के एक अद्वितीय बूस्टर नमूना के समानांतर में उगाया जाता है। क्योंकि प्रत्येक बूस्टअप सैंपल में लगभग 63% अनोखी टिप्पणियों के होने की उम्मीद है, यह लगभग 37% टिप्पणियों को छोड़ देता है, जिसका उपयोग पेड़ के परीक्षण के लिए किया जा सकता …

2
क्या CART के पेड़ भविष्यवक्ताओं के बीच बातचीत पर कब्जा करते हैं?
यह पेपर दावा करता है कि CART में, क्योंकि प्रत्येक चरण पर एक एकल कोवरिएट पर एक बाइनरी विभाजन किया जाता है, सभी विभाजन ऑर्थोगोनल होते हैं और इसलिए कोवरिएट्स के बीच बातचीत को नहीं माना जाता है। हालांकि, बहुत गंभीर संदर्भों का दावा है, इसके विपरीत, कि पेड़ की …

1
ऑटोएन्कोडर और कन्वेक्शनल न्यूरल नेटवर्क में सीखे गए फिल्टर्स के बीच अंतर क्या हैं?
CNN में, हम फिल्टर को कंसट्रक्शनल लेयर में फीचर मैप बनाने के लिए सीखेंगे। Autoencoder में, प्रत्येक परत की छिपी हुई इकाई को फ़िल्टर के रूप में माना जा सकता है। इन दो नेटवर्क में सीखे गए फिल्टरों में क्या अंतर है?

3
ImageNet: शीर्ष-पाँच त्रुटि का क्या अर्थ है?
ImageNet प्रतियोगिता के लिए मूल्यांकन पद्धति में से एक (1,000 श्रेणियों की छवियों को वर्गीकृत करें) शीर्ष -5 त्रुटि है, इसका क्या मतलब है? देखें: http://www.image-net.org/challenges/LSVRC/

2
कैसे साबित करें कि कई गुना धारणा सही है?
मशीन लर्निंग में, यह अक्सर माना जाता है कि एक डेटा सेट एक चिकनी कम-आयामी कई गुना (कई गुना धारणा) पर है, लेकिन क्या यह साबित करने का कोई तरीका है कि कुछ शर्तों को संतुष्ट किया जाता है, तो डेटा सेट वास्तव में (लगभग) उत्पन्न होता है। एक कम …

2
एक शोर डेटा क्लस्टरिंग या outliers के साथ
मेरे पास इस तरह दो चर का शोर डेटा है। x1 <- rep(seq(0,1, 0.1), each = 3000) set.seed(123) y1 <- rep (c(0.2, 0.8, 0.3, 0.9, 0.65, 0.35,0.7,0.1,0.25, 0.3, 0.95), each = 3000) set.seed(1234) e1 = rnorm(length(x1), 0.07,0.07) set.seed(1223) e2 = rnorm(length(x1), 0.07,0.07) set.seed(1334) yn <- rnorm(20000, 0.5,0.9) set.seed(2344) xn <- …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.