हाल ही में UPC / बार्सिलोना में प्रोफेसर ओरियोल पुजोल से मशीन लर्निंग क्लास में उन्होंने मशीन लर्निंग संबंधित कार्य की एक विस्तृत श्रृंखला के लिए उपयोग करने के लिए सबसे सामान्य एल्गोरिदम, सिद्धांतों और अवधारणाओं का वर्णन किया। यहाँ मैं उन्हें आपके साथ साझा करता हूं और आपसे पूछता हूं:
- क्या विभिन्न प्रकार की मशीन सीखने से संबंधित समस्याओं के लिए दृष्टिकोण या विधियों के साथ कोई व्यापक रूपरेखा मिलान कार्य है?
मैं एक साधारण गाऊसी कैसे सीख सकता हूं? संभाव्यता, यादृच्छिक चर, वितरण; आकलन, अभिसरण और स्पर्शोन्मुखता, आत्मविश्वास अंतराल।
मैं गॉसियंस (MoG) का मिश्रण कैसे सीखूं? संभावना, उम्मीद-अधिकतमकरण (ईएम); सामान्यीकरण, मॉडल चयन, क्रॉस-सत्यापन; k- साधन, छिपे हुए मार्कोव मॉडल (HMM)
मैं कोई घनत्व कैसे सीखूं? पैरामीट्रिक बनाम गैर-पैरामीट्रिक अनुमान, सोबोलेव और अन्य कार्यात्मक रिक्त स्थान; l error 2 त्रुटि; कर्नेल घनत्व अनुमान (केडीई), इष्टतम कर्नेल, केडीई सिद्धांत
मैं एक निरंतर चर (प्रतिगमन) की भविष्यवाणी कैसे करूं? रैखिक प्रतिगमन, नियमितीकरण, रिज प्रतिगमन, और LASSO; स्थानीय रैखिक प्रतिगमन; सशर्त घनत्व का अनुमान।
मैं असतत चर (वर्गीकरण) की भविष्यवाणी कैसे करूं? बेयस क्लासिफायरियर, भोला बेयस, जेनेरिक बनाम भेदभावपूर्ण; अवधारणात्मक, भार क्षय, रैखिक समर्थन वेक्टर मशीन; निकटतम पड़ोसी वर्गीकरण और सिद्धांत
मुझे किस हानि कार्य का उपयोग करना चाहिए? अधिकतम संभावना अनुमान सिद्धांत; एल -2 अनुमान; बाइसियन अनुमान; न्यूनतम और निर्णय सिद्धांत, बायसिअनिज्म बनाम अक्सरवाद
मुझे किस मॉडल का उपयोग करना चाहिए? एआईसी और बीआईसी; वाप्निक-चेरवोनेंकिस सिद्धांत; क्रॉस-सत्यापन सिद्धांत; बूटस्ट्रैपिंग; संभवतः लगभग सही (PAC) सिद्धांत; घृणित-व्युत्पन्न सीमा
मैं प्रशंसक (संयुक्त) मॉडल कैसे सीख सकता हूं? सीखने के सिद्धांत को इकट्ठा करना; बढ़ाने; जीतना; स्टैकिंग
मैं प्रशंसक (नॉनलाइनर) मॉडल कैसे सीख सकता हूं? सामान्यीकृत रैखिक मॉडल, लॉजिस्टिक प्रतिगमन; कोलमोगोरोव प्रमेय, सामान्यीकृत योजक मॉडल; कर्नेलीकरण, कर्नेल हिल्बर्ट रिक्त स्थान, गैर-रेखीय SVM, गाऊसी प्रक्रिया प्रतिगमन को पुन: उत्पन्न करता है
मैं प्रशंसक (रचनाकार) मॉडल कैसे सीख सकता हूं? पुनरावर्ती मॉडल, निर्णय पेड़, श्रेणीबद्ध क्लस्टरिंग; तंत्रिका नेटवर्क, वापस प्रसार, गहरी विश्वास नेटवर्क; ग्राफिकल मॉडल, एचएमएम का मिश्रण, सशर्त यादृच्छिक क्षेत्र, अधिकतम-मार्जिन मार्कोव नेटवर्क; लॉग-रैखिक मॉडल; व्याकरण
मैं सुविधाओं को कैसे कम या संबंधित करूं? सुविधा चयन बनाम आयामीता में कमी, सुविधा चयन के लिए आवरण विधियां; सहसंबंध बनाम सहसंबंध, आंशिक सहसंबंध, बेयर्स नेट संरचना सीखने
मैं नई सुविधाएँ कैसे बनाऊँ? प्रमुख घटक विश्लेषण (पीसीए), स्वतंत्र घटक विश्लेषण (आईसीए), बहुआयामी स्केलिंग, कई गुना सीखने, पर्यवेक्षित आयामीता में कमी, मीट्रिक सीखने
मैं डेटा को कैसे कम या संबंधित करूं? क्लस्टरिंग, द्वि-क्लस्टरिंग, विवश क्लस्टरिंग; एसोसिएशन के नियम और मार्केट बास्केट विश्लेषण; रैंकिंग / क्रमिक प्रतिगमन; लिंक विश्लेषण; संबंधपरक डेटा
मैं समय श्रृंखला का इलाज कैसे करूं? ARMA; कलमन फ़िल्टर और स्टेट-स्पेस मॉडल, कण फिल्टर; कार्यात्मक डेटा विश्लेषण; परिवर्तन-बिंदु का पता लगाने; समय श्रृंखला के लिए क्रॉस-मान्यता
मैं गैर-आदर्श डेटा का इलाज कैसे करूँ? कोवरिएट शिफ्ट; वर्ग असंतुलन; लापता डेटा, अनियमित रूप से नमूना डेटा, माप त्रुटियां; विसंगति का पता लगाने, मजबूती
मैं मापदंडों को कैसे अनुकूलित करूं? असंबंधित बनाम विवश / उत्तल अनुकूलन, व्युत्पन्न-मुक्त विधियाँ, प्रथम- और द्वितीय-क्रम विधियाँ, पीछे हटना; प्राकृतिक ढाल; बाध्य अनुकूलन और ईएम
मैं रैखिक कार्यों को कैसे अनुकूलित करूं? कम्प्यूटेशनल रैखिक बीजगणित, प्रतिगमन के लिए मैट्रिक्स व्युत्क्रम, आयामी कमी के लिए एकवचन मूल्य अपघटन (SVD)
मैं बाधाओं के साथ अनुकूलन कैसे करूं? उत्तलता, लैगेंज गुणक, करुश-कुह्न-टकर की स्थिति, आंतरिक बिंदु विधियाँ, एमएमएम के लिए एसएमओ एल्गोरिथ्म
मैं गहराई से नेस्टेड योगों का मूल्यांकन कैसे करूँ? सटीक चित्रमय मॉडल निष्कर्ष, रकम पर वैचारिक सीमा, अनुमानित ग्राफिकल मॉडल अनुमान, अपेक्षा प्रसार
मैं बड़ी रकम और खोजों का मूल्यांकन कैसे करूँ? सामान्यीकृत एन-बॉडी समस्याएं (जीएनपी), पदानुक्रमित डेटा संरचनाएं, निकटतम पड़ोसी खोज, तेज एकाधिक विधि; मोंटे कार्लो एकीकरण, मार्कोव चेन मोंटे कार्लो, मोंटे कार्लो एसवीडी
मैं और भी बड़ी समस्याओं का इलाज कैसे करूँ? समानांतर / वितरित EM, समानांतर / वितरित GNP; स्टोचैस्टिक अवशिष्ट विधियाँ, ऑनलाइन शिक्षण
मैं वास्तविक दुनिया में यह सब कैसे लागू करूं? एमएल के हिस्सों का अवलोकन, प्रत्येक कार्य के लिए उपयोग करने के तरीकों के बीच चयन, पूर्व ज्ञान और मान्यताओं; अन्वेषणात्मक डेटा विश्लेषण और सूचना दृश्य; मूल्यांकन और व्याख्या, आत्मविश्वास अंतराल और परिकल्पना परीक्षण, आरओसी घटता का उपयोग करना; जहां एमएल में अनुसंधान की समस्याएं हैं