महान एल्गोरिदम, मशीन सीखने और कोई रेखीय बीजगणित नहीं


30

मैं एक उन्नत एल्गोरिदम पाठ्यक्रम सिखाता हूं और मशीन लर्निंग से संबंधित कुछ विषयों को शामिल करना चाहूंगा जो मेरे छात्रों के लिए हितकारी होंगे। नतीजतन, मैं मशीन सीखने में वर्तमान में सबसे दिलचस्प / सबसे बड़ी एल्गोरिथम परिणामों के बारे में लोगों की राय सुनना चाहूंगा। संभावित मुश्किल बाधा यह है कि छात्रों को रैखिक बीजगणित या मशीन सीखने के अन्य मुख्य विषयों का कोई विशेष पूर्व ज्ञान नहीं होगा।

यह वास्तव में उन्हें विषय के बारे में उत्साहित करने और उन्हें यह बताने के लिए है कि एमएल एल्गोरिदम विशेषज्ञों के लिए एक संभावित रोमांचक अनुसंधान क्षेत्र है।

EDIT: यह एक अंतिम वर्ष का स्नातक पाठ्यक्रम है (क्योंकि हमारे पास मुख्य रूप से यूके में स्नातक पाठ्यक्रम नहीं है)। उन्होंने पहले से कम से कम एक बुनियादी एल्गोरिदम कोर्स किया होगा और संभवत: इसमें अच्छा प्रदर्शन किया होगा ताकि एडवांस्ड फॉलोअप कोर्स चुना जा सके। उन्नत पाठ्यक्रम के वर्तमान पाठ्यक्रम में सटीक हैशिंग, ब्लूम फिल्टर, वैन एमड बोस ट्री, लीनियर प्रोग।, लगभग जैसे विषय हैं। एनपी-हार्ड समस्याओं आदि के लिए एल्गोरिदम मैं विशेष रूप से एमएल पर एक से अधिक व्याख्यान खर्च करने का इरादा नहीं करता है, लेकिन अगर कुछ एल्गोरिदम पाठ्यक्रम और एमएल एक दोनों के लिए वास्तव में प्रासंगिक है, तो निश्चित रूप से इसे भी शामिल किया जा सकता है।


1
कृपया दो चीजें स्पष्ट करें: 1) क्या यह स्नातक पाठ्यक्रम है या स्नातक पाठ्यक्रम है? क्या संबंधित पाठ्यक्रम (यदि कोई हो) वे पास कर चुके हैं? 2) आप एमएल को कितना समय देना चाहते हैं?
एमएस डौस्टी

3
हममम मुझे लगता है कि रैखिक बीजगणित एक और एक महत्वपूर्ण नींव कोर्स है, कम से कम मशीन सीखने के पक्ष में। और मुझे लगता है कि लीनियर मॉडल मशीन लर्निंग एल्गोरिदम के लिए बहुत अच्छा परिचयात्मक है। आप K- निकटतम पड़ोसी या लॉजिस्टिक प्रतिगमन एल्गोरिदम जैसे अन्य बुनियादी स्तर के एल्गोरिदम के बारे में सोच सकते हैं। हो सकता है इस मदद आप en.wikipedia.org/wiki/List_of_machine_learning_algorithms
Deyaa

1
शायद हैल ड्यूम मशीन लर्निंग सिखाता है से कुछ विचार - nlpers.blogspot.com/2010/04/how-i-teach-machine-learning.html
यारोस्लाव

3
प्रिय राफेल, एवरिम ब्लम आमतौर पर मशीन सीखने और कुछ संबंधित विषयों के साथ अपने वरिष्ठ-स्तरीय एल्गोरिदम वर्ग का समापन करता है; निम्न लिंक cs.cmu.edu/~avrim/451f09/index.html पर हाल ही में है , और आप उसके वेबपेज से अधिक जानकारी प्राप्त कर सकते हैं। TA'd और इस क्लास को लेने के बाद, मैं कह सकता हूँ कि यह (और इसकी समापन सामग्री) छात्रों द्वारा बहुत गर्मजोशी से प्राप्त की गई है।
3

1
vzn

जवाबों:


29

आप बूस्टिंग कवर कर सकते हैं । यह बहुत चालाक है, लागू करना आसान है, व्यापक रूप से अभ्यास में उपयोग किया जाता है, और इसे समझने के लिए बहुत आवश्यक ज्ञान की आवश्यकता नहीं होती है।


5
मैंने अरोरा एट अल द्वारा सर्वेक्षण के कुछ हिस्से प्रस्तुत किए हैं। ( cs.princeton.edu/~arora/pubs/MWsurvey.pdf ) श्रेणी में कुछ साल पहले। लोगों को यह पसंद आया और मुझे लगता है कि इस सामग्री को समझने के लिए आपको लगभग किसी पृष्ठभूमि की आवश्यकता नहीं है।
दानू

9

यदि आप केवल एक व्याख्यान में उनकी भूख को कम करना चाहते हैं, तो यह एक शक्तिशाली अनुप्रयोग प्रस्तुत करने के लिए सबसे रोमांचक हो सकता है। उदाहरण के लिए, दवा की खोज के लिए कीमोफॉर्मफॉर्मेटिक्स में वेक्टर मशीनों और अन्य मशीन लर्निंग एल्गोरिदम का समर्थन किया जाता है।

सीखने की समस्या अनिवार्य रूप से है: एक ऐसा व्यवहार जिसे हम चाहते हैं कि वह एक रसायन का प्रदर्शन करे, एक ऐसी संरचना तैयार करे जो उस व्यवहार को प्रदर्शित करता है जिसे ज्ञात संरचनाओं के डेटाबेस से घटाकर समान (या भिन्न) व्यवहार प्रदर्शित किया जाता है। सीखने की समस्या में एक अतिरिक्त शिकन है: नई दवा को पहले से ज्ञात दवाओं से वैश्विक संरचना में "दूर" होने की जरूरत है, ताकि पेटेंट संपत्ति मिल सके।

एक स्रोत कम्प्यूटेशनल रसायन विज्ञान में क्लस्टरिंग तरीके और उनके उपयोग हैं


1
संदर्भ के लिए धन्यवाद। मैं शायद SVMs को उत्तल अनुकूलन के एक अनुप्रयोग के रूप में पढ़ाने के बारे में सोच रहा था। यह एल्गोरिथम भाग को ML भाग के साथ अच्छी तरह से संबंधित करेगा।
राफेल

2
आप रैखिक बीजगणित के बिना SVM को कैसे कवर करते हैं?
लेव Reyzin

मैं अपने पाठ्यक्रम में इसके लिए उन्हें न्यूनतम आवश्यक शर्तें सिखाने की उम्मीद कर रहा था। शायद यह बहुत आशावादी था :-)
राफेल

क्या अभी भी महत्वपूर्ण उदाहरण हैं जहां समर्थन वेक्टर मशीनें सबसे अच्छा विकल्प हैं? मैंने देखा है कि उदाहरण के लिए, कागल प्रतियोगिताओं में, वे कभी भी जीतने वाली प्रविष्टि का मुख्य हिस्सा नहीं होते हैं। कम से कम ऐसा कोई नहीं जो मैंने हाल ही में देखा हो। (मैं निश्चित रूप से सही होने के लिए खड़ा हूं।)
लेम्बिक

7

के-मीन्स और केएनएन बहुत शक्तिशाली हैं और अंकों की दूरी की गणना को छोड़कर किसी भी रैखिक बीजगणित की आवश्यकता नहीं है।


K-Means विशेष रूप से एक बहुत शक्तिशाली एल्गोरिथ्म है। यह अपने उद्देश्य समारोह के प्रदर्शन पर किसी भी हद तक साबित नहीं होने के बावजूद अविश्वसनीय रूप से प्रभावी है, यह लगभग उसी तरह है जैसे कि सिम्प्लेक्स एल्गोरिथ्म की प्रभावी बहुपद जटिलता (वास्तविक घातीय जटिलता के बावजूद)। इसका ऑनलाइन संस्करण बड़े पैमाने पर डेटा अनुप्रयोगों में भी उपयोगी है।
इलियट जे जे

5

क्रिस्टोफर बिशप (एमएसआर में) द्वारा "न्यूरल नेटवर्क और मशीन लर्निंग" का दूसरा भाग एमएलएम में एल्गोरिदम पर है। बिशप की पाठ्यपुस्तकों का उपयोग आमतौर पर स्नातक (और बाद में स्नातक) पाठ्यपुस्तकों के लिए किया जाता है और यह बहुत अच्छी तरह से लिखा जाता है।


4

यह एल्गोरिथ्म केवल लेबल किए गए नमूनों की छोटी मात्रा का उपयोग करके बड़ी संख्या में अनलिस्टेड नमूनों को वर्गीकृत करने के लिए ग्राफ न्यूनतम कटौती का उपयोग करता है।

इसका अंडरग्राउंड फ्रेंडली है। मैंने इसे कुछ बेतरतीब ढंग से चुने हुए अंडरगार्मेंट्स के बारे में समझाया है और उन्होंने इसे समझा।

रेफ: ब्लम, ए।, और चावला, एस। (2001)। ग्राफ मिनीक्राफ्ट का उपयोग करके लेबल और अनलेब किए गए डेटा से सीखना।

आत्म प्रचार यूट्यूब पर एल्गोरिदम का विज़ुअलाइज़ेशन ।


4

मैं देखता हूं कि एक्सपेक्टेशन मैक्सिमाइजेशन (ईएम) का उल्लेख नहीं किया गया है, और यह निश्चित रूप से शीर्ष 10 में "ऊपर है": http://www.cs.uvm.edu/~icdm/algorithms/10Al एल्गोरिदम-08.pdf ।


1

सुदृढीकरण लर्निंग एल्गोरिदम (विशेष रूप से क्यू-लर्निंग और SARSA) समझने में काफी सरल हैं और कुछ सीखने की समस्याओं को हल करने के लिए बहुत शक्तिशाली हैं। अभिसरण प्रमाण और अभिसरण दर को छोड़कर, उन्हें रैखिक बीजगणित में किसी भी उन्नत ज्ञान की आवश्यकता नहीं होती है।

आप लिटमैन और अल के प्रसिद्ध सर्वेक्षण का उपयोग कर सकते हैं। http://www.cs.cmu.edu/afs/cs/project/jair/pub/volume4/kaelbling96a-html/rl-survey.html


1

आप कुछ एल्गोरिदम को कवर कर सकते हैं जो क्लासिक या अच्छे अंतर्ज्ञान के साथ हैं।

उदाहरण के लिए, C4.5 और CART, जो क्लासिक निर्णय ट्री एल्गोरिदम हैं।

आप कुछ पहनावा के तरीकों (जैसे, AdaBoost (Boosting), Bagging) को भी कवर कर सकते हैं, जिनका वास्तविक विश्व अनुप्रयोगों में बहुत अच्छा प्रदर्शन है।

इसके अलावा, गहरी शिक्षा भी एक अच्छा विषय है, क्योंकि यह बहुत गर्म है।



0

मूल निवासी और बायेसियन नेटवर्क, निर्णय ट्री एल्गोरिदम एक तटस्थ नेटवर्क या svm के साथ शुरू करने की तुलना में कल्पना करना काफी आसान है


0

आनुवंशिक प्रोग्रामिंग वास्तव में अच्छा है। यह जीव विज्ञान से प्रेरणा का उपयोग करता है, और बड़ी संख्या में समस्याओं पर लागू किया जा सकता है (उदाहरण के लिए, एन-क्वेन्स समस्या, और टीएसपी)।

इसके लिए गहरे गणितीय कौशल की आवश्यकता नहीं है।

EDIT: यह केवल अनुमान लगाने का एक तरीका है कि संभावित समाधान कितना अच्छा है। इसका उपयोग उदाहरणों के लिए संख्याओं की एक श्रृंखला के पीछे के नियम का अनुमान लगाने के लिए, बहु-चर समस्याओं के लिए मिनीमा / मैक्सिमा खोजने और विशाल पैरामीटर रिक्त स्थान खोजने के लिए किया जा सकता है। यह अनुकूल है जब आप इष्टतम समाधान में रुचि नहीं रखते हैं, लेकिन जब एक अच्छा पर्याप्त समाधान करेगा। मेरा मानना ​​है कि इसका इस्तेमाल गेम के लिए अच्छी रणनीति (स्टारक्राफ्ट 2 में ऑर्डर बनाने और मारियो में इष्टतम खेलने) के लिए किया गया है।


क्या कोई महत्वपूर्ण समस्या है जिसके लिए यह सबसे अच्छी विधि है? मेरा मतलब है कि यह निश्चित रूप से उदाहरण के लिए टीएसपी के लिए नहीं है।
लेम्बिक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.