मशीन सीखने के लिए आंकड़े, कागजात शुरू करने के लिए?


10

मेरे पास कंप्यूटर प्रोग्रामिंग और प्राथमिक संख्या सिद्धांत में एक पृष्ठभूमि है, लेकिन कोई वास्तविक सांख्यिकी प्रशिक्षण नहीं है, और हाल ही में "खोज" किया है कि पूरी तकनीक की अद्भुत दुनिया वास्तव में एक सांख्यिकीय दुनिया है। ऐसा लगता है कि मैट्रिक्स कारक, मैट्रिक्स पूर्णता, उच्च आयामी टेनर्स, एम्बेडिंग, घनत्व अनुमान, बायेसियन इनविक्शन, मार्कोव विभाजन, ईजेन्वेक्टर कम्प्यूटेशन, पेजरैंक सभी उच्च सांख्यिकीय तकनीक हैं, और यह कि मशीन एल्गोरिदम ऐसी चीजों का उपयोग करते हैं, जो बहुत सारे आँकड़ों का उपयोग करते हैं ।

मेरा लक्ष्य उन कागजों को पढ़ने में सक्षम होना है जो ऐसी चीजों पर चर्चा करते हैं, और एल्गोरिदम को लागू करते हैं या बनाते हैं, जबकि उपयोग किए गए अंकन, "प्रमाण" और सांख्यिकीय तर्कों को समझते हैं। मुझे लगता है कि मैटरिस को शामिल करने वाले सभी सबूतों का पालन करना सबसे मुश्किल काम है।

मुझे कौन से बुनियादी कागजात मिल सकते हैं? या व्यायाम के साथ एक अच्छी पाठ्यपुस्तक जो काम करने लायक हो?

विशेष रूप से, कुछ कागजात जिन्हें मैं पूरी तरह से समझना चाहूंगा:

  1. सटीक मैट्रिक्स उत्तल उत्तल अनुकूलन, मोमबत्तियाँ, पुनर्वसन, 2008 के माध्यम से
  2. द फास्ट कॉची ट्रांसफ़ॉर्म एंड फास्टर रोबस्ट लाइनर रिग्रेशन, क्लार्कसन एट अल, 2013
  3. समर्थन वेक्टर मशीनों के लिए यादृच्छिक अनुमान, पॉल एट अल, 2013
  4. डीप डेंसिटी मॉडल, रिप्पल, एडम्स, 2013 के साथ उच्च-आयामी संभाव्यता अनुमान
  5. कम-रैंक मैट्रिक्स की पूर्णता, किर्ली, थेरान, 2013 के लिए त्रुटि-न्यूनतम अनुमानों और यूनिवर्सल एंट्री-वाइज़ सीमा को प्राप्त करना

1
क्या आप पहले से ही एक लागू रैखिक बीजगणित पाठ्यक्रम के माध्यम से मैट्रिसेस से परिचित हैं, या आप जो कुछ सीखना चाहते हैं, क्या वह हिस्सा है? मैं कहूंगा कि आपके द्वारा दी गई सूची का पहला आधा हिस्सा ऐसे विषय हैं जो अत्यधिक सांख्यिकीय तकनीक के बजाय आंकड़ों में महत्वपूर्ण हैं (जो मुझे विपरीत दिशा में जाने के रूप में प्रभावित करता है)। सांख्यिकीय मशीन सीखने के लिए अनुशंसित पुस्तकों पर यहां कई प्रश्न हैं। मैं आपको एक उदाहरण या दो विशिष्ट पत्र प्रदान करने का सुझाव दूंगा, जिन्हें आप समझना चाहते हैं; इससे आपको प्राप्त उत्तरों पर ध्यान केंद्रित करने में बेहतर मदद मिलेगी।
कार्डिनल

2
हां, मेट्रिसेस से परिचित, रैखिक बीजगणित के माध्यम से, और वेक्टर स्थान, आधार, मानदंडों की अवधारणाओं के साथ, लेकिन मैं एलयू फैक्टराइजेशन जैसी चीजों को पूरी तरह से नहीं समझता हूं, हालांकि मैं ग्राम-श्मिट ऑर्थोगोनाइजेशन और अनप्टीमाइज्ड क्यूआर एल्गोरिदम के बारे में काफी स्पष्ट हूं, हालांकि पूरी तरह से स्पष्ट नहीं है कि वे क्यों काम करते हैं। इसके अलावा, मुझे यह समझ में नहीं आता है कि कैसे लोग इस पर एक eigenvector एल्गोरिथ्म प्रदर्शन के बिना एक यादृच्छिक मैट्रिक्स के लिए eigenvectors प्राप्त कर सकते हैं
क्राइस स्ट्रींगफेलो

जवाबों:


2

मैं Coursera पर एंड्रयू एनजीएस मशीन लर्निंग कोर्स की सिफारिश करूंगा, यह सभी बुनियादी बातों पर एक शानदार कवरेज करता है। यदि आप संभाव्य चित्रमय मॉडल के साथ कुछ भी करने के लिए अध्ययन कर रहे हैं तो डाफ्ने कोलर्स पाठ्यक्रम को भी देखना अच्छा होगा।

यह स्व-अध्ययन संसाधनों के लिए भी एक खजाना है । http://ragle.sanukcode.net/articles/machine-learning-self-study-resources/ हर्ब ग्रॉसमैन के व्याख्यान कमाल के हैं।

मुझे इस पुस्तक की सिफारिश भी की गई है https://www.openintro.org/stat/textbook.php क्योंकि मैं हमेशा अभी भी खुद को सीख रहा हूं और आंकड़े मेरी पृष्ठभूमि नहीं हैं!

मेरे दो सेंट गणित की चीजों और कागजों के पक्ष में हैं, हालांकि पृष्ठभूमि गणित पर बहुत ज्यादा पकड़ नहीं है। मूल बातें जानें और उन कागजातों का संदर्भ लें जिन्हें आपके द्वारा उल्लिखित कागजों पर बनाया गया है और देखें कि क्या वे आसान हैं (हो सकता है कि आपको कुछ पाने के लिए कुछ कागज वापस करने पड़ें, आप समझ सकते हैं कि यह-मैं खुद क्या करता हूं) एमएल में गणित के विभिन्न तत्वों और यह एक खरगोश छेद नीचे चूसा पाने के लिए आसान है (फिर से कुछ मैंने अपने आप को एक से अधिक बार किया है)।

बेस्ट ऑफ लक, यह वास्तव में एक दिलचस्प क्षेत्र है!

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.