डेटा खनन और मशीन सीखने के लिए आप कौन से गणित विषय सुझाएंगे?


30

मैं डेटा माइनिंग और मशीन लर्निंग सीखने की तैयारी के लिए एक स्व-निर्देशित गणित पाठ्यक्रम को एक साथ रखने की कोशिश कर रहा हूं। यह कोर्टेरा पर एंड्रयू एनजी की मशीन सीखने की कक्षा शुरू करने और महसूस करने से प्रेरित है कि आगे बढ़ने से पहले मुझे अपने गणित कौशल में सुधार करने की आवश्यकता थी। मैंने कॉलेज से कुछ समय पहले स्नातक की उपाधि प्राप्त की है इसलिए मेरी बीजगणित और सांख्यिकी (विशेष रूप से राजनीति विज्ञान / मनोविज्ञान कक्षाओं से) कठोर हैं।

धागे में जवाब गणित में एक मजबूत पृष्ठभूमि है एमएल के लिए कुल अपेक्षित? केवल मशीन सीखने से संबंधित पुस्तकों या कक्षाओं का सुझाव दें; मैंने पहले से ही उन कक्षाओं और पुस्तकों में से कुछ पर गौर किया है और यह नहीं जानता कि अध्ययन के लिए कौन सा गणित विषय है (उदाहरण के लिए: गणित के पते का क्या क्षेत्र [एस] "समीकरण को कम करने के लिए एक लागत समारोह?"। सुझाए गए दूसरे धागे ( कौशल और डेटा विश्लेषण के लिए आवश्यक कौशल) में केवल डेटा के विश्लेषण के लिए आवश्यक कौशल की व्यापक श्रेणियों का उल्लेख है। गणितज्ञों के लिए आंकड़ों का धागा परिचय लागू नहीं होता है क्योंकि मेरे पास पहले से गणित की डिग्री नहीं है; एक समान धागा गणितज्ञ एक गुणवत्ता आँकड़े डिग्री के बराबर ज्ञान चाहता है आँकड़ों की किताबों की एक अविश्वसनीय सूची है, लेकिन फिर से, मैं बीजगणित के जंग खाए याद से गणित शुरू कर रहा हूं और वहां से आगे बढ़ रहा हूं।

तो, जो लोग मशीन लर्निंग और डेटा माइनिंग में काम करते हैं, उनके लिए आपको अपनी नौकरी करने के लिए गणित के कौन से क्षेत्र आवश्यक हैं? आप डेटा खनन और मशीन सीखने के लिए कौन से गणित विषय सुझाएंगे, और किस क्रम में? यहां मेरे पास अब तक की सूची और क्रम है:

  • बीजगणित
  • पूर्व पथरी
  • गणना
  • रेखीय बीजगणित
  • संभावना
  • सांख्यिकी (यहां कई अलग-अलग उप-क्षेत्र हैं, लेकिन उन्हें तोड़ना नहीं जानते हैं)

डेटा माइनिंग और मशीन लर्निंग के लिए, अपनी वर्तमान नौकरी के माध्यम से मेरे पास वेबसाइट / ऐप गतिविधि, ग्राहक / सदस्यता लेनदेन और रियल एस्टेट डेटा (स्थिर और समय-श्रृंखला दोनों) पर रिकॉर्ड तक पहुंच है। मुझे इन डेटासेट पर डेटा माइनिंग और मशीन लर्निंग लागू करने की उम्मीद है।

धन्यवाद!

संपादित करें:

पोस्टरिटी की खातिर, मैं सीएमयू में जियोफ्री गॉर्डन / एलेक्स स्मोला के इंट्रो टू मशीन लर्निंग क्लास के लिए एक सहायक गणित स्व-मूल्यांकन साझा करना चाहता था ।


3
कौरसेरा वर्गों के लिए किसी और शर्त के संदर्भ में, यह जानकारी उनकी सामग्री में कहीं उपलब्ध होनी चाहिए। उनकी कक्षाओं के बाहर / आम तौर पर, स्टेट के लिए कि आपको गणित / एमएल / डीएम के लिए किस गणित की आवश्यकता है, एक डुप्लिकेट के रूप में। सीवी पर कई धागे हैं जो इस सामग्री को कवर करते हैं, जिनमें शामिल है: एक मजबूत-पृष्ठभूमि-इन-मैथ्स-ए-अपेक्षित-एमएल के लिए , और कौशल-कोर्सवर्क-टू-ए-टू-ए-डेटा-एनालिस्ट ( शायद दूसरों के बीच)।
गंग -

1
कृपया उन थ्रेड्स की समीक्षा करें, जो थ्रेड्स वहां से जुड़े हुए हैं वे निकट से संबंधित हैं, और शायद साइट खोजते हैं। यदि आपके पास अभी भी पढ़ने के बाद एक प्रश्न है, तो यहां वापस आएं और इसे और अधिक विशिष्ट बनाने के लिए इस प्रश्न को संपादित करें / अधिक सटीक रूप से निर्दिष्ट करें जो आपको अभी भी जानना आवश्यक है जो कहीं और कवर नहीं किया गया था।
गूँग - मोनिका

जवाबों:


15

@Gung ने जो सुझाव दिए हैं, वे निश्चित रूप से निम्नलिखित हैं। कोर्स करने के बाद, मुझे लगता है कि आपकी सूची एक अच्छी शुरुआत है। कुछ टिप्पणियां:

  1. रैखिक बीजगणित और मैट्रिक्स बीजगणित एक ही बात है, इसलिए उत्तरार्द्ध को छोड़ दें।
  2. पथरी में आंशिक भेदभाव शामिल करना सुनिश्चित करें। यह पथरी एक से अधिक वेरिएबल के कार्यों पर लागू होती है (प्रतीकात्मक रूप से, अगर, कहें तो, और का एक फ़ंक्शन हैzxyzएक्सzएक्स
  3. पथरी में आपको बुनियादी एकीकरण से परे कुछ भी करने की आवश्यकता नहीं है (और शायद यह भी नहीं है)। यह सौभाग्यशाली है क्योंकि एकीकरण कठिन है।
  4. बुनियादी अनुकूलन जोड़ें, यानी एक फ़ंक्शन का अधिकतम या न्यूनतम, आमतौर पर एक से अधिक चर का एक फ़ंक्शन ढूंढना। बहुत कम से कम ग्रेडिएंट डिसेंट की सराहना जरूरी है।
  5. कठिनाई के संदर्भ में आप शायद 1 साल के स्नातक की शुरुआत और अंत के बीच कहीं होना चाहते हैं।
  6. ऑनलाइन या अन्यथा, कुछ बुनियादी संभाव्यता और सांख्यिकी ग्रंथों को पढ़ने की कोशिश करें, लेकिन बहुत अधिक चिंता न करें (बुनियादी गणित संभावना और आँकड़ों को समझने के लिए वैसे भी एक शर्त है)। यदि आप कुछ कोर्स करते हैं जैसे कि आप जो सुझाव देते हैं वह आपको पता चलेगा कि आपको क्या सीखने की ज़रूरत है और आपकी रुचियाँ कहाँ हैं। एक चीज जिसे आप नहीं करना चाहते हैं, कम से कम पहली बार, परिकल्पना परीक्षण के बारे में सीखने में बहुत समय व्यतीत करना है। आप इसके बजाय बुनियादी आँकड़ों - यादृच्छिक चर, संभाव्यता वितरण (PFDs, CDFs), वर्णनात्मक आँकड़ों को समझने की दिशा में आगे बढ़ना चाहते हैं - और फिर प्रतिगमन को समझने की कोशिश करेंगे।

5

इस मंच पर कुछ बेहतरीन सूत्र हैं- जिसमें यह भी शामिल है कि मुझे डेटा विज्ञान के काम के लिए महत्वपूर्ण कौशल की एक वैचारिक रूपरेखा विकसित करने के मामले में मेरे लिए विशेष रूप से उपयोगी पाया गया है।

जैसा कि ऊपर उल्लेख किया गया है, कई ऑनलाइन पाठ्यक्रम उपलब्ध हैं। उदाहरण के लिए कौरसेरा के पास अब कई पाठ्यक्रमों के साथ एक डेटा विज्ञान विशेषज्ञता है जो संभवतः आपके काम के लिए आवश्यक कुछ टूल को कवर करेगा।


3

यदि आप मशीन लर्निंग / डेटा माइनिंग पर बल्क अप करना चाह रहे हैं तो मैं ऑप्टिमाइज़ेशन / लीनियर अलजेब्रा / स्टैटिस और प्रोबेबिलिटी पर ज़ोर डालूँगा। यहाँ संभावना के लिए पुस्तकों की एक सूची है। उम्मीद है की वो मदद करदे।


3

जहाँ तक बहुत बुनियादी गणित कौशल को ब्रश करने की बात है, मैं इन पुस्तकों का उपयोग कर रहा हूँ:

अर्थशास्त्र और वित्त के लिए गणित के तत्व। Mavron, Vassilis C., Phillips, Timothy N यह किताबें आंशिक भेदभाव, एकीकरण, मैट्रिक्स और निर्धारकों, और अनुकूलन पर एक छोटा अध्याय और भी अंतर समीकरण के लिए आवश्यक गणित कौशल (अतिरिक्त विकल्प) शामिल हैं। यह अर्थशास्त्र और वित्त के लिए लक्षित है, लेकिन यह एक छोटी सी पुस्तक है, अध्यायों का क्रम मेरी आवश्यकता के अनुरूप है, और मेरे लिए आसान पढ़ा गया है।

सांख्यिकीय विश्लेषण: Microsoft Excel 2010. कॉनरैड कार्लबर्ग बुनियादी सांख्यिकीय विश्लेषण, कई प्रतिगमन, और सहसंयोजक के विश्लेषण को शामिल करता है, और यह एक्सेल का उपयोग करता है।

आर एंडी फील्ड, जेरेमी माइल्स, ज़ोए फील्ड का उपयोग करके सांख्यिकी की खोज। अभी तक नहीं पढ़ा है। यह आर का उपयोग करता है।

प्राथमिक रैखिक बीजगणित। रॉन लार्सन, डेविड सी। फाल्वो।

मैट्रिक्स के तरीके: रिचर्ड ब्रोंसन, गेब्रियल बी। कोस्टा द्वारा लागू रैखिक बीजगणित। प्राथमिक रैखिक बीजगणित और मैट्रिक्स कलन को शामिल करता है

वे मूल गणित की पुस्तकें हैं जिनका उपयोग मैं डेटा माइनिंग / मशीन लर्निंग से संबंधित करता हूं

उम्मीद है की यह मदद करेगा


3

तथाकथित "ओपन सोर्स डेटा साइंस मास्टर्स" में यहां बहुत सारे प्रासंगिक संसाधन सूचीबद्ध (और वर्गीकृत) किए गए हैं

विशेष रूप से गणित के लिए वे सूची:

  1. रैखिक बीजगणित और प्रोग्रामिंग
  2. आंकड़े
  3. विभेदक समीकरण और पथरी

सुंदर सामान्य सिफारिशें, हालांकि वे कुछ पाठ्यपुस्तकों की सूची देते हैं जो आपको उपयोगी लग सकती हैं।


2
  • संभाव्यता और आँकड़े आवश्यक हैं। कुछ खोजशब्द परिकल्पना परीक्षण, बहुभिन्नरूपी वितरण, बायेसियन इनविज़न (संयुक्त संभाव्यता, सशर्त प्रायिकता), माध्य, विचरण, सहसंयोजक, कुल्बैक-लिबलर विचलन, ...
  • मशीन सीखने के लिए बुनियादी रैखिक बीजगणित आवश्यक है। विषय जो आप सीख सकते हैं, वह हैं ईजन अपघटन और एकवचन मूल्य अपघटन। (बेशक आपको पता होना चाहिए कि मैट्रिक्स उत्पाद की गणना कैसे की जाती है।)
  • जैसा कि पहले ही उल्लेख किया गया है: अनुकूलन महत्वपूर्ण है। आपको पता होना चाहिए कि ढाल क्या है और शायद न्यूटन की विधि, लेवेनबर्ग-मार्क्वार्ड, ब्रोयडेन-फ्लेचर-गोल्डफर्ब-शन्नो पर एक नज़र है।
  • पथरी महत्वपूर्ण नहीं है, लेकिन यह जानना उपयोगी हो सकता है कि कार्यों के आंशिक व्युत्पत्ति की गणना कैसे करें (जैकोबी मैट्रिक्स, हेस्से मैट्रिक्स, ...) और आपको पता होना चाहिए कि एक अभिन्न अंग क्या है।

0

रैखिक बीजगणित, आँकड़े, पथरी। मुझे लगता है कि आप उन्हें टेंडेम डब्ल्यू / एमएल में सीख सकते हैं - या बुनियादी बातों के बाद भी । स्टार्टर पाठ्यक्रम / पुस्तकें गणित के प्राइमर अध्यायों के साथ बहुत अच्छा काम करते हैं, और आप एमएल सीखते समय गणित अनिवार्य सीखते हैं। मैंने मशीन सीखने के लिए आवश्यक गणित पर एक पॉडकास्ट एपिसोड बनाया, और उन्हें सीखने के लिए संसाधन: मशीन लर्निंग गाइड # 8


0

किसी भी मशीन सीखने के पाठ्यक्रम को शुरू करने से पहले गणित के पाठ्यक्रम का पालन करें। इसके अलावा एकल प्रयास में खुदाई करने की कोशिश न करें। बुनियादी अवधारणाओं को जानें फिर अपने गणित कौशल को ब्रश करें और दोहराएं: -

गणित विषय निम्नलिखित हैं: -

  • रेखीय बीजगणित
  • संभावना
  • मूल पथरी
  • समारोह की मैक्सिमा और मिनीमा
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.