मैं आपके प्रश्न से यह नहीं बता सकता कि आप गणित में कितने निपुण हैं या आपकी पढ़ाई कहाँ रुकती है। मुझे लगता है कि जब से आप एक कंप्यूटर सॉफ्टवेयर इंजीनियर हैं जो आप बीजगणित, ज्यामिति और शायद कुछ पथरी से परिचित हैं।
मेरा सुझाव है कि आप विवरणों, खोजपूर्ण डेटा विश्लेषण, सहसंबंध, वितरण और जैसी अवधारणाओं को समझने और आँकड़ों को पढ़कर अपनी पढ़ाई शुरू करें। मैं देखता हूं कि आप वीडियो के बजाय किताबें पसंद करते हैं, इसलिए मैं आपको आधे रास्ते से मिलूंगा और आपको कुछ ऐसी किताबें उपलब्ध कराऊंगा जो ऑनलाइन हैं, साथ ही एक किताब या दो जिसे आप प्रिंट में खरीद सकते हैं।
पहले, मैं आंकड़ों में पेन स्टेट के ऑनलाइन स्नातक पाठ्यक्रम का सुझाव दूंगा । आप बाईं ओर मेनू का उपयोग करके उनके प्रत्येक पाठ्यक्रम का पता लगा सकते हैं। एक बार जब आप एक कोर्स का चयन करते हैं, तो पाठ्यक्रम के वेबपेज पर स्क्रॉल करें और उस लिंक पर क्लिक करें, जो "ऑनलाइन कोर्स नोट्स" पढ़ता है। इन पाठ्यक्रमों के लिए पाठ्यक्रम नोट्स नोट्स की तुलना में बहुत अधिक हैं और पूर्ण पुस्तकों की तरह पढ़े जाते हैं। वे बहुत शिक्षाप्रद हैं। इसके अलावा, आंकड़ों में पेन स्टेट के ऑनलाइन अंडरग्रेजुएट कोर्स के पाठ्यक्रम की भी जाँच करें, अगर आपको ग्रेजुएट कोर्सवर्क में ऐसा कुछ मिलता है जो बहुत उन्नत है और "सरल" स्पष्टीकरण चाहते हैं।
दूसरा, जॉन एच। मैकडॉनल्ड द्वारा जैविक सांख्यिकी की पुस्तिका की समीक्षा करें । शीर्षक को मूर्ख मत बनने दो; यह पुस्तक सांख्यिकी और डेटा विश्लेषण पर एक उत्कृष्ट प्राइमर है जो किसी भी डोमेन पर लागू होती है।
तीसरा, जेरार्ड डलाल की सांख्यिकी की छोटी पुस्तिका की समीक्षा करें । फिर, शीर्षक को मूर्ख मत बनने दो; यह पुस्तक एक और रत्न है जो आपको कुछ महत्वपूर्ण सांख्यिकी मूल सिद्धांतों के माध्यम से चलता है।
चौथा, एलन डाउनी की पुस्तक थिंक स्टैट्स की जाँच करें । पहले के संस्करण का एक मुफ़्त संस्करण ऑनलाइन है; सबसे हाल का संस्करण आपको खरीदना होगा। यह इसके लायक है, खासकर यदि आप पायथन में काम करते हैं। इस पुस्तक में, लेखक आपको वास्तविक दुनिया (खिलौना) डेटासेट का विश्लेषण करने के लिए पायथन का उपयोग करके आँकड़े और डेटा विश्लेषण सिखाता है। यह काम करने के लिए एक बहुत अच्छी किताब है।
अंत में, जोएल ग्रूस द्वारा स्क्रैच से डेटा साइंस की जाँच करें । यह पुस्तक डेटा विश्लेषण (सांख्यिकी मूल सिद्धांतों के बजाय) पर अधिक ध्यान केंद्रित करती है और मशीन सीखने और मॉडलिंग पर अधिक जोर देती है। यह वास्तविक दुनिया (खिलौना) डेटासेट पर भविष्य कहनेवाला विश्लेषण का विश्लेषण और संचालन के माध्यम से चलने के लिए पायथन (और पायथन डेटा साइंस स्टैक) का उपयोग करता है। के माध्यम से काम करने के लिए एक और महान पुस्तक।