संदर्भ अनुरोध: कार्यशील डेटा वैज्ञानिकों के लिए शास्त्रीय आंकड़े


10

मैं प्रतिगमन में ठोस अनुभव, अन्य मशीन लर्निंग टाइप एल्गोरिदम, और प्रोग्रामिंग (डेटा विश्लेषण और सामान्य सॉफ़्टवेयर विकास दोनों के लिए) के साथ काम करने वाला वैज्ञानिक हूं। मेरा अधिकांश कामकाजी जीवन भविष्यवाणिय सटीकता (विभिन्न व्यावसायिक बाधाओं के तहत काम करना) के लिए मॉडल निर्माण पर केंद्रित रहा है, और अपने स्वयं के (और अन्य) कार्यों का समर्थन करने के लिए डेटा पाइपलाइनों का निर्माण कर रहा है।

मेरे पास सांख्यिकी में कोई औपचारिक प्रशिक्षण नहीं है, मेरी विश्वविद्यालय शिक्षा शुद्ध गणित पर केंद्रित है। जैसे कि कई शास्त्रीय विषयों, विशेष रूप से विभिन्न लोकप्रिय परिकल्पना परीक्षणों और संभावित तकनीकों के बारे में जानने से चूक गए हैं।

क्या इन विषयों के लिए कोई संदर्भ हैं जो मेरी पृष्ठभूमि और अनुभव के स्तर वाले किसी व्यक्ति के लिए उपयुक्त होंगे? मैं गणितीय कठोरता को संभाल (और सराहना) सकता हूं, और एल्गोरिथम के दृष्टिकोण का भी आनंद ले सकता हूं। मैं उन संदर्भों को पसंद करता हूं जो पाठक को निर्देशित अभ्यास प्रदान करते हैं, दोनों (या तो) एक गणितीय और (या) प्रोग्रामिंग फ़ोकस।


2
गणित की पृष्ठभूमि से एक और मैट के रूप में, आंकड़ों के अंतर से भरे ज्ञान के साथ, मैं संबंधित कर सकता हूं! क्या आपकी रुचि के कोई विशेष क्षेत्र / अनुप्रयोग हैं? शास्त्रीय आंकड़ों के साथ देखने वाली एक बात यह है कि मान्यताओं का उपयोग किया जाता है।
जियोमैट

5
यहाँ कुछ अच्छे संदर्भ हैं: mathoverflow.net/questions/31655/statistics-for-mathematicians
एलेक्स आर।

जवाबों:


3

लैरी वासरमैन के सभी सांख्यिकी गणितीय आंकड़ों के बवंडर दौरे के लिए एक अच्छी किताब है। यह गणितीय आंकड़ों पर पहली पुस्तक थी जिसका मैंने खुद इस्तेमाल किया। इसमें परिकल्पना परीक्षण और अधिकतम संभावना अनुमान जैसे क्लासिक्स शामिल हैं, लेकिन इसमें हाल ही में विकसित और समान रूप से महत्वपूर्ण विषय जैसे बूटस्ट्रैपिंग के बहुत सारे कवरेज हैं। वेसमैन के पास हमेशा एक पैर सांख्यिकी में और दूसरा पैर मशीन लर्निंग में होता है, जो मुझे लगता है कि सभी समकालीन डेटा विश्लेषकों को करना चाहिए; यदि आप केवल दो में से एक क्षेत्र से परिचित हैं, तो आपको बहुत कुछ याद आ रहा है। साथ ही, पुस्तक में बहुत सारे अच्छे व्यायाम हैं।

यदि आपके पास वास्तविक विश्लेषण में एक पृष्ठभूमि है और आप कच्चे, बिना पके हुए सामान चाहते हैं, तो मेरा मतलब है कि संभाव्यता और आंकड़ों का एक उपाय-सिद्धांत संबंधी उपचार, मार्क जे स्कर्विश की थ्योरी ऑफ़ स्टैटिस्टिक्स आज़माएं । शेरविश डेग्रोट और स्कर्विश का आधा हिस्सा है, जिसकी कम तकनीकी पुस्तक प्रोबेबिलिटी एंड स्टैटिस्टिक्स शायद आज गणितीय विषयों पर सबसे लोकप्रिय पुस्तक है। सांख्यिकी का सिद्धांत आमतौर पर स्नातक छात्रों के लिए आरक्षित एक विषय के लिए एक उपयोगी बात पुस्तक है, जो सभी काम खुद करने के लिए माना जाता है। काफी ईमानदार होने के लिए, मुझे यह पुस्तक बहुत कठिन लगी (हालाँकि यह जू शाओ के गणितीय सांख्यिकी के समान कठिन नहीं है) और अंततः मास्टर डेटा के लिए आवश्यक अपार प्रयास को महसूस करने के लिए आया, यह एक लागू डेटा विश्लेषक के रूप में मेरे समय का अच्छा उपयोग नहीं था। लेकिन मैंने अभी भी बहुत कुछ सीखा है और इस सिद्धांत की अच्छी समझ के साथ आया है कि माप सिद्धांत क्या है और इसका उपयोग बालों के सैद्धांतिक कठिनाइयों को साफ करने के लिए कैसे किया जा सकता है जो संभाव्यता सिद्धांत के लिए अधिक भोले पारंपरिक दृष्टिकोण में उत्पन्न होते हैं। मैं भी आदान-प्रदान और स्वतंत्रता की समानता और अंतर की सराहना करने के लिए बेहतर आया।


2

कोडियोलॉजिस्ट के बहुत अच्छे सुझावों (+1) के साथ-साथ मैं अवलोकन अध्ययन के विषय को भी देखने की सलाह दूंगा । मुझे लगता है कि यह इस तथ्य के बावजूद डेटा-वैज्ञानिकों के बीच बहुत अप्राप्य क्षेत्र है कि कई मामलों में विश्लेषण किए गए डेटा अवलोकन प्रकृति के हैं। मुझे लगता है कि यह इसलिए है क्योंकि ग्रंथ सूची (विशेष रूप से बायोस्टैटिस्टिक्स) के थोक कम से कम कुछ अर्ध-प्रयोगात्मक डिजाइन पहले से ही मान रहे हैं। पॉल रोसेनबाम की किताबें ऑब्जर्वेशनल स्टडीज और डिजाइन ऑफ ऑब्जर्वेशनल स्टडीज कुछ सबसे अधिक इस्तेमाल किए जाने वाले संदर्भ हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.