डेटा विज्ञान में "विज्ञान" के बारे में किताबें? [बन्द है]


26

डेटा विज्ञान के पीछे विज्ञान और गणित के बारे में क्या किताबें हैं? ऐसा लगता है कि कई "डेटा साइंस" किताबें प्रोग्रामिंग ट्यूटोरियल हैं और डेटा जनरेट करने की प्रक्रिया और सांख्यिकीय निष्कर्ष जैसी चीजों को नहीं छूती हैं। मैं पहले से ही कोड कर सकता हूं, जो मैं कमजोर हूं, वह गणित / आंकड़े / सिद्धांत के पीछे है जो मैं कर रहा हूं।

अगर मैं किताबों पर $ 1000 जलाने के लिए तैयार हूं (तो लगभग 10 किताबें ... आह), तो मैं क्या खरीद सकता हूं?

उदाहरण: अगेती के श्रेणीबद्ध डेटा विश्लेषण , रेखीय मिश्रित अनुदैर्ध्य डेटा के लिए मिश्रित मॉडल , आदि ... आदि ...


"अच्छी" किताबों के बारे में पूछना राय-आधारित उत्तरों को आकर्षित करेगा और इसलिए यह ऑफ-टॉपिक है। चिह्नित किया गया।
स्पेन्डमैन

3
मैंने इसे बदल दिया है इसलिए मैं सिर्फ किताबें ढूंढ रहा हूं। राय-आधारित कुछ भी नहीं।
एंटोन

यह सांख्यिकी वर्तनी है :) कुछ व्यावहारिक के साथ रहना जो अनुमान के बजाय भविष्यवाणी पर केंद्रित है। सांख्यिकीय शिक्षण के दोनों तत्व और सांख्यिकीय शिक्षा का एक परिचय अधिकांश लोगों की सूची में हैं।
डिर्क एडल्डबुलेटेल

मैं अभी तक एक टिप्पणी नहीं जोड़ सकता, लेकिन सिर्फ FYI ESL एक पीडीएफ के रूप में मुफ्त ऑनलाइन के लिए उपलब्ध है
idclark

1
मुझे लगता है कि इस प्रश्न को सामुदायिक विकि के रूप में चिह्नित किया जाना चाहिए।
शगुन सोढानी

जवाबों:


21

परिचयात्मक:

गहरा खोदना:

कुछ विशेष रुचि उदाहरण:

मशीन लर्निंग पर व्यापक संदर्भ काम करता है (वास्तव में आपने जो पूछा, लेकिन पूर्णता के लिए नहीं):

बोनस पेपर:


2
बोनस पेपर के लिए +1। महान पढ़ें
सैंटियागो सिफस

13

अगर मैं केवल एक आप को पुनः प्राप्त कर सकता हूं, तो यह होगा: द एलीमेंट्स ऑफ स्टैटिस्टिकल लर्निंग एंड प्रेडिक्शन बाय हस्ती, टिबशिरानी और फ्रीडमैन। यह डेटा विज्ञान में आमतौर पर उपयोग की जाने वाली तकनीकों के पीछे गणित / आंकड़े प्रदान करता है।

बेयसियन तकनीकों के लिए, गेलमैन, कारलिन, स्टर्न, डूनसन, वेक्टसारी और रुबिन द्वारा बायेसियन डेटा विश्लेषण उत्कृष्ट है।

Casella और Berger द्वारा सांख्यिकीय निष्कर्ष आंकड़ों की सैद्धांतिक नींव पर एक अच्छा स्नातक स्तर की पाठ्यपुस्तक है। इस पुस्तक में गणित के साथ एक उच्च स्तर के आराम की आवश्यकता होती है (संभावना सिद्धांत माप सिद्धांत पर आधारित है, जो समझने में मामूली नहीं है)।

डेटा जनरेट करने की प्रक्रियाओं के संबंध में, मेरे पास एक पुस्तक के लिए सिफारिश नहीं है। मैं क्या कह सकता हूं कि इस्तेमाल की गई तकनीकों की मान्यताओं की एक अच्छी समझ और यह सुनिश्चित करना कि डेटा एकत्र किया गया था या इस तरीके से उत्पन्न किया गया था कि उन मान्यताओं का उल्लंघन नहीं करता है, एक अच्छे विश्लेषण की दिशा में एक लंबा रास्ता तय करता है।


7

अन्य उत्तरों ने डेटा विज्ञान के पीछे गणित के बारे में पुस्तकों के अच्छे सेट की सिफारिश की। लेकिन जैसा कि आपने उल्लेख किया है, न कि केवल गणित और डेटा संग्रह जैसी गतिविधियों और डेटा से निष्कर्ष के अपने नियम और सिद्धांत हैं, भले ही गणितीय पृष्ठभूमि (अभी तक) के रूप में कठोर नहीं हो।

शोध के कुछ हिस्सों के लिए, मैं सुझाव देता हूं कि सुंदर डेटा: द स्टोरीज बिहाइंड एलिगेंट डेटा सॉल्यूशंस जिसमें बीस केस-स्टडी शामिल हैं, जैसे लोगों द्वारा लिखित अध्याय वास्तव में वास्तविक विश्व डेटा विश्लेषण समस्याओं से जुड़े हैं। इसमें कोई गणित नहीं है, लेकिन डेटा एकत्र करने, विश्लेषण, स्केलिंग में डेटा का उपयोग करने के व्यावहारिक तरीके खोजने और सबसे अच्छे समाधानों का चयन करने जैसे क्षेत्रों की पड़ताल करता है।

एक और वास्तव में दिलचस्प पुस्तक है थिंकिंग विद डेटा: इनसाइट्स को कैसे चालू करना है , जो तकनीकी (= प्रोग्रामिंग ट्यूटोरियल) नहीं है, लेकिन महत्वपूर्ण विषयों को कवर करता है कि वास्तव में निर्णय लेने और वास्तविक दुनिया की समस्याओं में डेटा विज्ञान शक्ति का उपयोग कैसे करें।


7

मुझे अमीर अली अकबरी के सुझाव पसंद हैं, और मैं अपने खुद के कुछ जोड़ूंगा, उन विषयों और कौशलों पर ध्यान केंद्रित करूँगा जो गणित और / या प्रोग्रामिंग पर केंद्रित अधिकांश मशीन लर्निंग और डेटा विश्लेषण पुस्तकों में पर्याप्त रूप से शामिल नहीं हैं।

डेटा सफाई:

बायेसियन डेटा विश्लेषण (फिशर-स्टाइल नल हाइपोथीसिस महत्व परीक्षण के लिए वैकल्पिक):

अनिश्चितता, अपूर्णता, विरोधाभासों, अस्पष्टता, अपवित्रता, अज्ञानता आदि का सामना करना पड़ता है ।:

प्रयोग:

सिमुलेशन:

विशेषज्ञ की योग्यता, संभाव्यता का अनुमान:

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.