(बहुत) लघु कथा
लंबी कहानी, कुछ अर्थों में, आंकड़े किसी भी अन्य तकनीकी क्षेत्र की तरह हैं: कोई फास्ट ट्रैक नहीं है ।
लम्बी कहानी
आंकड़ों में स्नातक की डिग्री कार्यक्रम अमेरिका में अपेक्षाकृत दुर्लभ हैं एक कारण मुझे लगता है कि यह सच है कि यह बहुत मुश्किल है कि सभी को एक स्नातक पाठ्यक्रम में अच्छी तरह से आँकड़े सीखना आवश्यक है। यह उन विश्वविद्यालयों में विशेष रूप से सच है जिनकी सामान्य शिक्षा की महत्वपूर्ण आवश्यकताएं हैं।
आवश्यक कौशल (गणितीय, कम्प्यूटेशनल और सहज) विकसित करना बहुत प्रयास और समय लेता है। छात्र को पथरी और रैखिक और मैट्रिक्स बीजगणित की एक सभ्य मात्रा में महारत हासिल करने के बाद सांख्यिकी को काफी सभ्य "परिचालन" स्तर पर समझा जा सकता है। हालांकि, किसी भी लागू सांख्यिकीविद् को पता है कि अपने आप को क्षेत्र में ढूंढना काफी आसान है जो आंकड़ों के लिए कुकी-कटर या नुस्खा-आधारित दृष्टिकोण के अनुरूप नहीं है। वास्तव में यह समझने के लिए कि सतह के नीचे क्या चल रहा है, एक शर्त के रूप में आवश्यक हैगणितीय और, आज की दुनिया में, कम्प्यूटेशनल परिपक्वता जो केवल स्नातक प्रशिक्षण के बाद के वर्षों में वास्तव में प्राप्य हैं। यह एक कारण है कि सच्चा सांख्यिकीय प्रशिक्षण ज्यादातर यूएस (भारत में) एमएस स्तर पर शुरू होता है, उनके समर्पित ISI के साथ एक अलग कहानी है। कुछ इसी तरह का तर्क कुछ कनाडाई-आधारित शिक्षा के लिए बनाया जा सकता है। मैं इससे काफी परिचित नहीं हूं। यूरोपीय-आधारित या रूसी-आधारित स्नातक सांख्यिकी शिक्षा एक सूचित राय है।)
लगभग किसी भी (दिलचस्प) नौकरी के लिए एमएस स्तर की शिक्षा की आवश्यकता होती है और वास्तव में दिलचस्प (मेरी राय में) नौकरियों में अनिवार्य रूप से डॉक्टरेट स्तर की शिक्षा की आवश्यकता होती है।
यह देखते हुए कि आपके पास गणित में डॉक्टरेट है, हालांकि हम नहीं जानते कि किस क्षेत्र में हैं, यहाँ एमएस-स्तरीय शिक्षा के करीब कुछ के लिए मेरे सुझाव हैं। विकल्पों को समझाने के लिए मैं कुछ पैतृक टिप्पणियों को शामिल करता हूं।
- डी। हफ, कैसे सांख्यिकी के साथ झूठ । (बहुत जल्दी, आसानी से पढ़ा जा सकता है। विशेष रूप से आम आदमी को आंकड़े पेश करने में, कई वैचारिक विचारों और नुकसानों को दिखाता है।)
- मूड, ग्रेबिल, और बोयस, थ्योरी ऑफ़ स्टेटिस्टिक्स , 3 डी एड।, 1974 का परिचय। (एमएस-लेवल इंट्रो टू थ्योरिटिकल स्टैटिस्टिक्स। आप एक शास्त्रीय, अक्सरवादी रूपरेखा में नमूना वितरण, बिंदु अनुमान और परिकल्पना परीक्षण के बारे में जानेंगे।) राय है कि यह आम तौर पर बेहतर है, और आधुनिक समकक्षों की तुलना में थोड़ा अधिक उन्नत है, जैसे कि कैसेला और बर्गर या चावल।)
- सेबर एंड ली, रैखिक प्रतिगमन विश्लेषण , दूसरा संस्करण। (रेखीय मॉडल के लिए बिंदु अनुमान और परिकल्पना परीक्षण के पीछे सिद्धांत देता है, जो लागू आंकड़ों में समझने के लिए संभवतः सबसे महत्वपूर्ण विषय है। चूंकि आपके पास शायद एक अच्छा रैखिक बीजगणित पृष्ठभूमि है, आपको तुरंत समझने में सक्षम होना चाहिए कि भौगोलिक रूप से क्या हो रहा है। , जो बहुत अधिक अंतर्ज्ञान प्रदान करता है। इसके अलावा मॉडल चयन में मूल्यांकन के मुद्दों से संबंधित अच्छी जानकारी, मान्यताओं से प्रस्थान, भविष्यवाणी और रैखिक मॉडल के मजबूत संस्करण हैं।)
- हेस्टी, तिब्शीरानी, और फ्रीडमैन, एलिमेंट्स ऑफ़ स्टैटिस्टिकल लर्निंग , 2 डी एड।, 2009। (इस पुस्तक में अंतिम और मोटे तौर पर आधुनिक मशीन-लर्निंग विषयों की तुलना में बहुत अधिक लागू भावना है। यहां सांख्यिकीय योगदान प्रदान करने में प्रमुख योगदान है। कई मशीन-सीखने के विचार, जो विशेष रूप से ऐसे मॉडलों में अनिश्चितता की मात्रा का भुगतान करता है। यह कुछ ऐसा है जो ठेठ मशीन-सीखने की किताबों में संयुक्त राष्ट्र (डेर) को जाता है। कानूनी तौर पर यहां मुफ्त में उपलब्ध है ।)
- ए। अग्रेती, श्रेणीबद्ध डेटा विश्लेषण , दूसरा संस्करण। (सांख्यिकीय ढांचे में असतत डेटा से निपटने के तरीके की अच्छी प्रस्तुति। अच्छा सिद्धांत और अच्छे व्यावहारिक उदाहरण। शायद कुछ मामलों में पारंपरिक पक्ष पर।)
- बॉयड और वैंडेनबर्ग, उत्तल अनुकूलन । (सबसे लोकप्रिय आधुनिक सांख्यिकीय अनुमान और परिकल्पना-परीक्षण समस्याओं में से कई को उत्तल अनुकूलन समस्याओं के रूप में तैयार किया जा सकता है। यह कई मशीन-सीखने की तकनीक के लिए भी जाता है, उदाहरण के लिए, SVMs। व्यापक समझ और उत्तल कार्यक्रमों के रूप में इस तरह की पहचान करने की क्षमता। काफी मूल्यवान है, मुझे लगता है। कानूनी रूप से यहाँ मुफ्त में उपलब्ध है ।)
- एफ्रॉन एंड टिबशिरानी, एन इंट्रोडक्शन टू द बूटस्ट्रैप । (आप कम से कम बूटस्ट्रैप और संबंधित तकनीकों से परिचित होना चाहिए। एक पाठ्यपुस्तक के लिए, यह एक त्वरित और आसान पढ़ा है।)
- जे। लिउ, मोंटे कार्लो स्ट्रेटेजिज इन साइंटिफिक कंप्यूटिंग या पी। ग्लासमैन, मोंटे कार्लो मेथड्स इन फाइनेंशियल इंजीनियरिंग । (उत्तरार्द्ध एक विशेष अनुप्रयोग क्षेत्र के लिए बहुत ही निर्देशित लगता है, लेकिन मुझे लगता है कि यह सभी महत्वपूर्ण तकनीकों का एक अच्छा अवलोकन और व्यावहारिक उदाहरण देगा। वित्तीय इंजीनियरिंग अनुप्रयोगों ने पिछले एक या कई दशकों में मोंटे कार्लो अनुसंधान की एक उचित मात्रा को प्रेरित किया है। ।)
- ई। टफ्टे, मात्रात्मक सूचना का दृश्य प्रदर्शन । (आंकड़ों का अच्छा दृश्य और प्रस्तुतीकरण [अत्यधिक] सांख्यिकीविदों द्वारा भी रेखांकित किया गया है।)
- जे। टकी, खोजपूर्ण डेटा विश्लेषण । (मानक। ओल्डी, लेकिन गुडी। कुछ पुरानी कह सकते हैं, लेकिन फिर भी देखने लायक है।)
पूरक
यहाँ कुछ अन्य पुस्तकें हैं, जिनमें से कुछ अधिक उन्नत, सैद्धांतिक और / या सहायक प्रकृति की हैं, जो सहायक हैं।
- एफए ग्रेबिल, सिद्धांत और रैखिक मॉडल का अनुप्रयोग । (पुराने जमाने, भयानक टाइपसेटिंग, लेकिन सभी सेबर एंड ली के एक ही मैदान को शामिल किया गया है, और अधिक। मैं पुराने जमाने का कहना है क्योंकि अधिक आधुनिक उपचार शायद बहुत सारी तकनीकों और प्रमाणों को एकजुट करने और सरल बनाने के लिए एसवीडी का उपयोग करेंगे।)
- एफए ग्रेबिल, सांख्यिकी में एप्लिकेशन के साथ मैट्रिस । (ऊपर दिए गए साथी पाठ। अच्छे मैट्रिक्स बीजगणित के धन से यहां के आंकड़े उपयोगी होते हैं। महान डेस्क संदर्भ।)
- Devroye, Gyorfi, और Lugosi, पैटर्न की पहचान का एक संभाव्य सिद्धांत । (वर्गीकरण समस्याओं में प्रदर्शन को निर्धारित करने पर कठोर और सैद्धांतिक पाठ।)
- ब्रॉकवेल और डेविस, टाइम सीरीज़: थ्योरी एंड मेथड्स । (शास्त्रीय समय-श्रृंखला विश्लेषण। सैद्धांतिक उपचार। अधिक लागू लोगों के लिए, बॉक्स, जेनकिंस और रिंसल या रूई त्से के ग्रंथ सभ्य हैं।)
- मोटवानी और राघवन, रैंडमाइज्ड एल्गोरिदम । (कम्प्यूटेशनल एल्गोरिदम के लिए संभाव्य तरीके और विश्लेषण।)
- डी। विलियम्स, प्रोबेबिलिटी और मार्टिंगलेस और / या आर। ड्यूरेट, प्रायिकता: सिद्धांत और उदाहरण । (यदि आपने डीएल कोहन के स्तर पर माप सिद्धांत को देखा है, तो कहें, लेकिन शायद संभावना सिद्धांत नहीं है। यदि आप पहले से ही माप सिद्धांत जानते हैं तो गति प्राप्त करने के लिए दोनों अच्छे हैं।)
- एफ। हरेल, रिग्रेशन मॉडलिंग रणनीतियाँ । ( सांख्यिकीय लर्निंग [ईएसएल] के तत्वों के रूप में अच्छा नहीं है , लेकिन एक अलग, और दिलचस्प है, चीजों को ले लो। निश्चित रूप से ईएसएल करता है और "के बारे में जानने के लायक है, की तुलना में अधिक" पारंपरिक "लागू सांख्यिकी विषयों को शामिल करता है।"
अधिक उन्नत (डॉक्टरेट-स्तर) ग्रंथ
लेहमन और कैसला, प्वाइंट अनुमान का सिद्धांत । (बिंदु आकलन का पीएचडी-स्तरीय उपचार। इस पुस्तक की चुनौती का एक हिस्सा इसे पढ़ रहा है और यह पता लगा रहा है कि टाइपो क्या है और क्या नहीं है। जब आप खुद को जल्दी से पहचानते हुए देखते हैं, तो आपको पता चलेगा कि आप बहुत अभ्यास कर रहे हैं। इस प्रकार के वहाँ, खासकर यदि आप समस्याओं में गोता लगाएँ।)
लेहमैन और रोमानो, सांख्यिकीय परिकल्पना का परीक्षण । (परिकल्पना परीक्षण के पीएचडी-स्तरीय उपचार। ऊपर TPE के रूप में कई टाइपोस नहीं।)
ए वैन डेर वार्ट, एसिम्प्टोटिक सांख्यिकी । (आवेदन क्षेत्रों पर अच्छे संकेत के साथ आंकड़ों के स्पर्शोन्मुख सिद्धांत पर एक सुंदर किताब। हालांकि एक लागू किताब नहीं है। मेरी केवल प्रश्न यह है कि कुछ बल्कि विचित्र संकेतन का उपयोग किया जाता है और विवरण गलीचा के नीचे कई बार ब्रश किया जाता है।)