मुझे नहीं लगता कि मैं डेटा विश्लेषण जारी रखने के लिए नियमित समय निवेश दे पाऊंगा
मुझे नहीं लगता कि कैसला और बर्जर डेटा विश्लेषण के तरीके से डेटा सीखने के लिए एक जगह है । यह सांख्यिकीय सिद्धांत के कुछ उपकरण सीखने के लिए एक जगह है।
मेरा अब तक का अनुभव मुझे एक सांख्यिकीविद् बनने के लिए कह रहा है जिसमें विभिन्न वितरण (वेइबुल, कॉची, टी, एफ ...) को शामिल करने के लिए बहुत थकाऊ गणना के साथ सहन करने की आवश्यकता है।
मैंने डेटा विश्लेषण करने वाले सांख्यिकीविद् के रूप में बहुत समय बिताया है। यह शायद ही कभी (लगभग कभी नहीं) मुझे थकाऊ गणना कर रहा है। इसमें कभी-कभी थोड़ा सरल बीजगणित शामिल होता है, लेकिन आम समस्याएं आम तौर पर हल हो जाती हैं और मुझे प्रत्येक बार दोहराने पर किसी भी प्रयास को खर्च करने की आवश्यकता नहीं है।
कंप्यूटर सभी थकाऊ गणना करता है।
यदि मैं ऐसी स्थिति में हूं जहां मैं एक मानक मानक मामले (जैसे GLM का उपयोग करने के लिए तैयार नहीं) को मानने के लिए तैयार नहीं हूं, तो मेरे पास आम तौर पर किसी भी अन्य वितरण को मानने के लिए पर्याप्त जानकारी नहीं है, इसलिए गणना में सवाल एलआरटी आमतौर पर मूट होता है (जब मुझे ज़रूरत हो तो मैं उन्हें कर सकता हूं, वे या तो पहले से ही हल हो जाते हैं या इतनी मुश्किल से आते हैं कि यह एक दिलचस्प मोड़ है)।
मैं बहुत अधिक अनुकरण करता हूं; मैं भी अक्सर किसी न किसी रूप में या पैरामीट्रिक मान्यताओं के स्थान पर रेज़मैपलिंग का उपयोग करने का प्रयास करता हूं।
क्या मुझे उस पर प्रति सप्ताह 20hr + प्रति सप्ताह खर्च करने की आवश्यकता होगी जैसे मैं हुआ करता था?
यह इस बात पर निर्भर करता है कि आप क्या करना चाहते हैं और कितनी जल्दी आप इसे प्राप्त करना चाहते हैं।
डेटा विश्लेषण एक कौशल है, और यह अभ्यास और ज्ञान का एक बड़ा आधार लेता है। आपको पहले से ही आवश्यक कुछ ज्ञान होगा।
यदि आप विभिन्न प्रकार की चीजों में एक अच्छे चिकित्सक बनना चाहते हैं, तो इसमें बहुत समय लगेगा - लेकिन मेरे दिमाग में यह बीजगणित और कैसला और बर्जर अभ्यास करने की तुलना में बहुत अधिक मजेदार है।
प्रतिगमन समस्याओं के बारे में मैंने जो कुछ कौशल बनाए हैं, वे समय श्रृंखला के साथ सहायक हैं, कहते हैं - लेकिन बहुत से नए कौशल की आवश्यकता होती है। इसलिए अवशिष्ट भूखंडों और QQ भूखंडों की व्याख्या करना सीखना आसान है, लेकिन वे मुझे यह नहीं बताते हैं कि मुझे PACF भूखंड में थोड़ी सी टक्कर के बारे में कितना चिंतित होना चाहिए और मुझे एक-कदम-आगे की भविष्यवाणी के उपयोग जैसे उपकरण नहीं देना चाहिए त्रुटियों।
इसलिए, उदाहरण के लिए, मुझे यह पता लगाने के लिए प्रयास करने की आवश्यकता नहीं है कि ठेठ गामा या वेइबुल मॉडल के लिए विधिवत एमएल कैसे करें , क्योंकि वे मानक हल करने के लिए पर्याप्त हैं जो समस्याओं को पहले से ही एक सुविधाजनक रूप में डाल दिया गया है।
यदि आप शोध करने के लिए आते हैं , तो आपको बहुत सारे कौशल की आवश्यकता होगी जो आप कैसला और बर्जर जैसी जगहों पर उठाते हैं (लेकिन इस तरह के कौशल के साथ, आपको एक से अधिक पुस्तक भी पढ़नी चाहिए)।
कुछ सुझाई गई बातें:
आपको निश्चित रूप से कुछ प्रतिगमन कौशल का निर्माण करना चाहिए, भले ही आप कुछ और न करें।
काफी अच्छी किताबें हैं, लेकिन शायद ड्रेपर एंड स्मिथ एप्लाइड रिग्रेशन एनालिसिस प्लस फॉक्स और वीसबर्ग एन आर कंपैनियन टू एप्लाइड रिग्रेशन ; मेरा सुझाव है कि आप हरेल के प्रतिगमन मॉडलिंग रणनीतियों के साथ विचार करें
(आप ड्रेपर और स्मिथ के लिए कितनी भी अच्छी किताबों को स्थानापन्न कर सकते हैं - एक या दो जो आपको सूट करते हों।)
दूसरी पुस्तक में कई ऑनलाइन अतिरिक्त अध्याय हैं जो पढ़ने में बहुत अधिक योग्य हैं (और इसका अपना आर-पैकेज)
-
एक अच्छा दूसरा सर्विंग वेनेबल्स और रिप्ले का एस के साथ मॉडर्न एप्लाइड स्टैटिस्टिक्स होगा ।
यह विचारों के एक व्यापक व्यापक आधार में कुछ आधार है।
यह पता चल सकता है कि आपको कुछ विषयों में कुछ और बुनियादी सामग्री की आवश्यकता है (मुझे आपकी पृष्ठभूमि नहीं पता है)।
फिर आपको यह सोचना शुरू करना होगा कि आपको किन क्षेत्रों के आंकड़े चाहिए / जरूरत है - बायेसियन आँकड़े, समय श्रृंखला, बहुभिन्नरूपी विश्लेषण, आदि।