अभी हाल ही में खुद को सिखाना शुरू किया मशीन लर्निंग और डेटा एनालिसिस मैं खुद को डेटा के बड़े सेट बनाने और क्वेरी करने के लिए एक ईंट की दीवार पर मार रहा हूं। मैं अपने पेशेवर और व्यक्तिगत जीवन में डेटा एकत्र करना चाहूंगा और उसका विश्लेषण करूंगा लेकिन मैं निम्नलिखित करने के लिए सबसे अच्छे तरीके से अनिश्चित हूं।
मुझे यह डेटा कैसे संग्रहीत करना चाहिए? एक्सेल? एसक्यूएल? ??
इस डेटा का विश्लेषण करने के लिए शुरुआत करने वाले के लिए एक अच्छा तरीका क्या है? मैं एक पेशेवर कंप्यूटर प्रोग्रामर हूं इसलिए जटिलताएं प्रोग्राम लिखने में नहीं है लेकिन डेटा विश्लेषण के क्षेत्र में कम या ज्यादा विशिष्ट हैं।
संपादित करें: मेरी अस्पष्टता के लिए क्षमा याचना, जब आप पहली बार कुछ के बारे में सीखना शुरू करते हैं तो यह जानना मुश्किल होता है कि आप क्या नहीं जानते, फिर जानते हैं? ;)
यह कहने के बाद, मेरा उद्देश्य इसे दो मुख्य विषयों पर लागू करना है:
सॉफ्टवेयर टीम मेट्रिक्स (सोचते हैं कि फुर्तीला वेग, जोखिम की मात्रा निर्धारित करना, सफलतापूर्वक पूर्ण किए गए पुनरावृत्ति की संभावना, कहानी के अंकों की x संख्या दी गई है)
मशीन लर्निंग (पूर्व प्रणाली अपवाद मॉड्यूल के दिए गए सेट में हुए हैं, क्या संभावना है कि एक मॉड्यूल क्षेत्र में एक अपवाद फेंक देगा, उस लागत में कितना होगा, डेटा मुझे बताएगा कि सुधार करने के लिए महत्वपूर्ण मॉड्यूल के बारे में क्या बताएगा मेरे हिरन के लिए सबसे अच्छा धमाका है, भविष्यवाणी करें कि उपयोगकर्ता डेटा लोड करने के लिए सिस्टम का कौन सा भाग आगे उपयोग करना चाहेगा, आदि)।