मैं मशीन लर्निंग (कुछ आँकड़े भी) में एक नवागंतुक हूँ, कुछ समय के लिए ज्ञान (पर्यवेक्षित / अनपर्वलाइज्ड लर्निंग एल्गोरिदम, प्रासंगिक अनुकूलन पद्धतियाँ, नियमितीकरण, कुछ दर्शन (जैसे पूर्वाग्रह-विचरण व्यापार-बंद?)) सीख रहा हूँ। मुझे पता है कि किसी भी वास्तविक अभ्यास के बिना, मैं उन मशीन लर्निंग सामान की गहरी समझ हासिल नहीं कर सकता।
इसलिए मैं वास्तविक डेटा के साथ कुछ वर्गीकरण समस्या के साथ शुरू करता हूं, हस्तलिखित अंक वर्गीकरण (एमएनआईएसटी) कहता हूं। मेरे आश्चर्य के बिना, किसी भी सुविधा को सीखने / इंजीनियरिंग के बिना, इनपुट के रूप में कच्चे पिक्सेल मानों के साथ यादृच्छिक-वन क्लासिफ़ायर का उपयोग करके सटीकता 0.97 तक पहुंच जाती है। मैंने अन्य लर्निंग एल्गोरिदम की भी कोशिश की, जैसे एसवीएम, एलआर जैसे मापदंडों को ट्यून किया गया।
फिर मैं हार गया, क्या यह बहुत आसान होगा या मैं यहां कुछ भी याद कर रहा हूं? बस टूलकिट से एक सीखने के एल्गोरिथ्म को उठाएं और कुछ मापदंडों को ट्यून करें?
अगर यह सब अभ्यास में मशीन सीखने के बारे में होगा, तो मैं इस क्षेत्र में अपनी रुचि खो दूंगा। मैंने कुछ दिनों के लिए कुछ ब्लॉग सोचा और पढ़ा, और मैं कुछ निष्कर्षों पर आया:
व्यवहार में मशीन सीखने का सबसे महत्वपूर्ण हिस्सा फीचर इंजीनियरिंग है , जो डेटा को देखते हुए, सुविधाओं के बेहतर प्रतिनिधित्व का पता लगाता है।
कौन सा लर्निंग एल्गोरिदम का उपयोग करना भी महत्वपूर्ण है, पैरामीटर ट्यूनिंग भी, लेकिन अंतिम विकल्प प्रयोग के बारे में अधिक है।
मुझे यकीन नहीं है कि मैं इसे सही ढंग से समझता हूं, उम्मीद है कि कोई भी मुझे सही कर सकता है और मुझे अभ्यास में मशीन सीखने के बारे में कुछ सुझाव दे सकता है।