जैसा कि मैंने मशीन लर्निंग की खोज की है, मैं अलग-अलग दिलचस्प तकनीकों को देखता हूँ जैसे:
- स्वचालित रूप से इस तरह की तकनीकों के साथ एल्गोरिदम ट्यून
grid search
, - एक ही "प्रकार" के विभिन्न एल्गोरिदम के संयोजन के माध्यम से अधिक सटीक परिणाम प्राप्त करें, यही है
boosting
, - विभिन्न एल्गोरिदम के संयोजन के माध्यम से और अधिक सटीक परिणाम प्राप्त करें (लेकिन एक ही प्रकार के एल्गोरिदम नहीं), कि
stacking
, - और शायद बहुत अधिक मुझे अभी भी खोज करना है ...
मेरा प्रश्न निम्नलिखित है: वे सभी टुकड़े हैं। लेकिन क्या यह एक एल्गोरिथ्म बनाने के लिए उन्हें एक साथ रखना संभव है जो इनपुट क्लीन किए गए डेटा के रूप में लेता है और सभी तकनीकों से सबसे अच्छा निकालकर अच्छे परिणाम देता है? (बेशक यह शायद कम कुशल होगा कि एक पेशेवर डेटा वैज्ञानिक, लेकिन वह मुझसे बेहतर होगा!) यदि हाँ, तो आपके पास नमूना कोड हैं या क्या आप ऐसे फ्रेमवर्क जानते हैं जो ऐसा कर सकते हैं?
EDIT: कुछ जवाबों के बाद, ऐसा लगता है कि कुछ संकीर्ण करना है। आइए एक उदाहरण लेते हैं, हमारे पास एक डेटा है जिसमें श्रेणीबद्ध डेटा है, चलो इसे कॉल करते हैं y
और हम संख्यात्मक डेटा से इसकी भविष्यवाणी करना चाहते हैं X
जो या तो डमी या वास्तविक संख्यात्मक डेटा (ऊंचाई, तापमान) है। हम मानते हैं कि सफाई पहले से की गई है। क्या मौजूदा एल्गोरिथ्म हैं जो इस तरह के डेटा को ले सकते हैं और एक भविष्यवाणी का उत्पादन कर सकते हैं? (कई एल्गोरिदम का परीक्षण करके, उन्हें ट्यूनिंग, बूस्टिंग, आदि) यदि हाँ, तो क्या यह कम्प्यूटेशनल रूप से कुशल है (यदि हम सामान्य एल्गोरिथ्म की तुलना में एक उचित समय में गणना की गई है), और क्या आपके पास कोड का एक उदाहरण है?
auto.arima
( forecast
पुस्तकालय से) मनुष्यों से बेहतर हो सकता है - रोब हंडमैन ने अपनी प्रस्तुतियों में कई बार उल्लेख किया। तो ऐसे क्षेत्र हैं जहां सफलता के साथ "स्वचालित सीखने" के कुछ प्रकार लागू होते हैं।