क्या स्वचालित मशीन एक सपना सीख रही है?


12

जैसा कि मैंने मशीन लर्निंग की खोज की है, मैं अलग-अलग दिलचस्प तकनीकों को देखता हूँ जैसे:

  • स्वचालित रूप से इस तरह की तकनीकों के साथ एल्गोरिदम ट्यून grid search,
  • एक ही "प्रकार" के विभिन्न एल्गोरिदम के संयोजन के माध्यम से अधिक सटीक परिणाम प्राप्त करें, यही है boosting,
  • विभिन्न एल्गोरिदम के संयोजन के माध्यम से और अधिक सटीक परिणाम प्राप्त करें (लेकिन एक ही प्रकार के एल्गोरिदम नहीं), कि stacking,
  • और शायद बहुत अधिक मुझे अभी भी खोज करना है ...

मेरा प्रश्न निम्नलिखित है: वे सभी टुकड़े हैं। लेकिन क्या यह एक एल्गोरिथ्म बनाने के लिए उन्हें एक साथ रखना संभव है जो इनपुट क्लीन किए गए डेटा के रूप में लेता है और सभी तकनीकों से सबसे अच्छा निकालकर अच्छे परिणाम देता है? (बेशक यह शायद कम कुशल होगा कि एक पेशेवर डेटा वैज्ञानिक, लेकिन वह मुझसे बेहतर होगा!) यदि हाँ, तो आपके पास नमूना कोड हैं या क्या आप ऐसे फ्रेमवर्क जानते हैं जो ऐसा कर सकते हैं?

EDIT: कुछ जवाबों के बाद, ऐसा लगता है कि कुछ संकीर्ण करना है। आइए एक उदाहरण लेते हैं, हमारे पास एक डेटा है जिसमें श्रेणीबद्ध डेटा है, चलो इसे कॉल करते हैं yऔर हम संख्यात्मक डेटा से इसकी भविष्यवाणी करना चाहते हैं Xजो या तो डमी या वास्तविक संख्यात्मक डेटा (ऊंचाई, तापमान) है। हम मानते हैं कि सफाई पहले से की गई है। क्या मौजूदा एल्गोरिथ्म हैं जो इस तरह के डेटा को ले सकते हैं और एक भविष्यवाणी का उत्पादन कर सकते हैं? (कई एल्गोरिदम का परीक्षण करके, उन्हें ट्यूनिंग, बूस्टिंग, आदि) यदि हाँ, तो क्या यह कम्प्यूटेशनल रूप से कुशल है (यदि हम सामान्य एल्गोरिथ्म की तुलना में एक उचित समय में गणना की गई है), और क्या आपके पास कोड का एक उदाहरण है?


1
शायद तब तक नहीं जब तक कि मजबूत ए.आई.
गंग -

1
स्वत: ट्यूनिंग के संबंध में आप मशीन लर्निंग में हाइपरपरमेट सर्च के बारे में पढ़ने में दिलचस्पी ले सकते हैं । हाइपरपरमेटर्स को अनुकूलित करने के लिए ग्रिड खोज एक भयानक तरीका है।
मार्क क्लेसेन

2
करो तुम है इतना उपयोग करने के लिए स्वरूपण ?
साइकोरेक्स का कहना है कि

2
ऐसे उत्पाद हैं जो दावा करते हैं कि वे वही करते हैं जो आप वर्णन करते हैं, जैसे क्रिस्टल बॉल । मुझे व्यक्तिगत रूप से उन पर भरोसा नहीं है, लेकिन जैसा कि आपने लिखा है: वे किसी ऐसे व्यक्ति की तुलना में बेहतर काम करते हैं, जिनके पास आँकड़ों के बारे में कोई सुराग नहीं है
अक्सकल

1
पूर्वानुमान के लिए auto.arima( forecastपुस्तकालय से) मनुष्यों से बेहतर हो सकता है - रोब हंडमैन ने अपनी प्रस्तुतियों में कई बार उल्लेख किया। तो ऐसे क्षेत्र हैं जहां सफलता के साथ "स्वचालित सीखने" के कुछ प्रकार लागू होते हैं।
टिम

जवाबों:


7

यदि आप पहले से जानते हैं कि आप किस तरह का डेटा फीड करेंगे ("ये कीमत और प्रचार मार्कर के साथ, और मैं CPGs की मासिक बिक्री कर रहा हूं, और मुझे एक बिंदु का पूर्वानुमान चाहिए"), तो आप समय से पहले अपना सेटअप ट्यून कर सकते हैं, जो संभवतः होगा संभव और पहले से ही, कुछ विशिष्ट कार्यों के लिए विभिन्न "विशेषज्ञ प्रणाली" देखें।

यदि आप किसी ऐसी चीज़ की तलाश कर रहे हैं जो किसी भी प्रकार का डेटा ले सकती है और उसके साथ "कुछ उपयोगी" कर सकती है ("आह, यहाँ मैं हस्तलेखन और आउटपुट ज़िप कोड पहचानने वाला हूं, और वहां मुझे धोखाधड़ी का पता लगाना चाहिए, और यह इनपुट फ़ाइल स्पष्ट रूप से होनी चाहिए" एक क्रेडिट स्कोरिंग कार्य है "), नहीं, मुझे नहीं लगता कि यह लंबे समय में होगा।

एक राय-आधारित उत्तर के लिए क्षमा करें जो एक राय-आधारित प्रश्न के रूप में अच्छी तरह से बंद हो सकता है।


संपादित प्रश्न को संबोधित करने के लिए संपादित करें:

yएक्स

y


मैंने अपना प्रश्न संपादित किया है धन्यवाद, एक पहला भाग है "जो भी इनपुट लें और मुझे परिणाम दें फेंकें" और आपका उत्तर वास्तव में व्यावहारिक है, और एक विशेष प्रकार के प्रश्नों के लिए दूसरा भाग ", और डेटा स्वरूपण, मुझे ढूंढें परिणाम"।
फॉलोचेयरेयर

यह सुनिश्चित नहीं है कि अंतिम पैराग्राफ अभी भी है, बड़ी समस्याओं पर गहन सीखने की अपार सफलता मिली। ये विधियां निश्चित रूप से सामान्य उद्देश्य हैं, फिर भी वे कई एप्लिकेशन डोमेन जैसे कि कंप्यूटर दृष्टि और एनएलपी में रिकॉर्ड रखती हैं। कोई यह तर्क दे सकता है कि आर्किटेक्चर कार्यों के बीच भिन्न हैं, लेकिन सैद्धांतिक स्तर पर एक पूरी तरह से जुड़ा हुआ गहरा नेटवर्क कम से कम उतना ही अच्छा प्रदर्शन करेगा, जितना कि, प्रशंसनीय नेटवर्क कहते हैं, यह सिर्फ इतना है कि उचित प्रशिक्षण विधियां मायावी बनी हुई हैं।
मार्क क्लेसेन

@MarcClaesen: मैं कहूंगा कि "यह सिर्फ उचित प्रशिक्षण विधियां मायावी हैं" वह बिंदु हैं जहां आपको अभी भी डोमेन विशिष्ट विशेषज्ञता की आवश्यकता होगी।
Stephan Kolassa

7

जैसा कि आप पहले से ही वर्णन करते हैं, कुछ हद तक AutoWEKA में मौजूद है , और इसे सक्रिय रूप से पुनर्जीवित किया जा रहा है (उदाहरण के लिए चाल्र्स ऑटोएमएल जैसी चुनौतियां )।

यह आमतौर पर हाइपरपरमीटर ऑप्टिमाइज़ेशन के उपक्षेत्र में माना जाता है। Optunity , Hyperopt और ParamILS जैसे सॉफ्टवेयर पैकेजों का उपयोग किसी दिए गए दृष्टिकोण के लिए हाइपरपरमेटर्स को स्वचालित रूप से अनुकूलित करने के लिए किया जा सकता है और चुन सकते हैं कि कौन सा दृष्टिकोण सबसे अच्छा होता है। उस ने कहा, ऐसी अनुकूलन समस्याएं तुच्छ नहीं हैं और आमतौर पर सबसे अच्छा मॉडल (या इसके करीब) स्वचालित रूप से प्राप्त करने के लिए एक लंबा समय लगता है।

आप सबसे अच्छा सीखने के एल्गोरिथ्म को स्वचालित रूप से निर्धारित करने और http://optunity.readthedocs.org/en/latest/notebooks/notebooks/sklearn-automated-classification.html पर अपने हाइपरपैरामीटर का अनुकूलन करने के लिए Optunity का उपयोग करने का एक उदाहरण पा सकते हैं।


4

हाइपर पैरामीटर ट्यूनिंग और पहनावा मॉडल में अग्रिम मॉडल बिल्डिंग से बाहर 'कला' का एक बहुत ले रहे हैं। हालांकि, मॉडल निर्माण के दो महत्वपूर्ण पहलू हैं जो हाइपर पैरामीटर ट्यूनिंग और एनसेंबल से निपटते नहीं हैं और आपको सबसे अच्छा संभव मॉडल खोजने से रखेंगे।

पहले, कुछ प्रकार के डेटा मॉडलिंग में कुछ विशेष प्रकार के एल्गोरिदम बेहतर होते हैं। उदाहरण के लिए, यदि आपके चरों के बीच बातचीत होती है, तो एक एडिटिव मॉडल उन्हें खोजने नहीं जा रहा है, बल्कि एक निर्णय ट्री होगा। यह जानना कि मॉडल विभिन्न डेटासेट पर कैसे व्यवहार करते हैं, और सही उठाते हुए, सर्वश्रेष्ठ मॉडलिंग एल्गोरिथ्म खोजने के लिए डोमेन के बारे में ज्ञान की आवश्यकता हो सकती है।

दूसरा, फीचर इंजीनियरिंग और फीचर निष्कर्षण मॉडल निर्माण के लिए वास्तविक 'कला' है। आपका प्रश्न मानता है कि डेटासेट पहले से तैयार है। लेकिन आप जो नहीं मान रहे हैं वह यह है कि जो आप मॉडल करने की कोशिश कर रहे हैं वह डेटासेट का सबसे अच्छा संभव प्रतिनिधित्व है। यह हमेशा और खुला प्रश्न है। कई मामलों में, जहां डेटा सेट जटिल है, आप दिन भर इंजीनियर की सुविधा ले सकते हैं, लेकिन आप एल्गोरिथ्म में अधिक से अधिक शोर फेंकने का जोखिम उठाते हैं। यह जानने के लिए कि आपको किन विशेषताओं को जोड़ना है, उन्हें पता होना चाहिए कि कौन सी विशेषताएँ सांख्यिकीय दृष्टिकोण से समझ में आती हैं और जो डोमेन विशेषज्ञ के दृष्टिकोण से समझ में आता है।

उन दो कारणों से, मैं यह निष्कर्ष निकालता हूं कि नहीं, आप एक एल्गोरिथ्म को खोजने में सक्षम नहीं होंगे जो स्वचालित रूप से सर्वोत्तम संभव मॉडल पाता है । यह भी है कि मैं सॉफ्टवेयर विक्रेताओं पिचिंग उपकरणों पर संदेह कर रहा हूं जो डेटा वैज्ञानिकों की आवश्यकता को बदल देगा।

हालांकि, यदि आप एक निश्चित सेट मॉडल से सर्वश्रेष्ठ मॉडल खोजने के लिए अपनी महत्वाकांक्षा को सीमित कर रहे हैं, तो इष्टतम हाइपर मापदंडों के साथ, जहां 'सर्वश्रेष्ठ' को प्रशिक्षण सेट पर उच्चतम भविष्य कहनेवाला सटीकता के रूप में परिभाषित किया गया है, तो हाँ, यह संभव है।

मॉडल को स्वचालित रूप से ट्यून करने के तरीके के रूप caretमें पैकेज देखें Rcaretग्रिड खोज का उपयोग करता है, जिसमें खामियां हैं, और यह केवल एक समय में एक मॉडल बनाता है। हालांकि, कई अलग-अलग पैकेजों से मॉडल की लंबी सूची के लिए मॉडल और सुविधाजनक रैपर की तुलना करने के लिए फ़ंक्शन Rहैं।


मैं मानता हूं कि हम अभी भी पूरी तरह से स्वचालित मशीन सीखने से दूर हैं, लेकिन आपके द्वारा निर्दिष्ट कारणों के लिए नहीं। दो चीजें: (i) किसी दिए गए सेट से सबसे अच्छा मॉडल (+ अपने हाइपरपरमेटर्स को ऑप्टिमाइज़ करना) पहले से ही संभव है और (ii) फीचर इंजीनियरिंग और फीचर निष्कर्षण गहरी शिक्षा में प्रगति के कारण महत्व खो रहा है। वर्तमान में हमारे पास मुख्य चीज पूर्व ज्ञान और क्षेत्र विशिष्ट सामान्य ज्ञान को शामिल करने के लिए स्वचालित तरीके हैं।
मार्क क्लेसेन

मुझे लगता है कि मैं यह नहीं देखता कि "पूर्व ज्ञान और क्षेत्र विशिष्ट सामान्य ज्ञान" कैसे एमएल मॉडल को बेहतर बनाने में मदद कर सकता है (i) सबसे अच्छा मॉडल खोजने में मदद करता है और (ii) सबसे अच्छी सुविधाओं को ढूंढता है। मैंने दूसरे और अंतिम पैराग्राफ के साथ सच्चे मॉडल और इष्टतम (अधिकतम सटीकता) मॉडल के बीच अंतर करने की कोशिश की।
ब्रैंडको

मॉडलिंग प्रक्रिया में गलत खामियों को उजागर करने के लिए जैसे कि गलत लेबल और / या सूचना लीक, लापता डेटा से कैसे निपटना है, वास्तविक शिक्षण कार्य (+ एक उपयुक्त स्कोर / नुकसान फ़ंक्शन) की पहचान करना और आम तौर पर एक पूर्ण डेटा क्लीनअप (जो हमेशा होता है) उन सभी व्यावहारिक समस्याओं पर मुख्य प्रयास किया गया है जिनमें मैं शामिल हूं)।
मार्क क्लेसेन

2

इस पर निर्भर करता है कि आपने किससे पूछा है।

मैंने हाल ही में प्रसंग प्रासंगिक पर स्कॉट गोल्डर द्वारा एक बात सुनी । उनका उत्पाद मूल रूप से एक फीचर और मॉडल चयन रोबोट है। मूल अंतर्निहित मॉडल लॉजिस्टिक रिग्रेशन है, लेकिन सिस्टम मूल रूप से सटीक भविष्यवाणियां उत्पन्न करने के लिए सुविधा चयन, आयाम में कमी, नियमितीकरण आदि के सही संयोजन का पता लगाने के लिए मशीन लर्निंग का उपयोग करता है। यह एक बहुत प्रभावशाली बात थी, और विवरण सभी बहुत मालिकाना हैं। जाहिरा तौर पर उनके ग्राहकों में प्रमुख वित्तीय कंपनियां शामिल हैं और सिस्टम मनमाने ढंग से बड़े डेटा सेट को संभाल सकता है।

कम से कम कुछ लोगों को लगता है कि स्वचालित डेटा विज्ञान पहले से ही यहां है, कम से कम कुछ अनुप्रयोगों के लिए। और उन लोगों में से कुछ (कॉनटेक्स्ट रेलेवंट के ग्राहक) स्पष्ट रूप से इसे एक्सेस करने के लिए नाक के माध्यम से भुगतान कर रहे हैं।


1

नहीं यह कोई सपना नहीं है। हमने H2O मशीन लर्निंग लाइब्रेरी में इसे (आपके द्वारा बताई गई सभी तकनीकों का संयोजन, स्टैक किए गए पहनावा सहित) लागू किया है । आप इसके बारे में अधिक पढ़ सकते हैं और यहां आर और पायथन में कोड उदाहरण पा सकते हैं ।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.