पैटर्न मान्यता कार्यों में अत्याधुनिक एल्गोरिदम सीखने की कला?


14

इस प्रश्न की संरचना इस प्रकार है: सबसे पहले, मैं कलाकारों की टुकड़ी सीखने की अवधारणा प्रदान करता हूं , आगे मैं पैटर्न मान्यता कार्यों की एक सूची प्रदान करता हूं, फिर मैं कलाकारों की टुकड़ी सीखने के एल्गोरिदम का उदाहरण देता हूं और अंत में, अपने प्रश्न का परिचय देता हूं। जिन लोगों को सभी पूरक जानकारी की आवश्यकता नहीं है, वे सिर्फ हेडलाइंस को देख सकते हैं और सीधे मेरे सवाल पर जा सकते हैं।


सीखने का पहनावा क्या है?

विकिपीडिया के अनुसार लेख के :

सांख्यिकी और मशीन सीखने में, कलाकारों की टुकड़ी के तरीकों से बेहतर भविष्य कहनेवाला प्रदर्शन प्राप्त करने के लिए कई शिक्षण एल्गोरिदम का उपयोग किया जाता है, जो अकेले किसी भी घटक के सीखने के एल्गोरिदम से प्राप्त किया जा सकता है। एक सांख्यिकीय कलाकारों की टुकड़ी के विपरीतसांख्यिकीय यांत्रिकी में , जो आमतौर पर अनंत है, एक मशीन लर्निंग कलाकारों की टुकड़ी केवल वैकल्पिक मॉडल के एक ठोस परिमित सेट को संदर्भित करती है, लेकिन आम तौर पर उन विकल्पों में से अधिक लचीली संरचना को मौजूद करने की अनुमति देती है।


पैटर्न मान्यता कार्यों के उदाहरण:


पहनावा सीखने के एल्गोरिदम के उदाहरण:

पीआर कार्यों (विकी के अनुसार) के लिए उपयोग किए जाने वाले निम्नलिखित एल्गोरिदम सीखने के लिए:

लर्निंग एल्गोरिदम को इकट्ठा करना (एक साथ कई लर्निंग एल्गोरिदम के संयोजन के लिए मेटा-एल्गोरिदम की निगरानी करना):

  • बूस्टिंग (मुख्य रूप सेपूर्वाग्रहको कम करने के लिएमेटा-एल्गोरिथ्मको इकट्ठा करने वालाएक मशीन लर्निंग, औरपर्यवेक्षित शिक्षणमें विचरण, और मशीन लर्निंग एल्गोरिदम का एक परिवार जो कमजोर शिक्षार्थियों को मजबूत लोगों में परिवर्तित करता है)

  • बूटस्ट्रैप एग्रीगेटिंग (" बैगिंग ") (सांख्यिकीय वर्गीकरणऔरप्रतिगमनमें प्रयुक्त मशीन लर्निंग एल्गोरिदम की स्थिरता और सटीकता में सुधार के लिए डिज़ाइन किया गया एक मशीन लर्निंग मेटा-एल्गोरिथ्म)।

  • औसत (केवल एक मॉडल बनाने के विपरीत, कई मॉडल बनाने और उन्हें एक वांछित आउटपुट बनाने के लिए संयोजित करने की प्रक्रिया को सुनिश्चित करें। अक्सर मॉडल का एक संयोजन किसी भी व्यक्तिगत मॉडल की तुलना में बेहतर प्रदर्शन करता है, क्योंकि मॉडल की विभिन्न त्रुटियां "औसत बाहर" होती हैं। )

  • विशेषज्ञों का मिश्रण, विशेषज्ञों का पदानुक्रमित मिश्रण

विभिन्न कार्यान्वयन

  • न्यूरल नेटवर्क (तंत्रिका नेटवर्क मॉडल का एक सेट जो व्यक्तिगत मॉडल के परिणामों के औसत से निर्णय लेता है) के साथ मिलता है।
  • रैंडम वन (वर्गीकरण, प्रतिगमन और अन्य कार्यों के लिए सामूहिक सीखने की विधि, कि की एक भीड़ का निर्माण करके संचालितनिर्णय वृक्षसमय प्रशिक्षण पर और वर्ग है कि है outputtingमोडव्यक्ति की कक्षाओं (वर्गीकरण) या मतलब भविष्यवाणी (प्रतिगमन) की पेड़)।
  • AdaBoost (अन्य सीखने के एल्गोरिदम का उत्पादन ('कमजोर शिक्षार्थियों') को एक भारित योग में जोड़ा जाता है जो कि संवर्धित क्लासिफायर के अंतिम आउटपुट का प्रतिनिधित्व करता है)।

इसके अतिरिक्त:

  • विभिन्न क्लासीफायर को संयोजित करने के लिए एक तंत्रिका नेटवर्क का उपयोग करने वाले तरीके
  • क्षमता क्षेत्रों विधि

मेरा प्रश्न

पहनावा सीखने वाले एल्गोरिदम में से कौन सा आजकल अत्याधुनिक माना जाता है और वास्तव में उद्यमों और संगठनों द्वारा व्यवहार में (चेहरे का पता लगाने के लिए, वाहन पंजीकरण प्लेट मान्यता, ऑप्टिकल चरित्र पहचान आदि) के लिए उपयोग किया जाता है? पहनावा सीखने के एल्गोरिदम का उपयोग मान्यता सटीकता को बढ़ाने और बेहतर कम्प्यूटेशनल दक्षता के लिए नेतृत्व करना है। लेकिन, क्या मामले वास्तविकता में इस तरह खड़े होते हैं?

कौन सा पहनावा पद्धति, संभवतः, पैटर्न पहचान कार्यों में बेहतर वर्गीकरण सटीकता और प्रदर्शन दिखा सकता है? शायद, कुछ विधियां अब पुरानी हो गई हैं, या अप्रभावी होना दिखाया गया है। यह भी संभव है कि पहनावे के तरीके अब कुछ नए एल्गोरिदम के बल पर इस्तेमाल नहीं किए जाते हैं। जिनके पास क्षेत्र में अनुभव है या इस क्षेत्र में पर्याप्त ज्ञान है, क्या आप मामलों को स्पष्ट करने में मदद कर सकते हैं?


मैंने हाल ही में जो सुना है वह यह है कि लोग XGBoost को पसंद करते हैं और इसने कई कागल प्रतियोगिताओं में वास्तव में प्रभावशाली प्रदर्शन दिखाया।
सांगवॉन्ग यो सिप

उत्तर संक्षिप्त है: वह जो सर्वश्रेष्ठ सीवी स्कोर देता है। आमतौर पर यह स्टैकिंग होता है
एलेक्सी ग्रिगोरव

एक पहनावा मॉडल की सफलता और विफलता, कलाकारों की टुकड़ी के सदस्य मॉडल और डेटा की प्रकृति का एक कार्य है । कलाकारों की टुकड़ी काम करती है क्योंकि सदस्य मॉडल विविधता की डिग्री प्राप्त करते हैं। आपका प्रश्न संभवतः उन दोनों मॉडलों की बारीकियों के बिना अचूक है, जिन्हें आपने अपने कलाकारों की टुकड़ी और प्रश्न में डेटासेट में रखा है।
राशिफल

जवाबों:


9

उद्योग में उत्पादन में उपयोग किए जाने वाले अत्याधुनिक एल्गोरिदम अलग हो सकते हैं। इसके अलावा, बाद वाले फाइन-ट्यूनिंग में अधिक बुनियादी (और अक्सर अधिक व्याख्यात्मक) दृष्टिकोणों में निवेश कर सकते हैं, ताकि वे शिक्षाविदों की तुलना में बेहतर काम कर सकें।

उदाहरण 1: के अनुसार TechCrunch के , Nuance इस सिपाही के ड्रैगन भाषण मान्यता उत्पादों में "डीप लर्निंग टेक" का उपयोग करना शुरू कर देगा।

उदाहरण 2: चितिकारीउ, लौरा, यूंइओ ली और फ्रेडरिक आर। "नियम-आधारित सूचना निष्कर्षण मर चुका है! लंबे समय तक लाइव नियम-आधारित सूचना निष्कर्षण प्रणाली!" ईएमएनएलपी में, नहीं। अक्टूबर, पीपी। 827-832। 2013. https://scholar.google.com/scholar?cluster=12856773132046965379&hl=en&as_sdt=0,22 ; http://www.aclweb.org/website/old_anthology/D/D13/D13-1079.pdf

यहाँ छवि विवरण दर्ज करें

उस के साथ कहा जा रहा है:

पहनावा सीखने वाले एल्गोरिदम में से कौन सा आजकल अत्याधुनिक माना जाता है

छवि वर्गीकरण के लिए अत्याधुनिक प्रणालियों में से एक कलाकारों की टुकड़ी के साथ कुछ अच्छा लाभ प्राप्त करता है (जैसा कि मैं जानता हूं कि अभी तक के अन्य प्रणालियों की तरह): वह, काइमिंग, जियानग्यु झांग, शाओकिंग रेन और जियान सन। "छवि मान्यता के लिए गहन अवशिष्ट सीखने।" arXiv प्रीप्रिंट arXiv: 1512.03385 (2015)। https://scholar.google.com/scholar?cluster=17704431389020559554&hl=en&as_sdt=0,22 ; https://arxiv.org/pdf/1512.03385v1.pdf

यहाँ छवि विवरण दर्ज करें


3

मुझे लगता है कि एक व्यक्ति कह सकता है कि गहरी शिक्षा बहुत अधिक अत्याधुनिक है जो कंप्यूटर विज़न (वर्गीकरण, पता लगाने, सुपर-रिज़ॉल्यूशन, एज डिटेक्शन, ...) के अधिकांश उप-डोमेन में है जैसे कि SLAM जैसे बहुत विशिष्ट कार्य को छोड़कर। मौजूदा विधियों के साथ गहन सीखने के बराबर नहीं है।

अक्सर प्रतियोगिता नेटवर्क जीतने के लिए कुछ अतिरिक्त प्रतिशत प्राप्त करने के लिए औसत का उपयोग किया जाता है लेकिन नेटवर्क इतने अच्छे होते जा रहे हैं कि इससे कोई फर्क नहीं पड़ता।

उत्पादन में यह पूरी तरह से अलग है। बड़ी कंपनियां आमतौर पर पुराने एल्गोरिदम पर भरोसा कर रही हैं जो प्रभावी साबित हुई हैं और यह कि जगह के विशेषज्ञों को उनके उपयोग करने के वर्षों और अभ्यास का ज्ञान है।
इसके अलावा आपूर्ति श्रृंखला में एक नए एल्गोरिथ्म को एकीकृत करने के लिए बहुत समय की आवश्यकता होती है। मुझे लगता है कि कुछ कैमरा कंपनियां अभी भी फेस डिटेक्शन के लिए वियोला जोन्स डिटेक्टर का उपयोग करती हैं और मुझे इस तथ्य के बारे में पता है कि SIFT का उपयोग उद्योग में बहुत सारे अनुप्रयोगों में किया जा रहा है।

वे अभी भी गहन सीखने के तरीकों के प्रति थोड़ा संशय में हैं जिन्हें खतरनाक ब्लैक बॉक्स माना जाता है।
लेकिन उन एल्गोरिदम के प्रभावशाली परिणाम धीमी गति से बना रहे हैं जिससे लोग इसके बारे में अपना मन बदल लेते हैं।

स्टार्ट-अप ऐसे समाधानों का उपयोग करने के लिए अधिक इच्छुक हैं क्योंकि उनके पास वित्त पोषित करने के लिए अभिनव समाधान होने चाहिए।

मैं कहूंगा कि बीस वर्षों में अधिकांश कंप्यूटर दृष्टि आधारित उत्पाद गहरी शिक्षा का उपयोग करेंगे, भले ही बीच में कुछ और प्रभावी खोज की जाए।
फ्रेंक के जवाब में जोड़ने के लिए गहरी सीख इतनी तेजी से बदल रही है कि कैमिंग के ResNets वह अब कला के राज्य नहीं हैं। घनिष्ठ रूप से जुड़े हुए नेटवर्क और वाइड और डीप नेटवर्क को फिर से शुरू करने के साथ अब EDIT पर SOTA हैं CIFAR और SVHN और शायद Imagenet भी और यह भी 16 सितंबर को ILSVRC 2016 के परिणाम के साथ कुछ दिनों में बदल सकता है।

यदि आप MS-COCO पर कला परिणाम के अधिक राज्य में रुचि रखते हैं, तो मौजूदा चुनौतीपूर्ण चुनौतीपूर्ण डेटासेट अक्टूबर में ECCV पर जारी किए जाएंगे।


1
वास्तव में, दोहरी जाँच के बाद, मैंने जिन लेखों का हवाला दिया है, वे Imagenet पर उनके परिणामों का उल्लेख नहीं करते हैं! तो यह मेरी भूल है! लेकिन जैसा कि वे CIFAR और SVHN से कहीं बेहतर हैं, मुझे लगता है कि यह Imagenet पर समान होना चाहिए लेकिन आप कभी नहीं जानते। मुझे लगता है कि उन्होंने ILSVRC के परिणामों की प्रतीक्षा करने के लिए इसका उल्लेख नहीं किया लेकिन मैं गलत हो सकता हूं!
जीन

1
@FranckDernoncourt परिणामों का यह उन्माद बहुत ही रोमांचक है, लेकिन इस क्षेत्र में जो लोग प्रकाशित करना चाहते हैं, उन पर बहुत अधिक दबाव डाल सकते हैं, जो अब इस तरह के कुख्यात SARM लेख की तरह गलतियों को जन्म दे सकता है जो लेखक आज NIPS से वापस ले लिया है।
जीन

धन्यवाद, हाँ मैंने देखा है कि वास्तव में, लेकिन उस कागज की जांच करने का मौका नहीं मिला ... मैं इन सभी नए एएनएन पीडीएफ के साथ अपनी टू-रीड सूची को खाली करने का मुद्दा उठा रहा हूं: /
फ्रेंक डेर्नोनकोर्ट

यह SARM वापसी की घटना मुझे आंकड़ों में पुनरुत्पादकता संकट पर पुनर्विचार करने के लिए मजबूर करती है। समीक्षा प्रक्रिया में कितना कार्यान्वयन विवरण आवश्यक होना चाहिए, कितना कम है, इत्यादि
हॉर्स टीटी

2

आपके प्रश्न में बहुत सारे व्हाट्सएप शामिल हैं, और आमतौर पर सबसे अच्छे मॉडल को खोजने में डेटा पर इनमें से अधिकांश का परीक्षण करना शामिल है। सिर्फ इसलिए कि सिद्धांत में एक मॉडल अधिक सटीक परिणाम दे सकता है इसका मतलब यह नहीं है कि यह हमेशा सबसे कम त्रुटि वाले मॉडल का उत्पादन करेगा।

कहा जा रहा है ... जब तक आप ब्लैक बॉक्स को स्वीकार नहीं कर सकते तब तक न्यूरल नेट पहनावा बहुत सटीक हो सकता है। नोड्स की संख्या और परतों की संख्या दोनों को भिन्न करने से डेटा में बहुत अधिक परिवर्तन हो सकता है, इस कई मॉडलिंग कारकों को पेश करने के साथ डेटा को ओवरफिट करना आसान हो सकता है।

रैंडम फ़ॉरेस्ट ने शायद ही कभी सबसे सटीक परिणाम उत्पन्न किए हैं, लेकिन बढ़े हुए पेड़ जटिल संबंधों को मॉडल कर सकते हैं जैसे कि एआई कार्यों में जिन्हें आपने ओवरफिटिंग के जोखिम के बिना चर्चा की थी।

कोई सोचता है, ठीक है कि क्यों न केवल इन सभी मॉडलों को एक साथ जोड़ा जाए, लेकिन यह मॉडल व्यक्तिगत मॉडलों की संभावित ताकत पर समझौता करता है। फिर से यह कुछ overfitting मुद्दों की ओर ले जाएगा।

कम्प्यूटेशनल रूप से कुशल होने वाले मॉडल एक अलग मामला है, और मैं बहुत जटिल तंत्रिका जाल के साथ शुरू नहीं करूंगा। एक बेंचमार्क के रूप में एक तंत्रिका जाल का उपयोग करना, मेरे अनुभव में बूस्टेड पेड़ों का उपयोग करके यह सबसे कुशल रहा है।

यह मेरे अनुभव पर आधारित है, और चर्चा की गई प्रत्येक मॉडलिंग प्रकार के अंतर्निहित सिद्धांत की एक उचित समझ है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.