गहरी शिक्षा कहाँ और क्यों चमकती है?


20

इन दिनों गहन सीखने के बारे में सभी मीडिया चर्चा और प्रचार के साथ, मैंने इसके बारे में कुछ प्राथमिक चीजें पढ़ीं। मैंने अभी पाया कि डेटा से पैटर्न सीखने के लिए यह सिर्फ एक और मशीन लर्निंग विधि है। लेकिन मेरा सवाल यह है: यह विधि कहां और क्यों चमकती है? अभी इस बारे में सारी बात क्यों? यानी आखिर क्या उपद्रव है?


4
क्यों यह इतना अच्छा है की एक आसान अवलोकन के लिए ज्योफ हिंटन और एंड्रयू एनजी के गुणात्मक यूट्यूब व्याख्यान देखें।
जस

जवाबों:


22

मुख्य कथित लाभ:

(1) गैर-रेखीय सीखने की समस्याओं के लिए इंजीनियर सुविधाओं को हाथ लगाने की जरूरत नहीं है (समय की बचत और भविष्य के लिए स्केलेबल, क्योंकि हाथ इंजीनियरिंग को एक अल्पकालिक बैंड-सहायता के रूप में देखा जाता है)

(2) सीखी गई विशेषताएँ कभी-कभी सर्वश्रेष्ठ हाथ से संचालित होने वाली सुविधाओं से बेहतर होती हैं, और यह इतनी जटिल (कंप्यूटर दृष्टि - जैसे चेहरे जैसी विशेषताएं) हो सकती हैं कि इससे इंजीनियर को बहुत अधिक मानवीय समय लगेगा।

(3) नेटवर्क को प्री-ट्रेन करने के लिए अनलिस्टेड डेटा का उपयोग कर सकते हैं। मान लें कि हमारे पास 1000000 गैर-लेबल छवियां और 1000 लेबल की गई छवियां हैं। अब हम गहराई से सीखने के साथ 1000000 गैर-सूचीबद्ध छवियों पर पूर्व-प्रशिक्षण द्वारा एक पर्यवेक्षित शिक्षण एल्गोरिथ्म में काफी सुधार कर सकते हैं। इसके अलावा, कुछ डोमेन में हमारे पास बहुत सारे गैर-सूचीबद्ध डेटा हैं, लेकिन लेबल किए गए डेटा को ढूंढना मुश्किल है। एक एल्गोरिथ्म जो वर्गीकरण को बेहतर बनाने के लिए इस गैर-सूचीबद्ध डेटा का उपयोग कर सकता है, मूल्यवान है।

(4) स्पष्ट रूप से, कई बेंचमार्क को तोड़ दिया जो केवल गहरी सीखने के तरीकों की शुरूआत तक वृद्धिशील सुधार देख रहे थे।

(5) एक ही एल्गोरिदम कच्चे (शायद मामूली पूर्व प्रसंस्करण के साथ) इनपुट के साथ कई क्षेत्रों में काम करता है।

(६) अधिक डेटा के रूप में नेटवर्क को खिलाया जाता है (स्थिर वितरण आदि मानकर ) सुधार होता रहता है।


1

उपरोक्त के अतिरिक्त एक अन्य महत्वपूर्ण बिंदु (मेरे पास इसे टिप्पणी के रूप में जोड़ने के लिए पर्याप्त प्रतिनिधि नहीं है) यह है कि यह एक जेनरेटिव मॉडल है (कम से कम डीप विश्वास नेट्स) और इस प्रकार आप सीखे गए वितरण से नमूना ले सकते हैं - यह कर सकते हैं कुछ अनुप्रयोगों में कुछ प्रमुख लाभ हैं जहाँ आप सीखे हुए वर्गों / समूहों के अनुरूप सिंथेटिक डेटा उत्पन्न करना चाहते हैं।


1
यह गहरी सीखने की सामान्य संपत्ति नहीं है, लेकिन प्रश्न में ठोस मॉडल है। उदाहरण के लिए, आप एक गाऊसी से नमूना ले सकते हैं लेकिन लॉजिस्टिक प्रतिगमन से नहीं। आप कई प्रकार के गहन शिक्षण मॉडल से भी नमूना ले सकते हैं, उदाहरण के लिए डीप विश्वास जाल, जैसा कि आपने कहा, डीप बोल्ट्ज़मैन मशीन, डीप लेटेंट गॉसियन मॉडल, आदि। लेकिन आप ड्र्रेडनेट से नमूना नहीं ले सकते हैं, जो सभी प्रभावशाली में उपयोग किए गए मॉडल हैं। अनुप्रयोग।
बायरज

... आप लॉजिस्टिक रिग्रेशन का नमूना क्यों नहीं ले सकते?
हांग ओई

एक LR मॉडल दिया पी(सी|एक्स), आप इनपुट पर वातानुकूलित वर्ग का नमूना ले सकते हैं। लेकिन आप किसी इनपुट का नमूना नहीं ले सकते। इस प्रकार, यह एक विभेदक / सामान्य भेद है।
बायरज

1
लेकिन एक ही गॉसियन रिग्रेशन मॉडल के लिए है, अगर आप बेसिक लीनियर रिग्रेशन का मतलब रखते हैं।
हांग ऑय
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.