गहरी तंत्रिका नेटवर्क - बस छवि वर्गीकरण के लिए?


14

सभी उदाहरण जो मैंने गहरे विश्वास या दृढ़ तंत्रिका नेटवर्क का उपयोग करके पाया, उनका उपयोग छवि वर्गीकरण, बैक्टीरिया का पता लगाने या भाषण पहचान के लिए किया जाता है।

क्या शास्त्रीय तंत्रिका संबंधी कार्यों के लिए गहरे तंत्रिका नेटवर्क भी उपयोगी हैं, जहां सुविधाओं को संरचित नहीं किया जाता है (जैसे, अनुक्रम या ग्रिड में व्यवस्थित नहीं)? यदि हाँ, तो क्या आप एक उदाहरण दे सकते हैं?


3
आपका पहला वाक्य दृढ़ तंत्रिका नेटवर्क लाता है। ऐसा प्रतीत होता है कि आप उन्हें गहन विश्वास नेटवर्क के साथ भ्रमित कर रहे हैं। वे समान नहीं हैं, हालांकि दोनों तंत्रिका नेटवर्क के रूप हैं।
MSALERS

1
मैं @msalters से सहमत हूँ, लेकिन यह कहूंगा कि गहरे विश्वास नेटवर्क वास्तव में गहरे नेटवर्क हैं, और सीमित सफलता मिली है, जबकि दृढ़ विश्वास जाल एक संकर की तरह अधिक होते हैं - उथले nn द्वारा पीछा किए गए दृढ़ परतों में अनुकूली छवि फिल्टर।
seanv507

"अवलोकनों" का मतलब क्या है "संरचित नहीं (अनुक्रम या ग्रिड में व्यवस्थित नहीं)"? क्या आप छवियों को "संरचित" होने का अर्थ इस अर्थ में लेते हैं कि एक ग्रिड पर अलग-अलग पिक्सेल की व्यवस्था की जाती है? लेकिन फिर यह ऐसी विशेषताएं हैं जो "संरचित" हैं, न कि "अवलोकन" (वे व्यक्तिगत चित्र होंगे)?
अमीबा का कहना है कि मोनिका

मैं कहूंगा कि सभी कन्वर्सेशन नेटवर्क गहरे हैं, सभी गहरे नेटवर्क कनवैल्यूएशन नहीं हैं, और इसी तरह सभी गहरे विश्वास नेटवर्क गहरे हैं, सभी गहरे नेटवर्क गहरे विश्वास नेटवर्क नहीं हैं। वास्तव में आपके पास गहरे नेटवर्क हो सकते हैं जो न तो गहरे हैं और न ही जटिल हैं, वे सिर्फ प्रशिक्षित करने के लिए कठिन हैं। हालाँकि शब्दावली पर निरर्थक बहस की गुंजाइश ज़रूर है।
लिंडन व्हाइट

आप बिना रुकावट (अनुक्रम / ग्रिड आदि में नहीं) डेटा के लिए एक दृढ़ नेटवर्क लागू नहीं कर सकते। यह मूल रूप से समझ में नहीं आता है। एक दृढ़ नेटवर्क आप इनपुट के फूरियर रूपांतरण लेने के लिए निकटता से संबंधित है - उदाहरण के लिए इसे समय डोमेन से आवृत्ति डोमेन में परिवर्तित करने वाले दृश्यों के लिए।
लिंडन व्हाइट

जवाबों:


8

छवियों की विशेषताएं जो उन्हें एक गहरे तंत्रिका नेटवर्क के साथ वर्गीकरण के लिए उत्तरदायी बनाती हैं, वहाँ एक टन की विशेषताएं हैं (संभवतः लाखों अगर आरजीबी, तीव्रता, आदि के साथ अरबों पिक्सेल नहीं हैं) और यदि आपके पास सटीक लेबल हैं, तो यह शोर डेटा नहीं है। इन दिनों कैमरे बहुत अच्छे हैं और वे कुछ भी गलत नहीं माप रहे हैं। इंटरनेट के लिए धन्यवाद, अब हमारे पास बहुत सटीक लेबल वाली छवियां हैं। एक गहरा नेटवर्क मनमाने ढंग से जटिल कार्यों को व्यक्त कर सकता है, जो शोर डेटा के साथ एक समस्या है क्योंकि आप बहुत आसानी से शोर को रोक सकते हैं, इसलिए कई सीखने के तरीके जटिल मॉडल को दंडित करने के लिए करते हैं। छवि मान्यता के मामले में, हालांकि, वास्तविक कार्य वास्तव में बहुत जटिल लगता है, हमें पता नहीं है कि कार्यात्मक रूप कैसा दिखता है, और हम यह भी नहीं जानते कि कई मामलों में प्रासंगिक विशेषताएं क्या हैं।

इसका मतलब यह नहीं है कि आप छवियों के साथ कुछ भी नहीं होने वाले कार्यों को सीखने के लिए गहरे नेटवर्क का उपयोग नहीं कर सकते हैं। आपको बस डाउनसाइड्स के बारे में बहुत सावधान रहने की जरूरत है, ज्यादातर यह कि यह बहुत अधिक होने का खतरा है, लेकिन यह भी कि यह कम्प्यूटेशनल रूप से महंगा है और प्रशिक्षित करने के लिए एक लंबा समय लग सकता है (इन दिनों समानांतर और GPU के साथ एक समस्या नहीं है)। अन्य नकारात्मक पक्ष यह है कि आपके पास कोई मॉडल व्याख्या करने के लिए बहुत कम है, जो छवि वर्गीकरण के लिए वास्तव में मायने नहीं रखता है। हम सिर्फ एक चिंपांजी और एक ऑरंगुटान के बीच अंतर को पहचानने के लिए कंप्यूटर प्राप्त करने की कोशिश कर रहे हैं। सूत्र की मानवीय समझ मायने नहीं रखती है। अन्य डोमेन, विशेष रूप से चिकित्सा निदान, नीति अनुसंधान, आदि के लिए, आप चाहते हैं या मानव समझ की आवश्यकता हो सकती है।


5

यकीन है कि आप छवि या भाषण मान्यता के अलावा कई समस्याओं के लिए गहरे तंत्रिका नेटवर्क का उपयोग कर सकते हैं। समस्या यह है कि क्या आपको वास्तव में इसकी आवश्यकता है।

डीप न्यूरल नेटवर्क एक साधारण एमएलपी की तुलना में कहीं अधिक शक्तिशाली होते हैं हालांकि वे अधिक संसाधन भी लेते हैं और विकसित करने में अधिक कठिन होते हैं। इस प्रकार वे वास्तव में जटिल डोमेन में उपयोग किए जाते हैं। आप उन्हें आसान समस्याओं को हल करने के लिए उपयोग कर सकते हैं लेकिन आमतौर पर सरल मॉडल भी अच्छे परिणाम प्राप्त करते हैं।

आसान समस्याओं के लिए गहरे तंत्रिका नेटवर्क का उपयोग करना मक्खियों को बाज़ू के साथ मारने जैसा होगा, यकीन है कि आप उन्हें मार देंगे लेकिन क्या आप एक सरल तरीका नहीं खोज सकते?


2
यह एक गैर जवाब है। क्या आसान है क्या मुश्किल है? शेयर बाजार की भविष्यवाणी / सीमित उदाहरणों से अतिरिक्त / ... इन सभी में बहुत सारी कठिन समस्याएँ अच्छी हैं?
1950 में seanv507

मैंने यह नहीं कहा है कि गहरे तंत्रिका नेटवर्क कुछ भी हल कर सकते हैं। मेरा मतलब है कि वे उन जटिल डोमेन में उपयोग किए जाते हैं जहां आपके पास बड़ी संख्या में प्रविष्टियां होती हैं। मुझे पता है कि वे हर समस्या का समाधान नहीं कर सकते हैं, लेकिन इस सवाल का कोई मतलब नहीं है। यह मुद्दा जोर पकड़ रहा है कि उन्हें छवि / भाषण मान्यता के अलावा अन्य समस्याओं के लिए लागू किया जा सकता है, लेकिन उनके पास उन मामलों में विचार करने लायक मूल्य नहीं है, जहां अन्य मॉडल लागू किए जा सकते हैं।
द्विवेदीवाद

5

मैं दाविदवाद के उत्तर से सहमत हूं। लेकिन मुझे यह भी लगता है कि छवियों के लिए गहरे तंत्रिका नेटवर्क का अनुप्रयोग यह है कि छवियों (और, अधिक महत्वपूर्ण बात, लेबल वाली छवियां) इकट्ठा करने के लिए अपेक्षाकृत सस्ती हैं। अन्य डोमेन में, बड़े पैमाने पर डेटा एकत्र करना बहुत महंगा हो सकता है, खासकर एक विशिष्ट औद्योगिक या सरकारी उद्यम की बाधाओं के भीतर। इस मुद्दे को जोड़ते हुए यह है कि कई अनुप्रयोगों में, ब्याज की घटना अपेक्षाकृत दुर्लभ है, इसलिए इससे सीखने के लिए अनमोल कुछ उदाहरण होंगे, इसलिए अपेक्षाकृत बड़े पैमाने पर डेटा संग्रह के प्रयास से कुछ वर्ग के सदस्यों की संख्या कम हो सकती है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.