"में श्रेणीबद्ध अभ्यावेदन की स्केलेबल के चलते किसी सीखने के लिए Convolutional गहरे विश्वास नेटवर्क ली एट द्वारा"। अल। ( पीडीएफ ) रूपांतरण डीबीएन प्रस्तावित हैं। इसके अलावा छवि वर्गीकरण के लिए विधि का मूल्यांकन किया जाता है। यह तार्किक लगता है, क्योंकि प्राकृतिक स्थानीय छवि विशेषताएं हैं, जैसे छोटे कोने और किनारे आदि।
में " के चलते किसी सुविधा convolutional गहरे विश्वास नेटवर्क का उपयोग कर ऑडियो वर्गीकरण के लिए सीखने ली एट द्वारा"। अल। इस पद्धति को विभिन्न प्रकार के वर्गीकरणों में ऑडियो के लिए लागू किया जाता है। स्पीकर पहचान, लिंग इंडेंटिफिकेशन, फोन वर्गीकरण और कुछ संगीत शैली / कलाकार वर्गीकरण।
ऑडियो के लिए इस नेटवर्क के जटिल भाग की व्याख्या कैसे की जा सकती है, जैसे कि इसे किनारों के रूप में छवियों के लिए समझाया जा सकता है?