ज्ञान भूमिकाएं अब कौन सी भूमिका निभाती हैं और भविष्य में क्या निभाएंगी?


13

आजकल, आर्टिफिशियल इंटेलिजेंस लगभग मशीन लर्निंग, विशेष रूप से डीप लर्निंग के बराबर लगता है। कुछ लोगों ने कहा है कि इस क्षेत्र में गहरी शिक्षा मानव विशेषज्ञों को बदल देगी, जो परंपरागत रूप से फीचर इंजीनियरिंग के लिए बहुत महत्वपूर्ण है। कहा जाता है कि दो सफलताओं गहरी सीखने के उदय का आधार: एक हाथ, तंत्रिका विज्ञान, और पर neuroplasticityविशेष रूप से, हमें बताता है कि मानव मस्तिष्क की तरह, जो अत्यधिक प्लास्टिक है, कृत्रिम नेटवर्क का उपयोग लगभग सभी कार्यों के लिए किया जा सकता है; दूसरी ओर, कम्प्यूटेशनल पावर में वृद्धि, विशेष रूप से GPU और FPGA की शुरूआत ने, शानदार तरीके से एल्गोरिथम खुफिया को बढ़ावा दिया है, और दशकों पहले बनाए गए मॉडल को बेहद शक्तिशाली और बहुमुखी बना दिया है। मैं जोड़ूंगा कि पिछले वर्षों में जमा हुआ बड़ा डेटा (ज्यादातर लेबल डेटा) भी प्रासंगिक है।

इस तरह के विकास कंप्यूटर दृष्टि (और आवाज की पहचान) को एक नए युग में लाते हैं, लेकिन प्राकृतिक भाषा प्रसंस्करण और विशेषज्ञ प्रणालियों में, स्थिति बहुत अधिक नहीं बदली है।

तंत्रिका नेटवर्क के लिए सामान्य ज्ञान प्राप्त करना एक लंबा क्रम लगता है, लेकिन अधिकांश वाक्यों, वार्तालापों और लघु ग्रंथों में ऐसे संदर्भ होते हैं जिन्हें पृष्ठभूमि के विश्व ज्ञान से खींचा जाना चाहिए। इस प्रकार आर्टिफिशियल इंटेलिजेंस के लिए ज्ञान रेखांकन का बहुत महत्व है। ज्ञान जालों के निर्माण में तंत्रिका नेटवर्क का उपयोग किया जा सकता है, लेकिन ऐसा लगता है कि तंत्रिका नेटवर्क मॉडल को इन निर्मित ज्ञान अड्डों का उपयोग करने में कठिनाई होती है।

मेरे प्रश्न हैं:

  1. क्या ज्ञान का आधार (उदाहरण के लिए, "ज्ञान ग्राफ", जैसा कि Google द्वारा बनाया गया है) AI में एक आशाजनक शाखा है? यदि हां, तो किन तरीकों से केबी मशीन सीखने को सशक्त बना सकता है? हम एनएलयू और एनएलजी में असतत अव्यक्त चर को कैसे शामिल कर सकते हैं?

  2. डीएल के वर्चस्व वाले युग में जीवित रहने के लिए, ज्ञान का आधार (या छतरी शब्द प्रतीकात्मक दृष्टिकोण) की दिशा कहाँ है? क्या वुल्फरम -जैसे z गतिशील ज्ञान का आधार नई दिशा है? या कोई नई दिशा?

क्या मुझे कुछ मौलिक, या कुछ विचार याद आ रहे हैं जो इन मुद्दों को संबोधित करते हैं?


मैंने एक प्रमुख आईटी कंपनी के लिए काम किया जो एक समय में AI उत्पादों की मार्केटिंग करती थी। एक तंत्रिका नेटवर्क दृष्टिकोण के साथ समस्या यह है कि प्रति sey ज्ञान का आधार नहीं है। तो किसी भी प्रकार के नियमों के बिना, एक तंत्रिका नेटवर्क के लिए "क्यों" की व्याख्या करना असंभव है। एक तंत्रिका नेटवर्क को प्रशिक्षित करना, फिर नियम तैयार करना जो नेटवर्क को डुप्लिकेट करता है, आपको ऐसे उत्तर देगा। लेकिन मशीन लर्निंग का कोई रूप नहीं है जो अब इस तरह के व्यवहार में सक्षम है।
मैक्सविले

हाँ। हमारी कंपनी में केवल NN द्वारा समर्थित चिटचैट बॉट बहुत ही बेवकूफ है।
लर्नर जांग

मुझे यह पेपर मिला: arxiv.org/abs/1702.01932
लेरन झांग

जवाबों:


4

सबसे पहले, मैं ज्ञान के आधार और (दीप) मशीन लर्निंग के बीच मुख्य अंतर को इंगित करना चाहूंगा, खासकर जब मुख्य ध्यान "एआई" पर है "डेटा साइंस" नहीं:

  • एनएन एक ब्लैक बॉक्स की तरह हैं; यहां तक ​​कि अगर वे एक डेटासेट सीखते हैं और समस्या डोमेन पर सामान्यीकरण की शक्ति प्राप्त करते हैं, तो आप कभी नहीं जान पाएंगे कि वे कैसे काम कर रहे हैं। यदि आप विकसित मॉडल के विवरण की छानबीन करते हैं, तो आप जो कुछ भी देखते हैं वह अंक, वजन, खराब और मजबूत कनेक्शन और ट्रांसफ़ॉर्म फ़ंक्शन हैं। प्रशिक्षण चरण से पहले "सुविधा निष्कर्षण" कदम सचमुच आपको बताता है: "हे मानव, अपनी जटिल दुनिया के साथ पर्याप्त है, चलो शून्य और लोगों को शुरू करें"। डीएल के मामले में, यह बदतर है! हम यह भी नहीं देखते हैं कि चयनित और प्रभावी विशेषताएं क्या हैं। मैं एक डीएल विशेषज्ञ नहीं हूं, लेकिन जितना मुझे पता है, डीएल का ब्लैक बॉक्स गहरा है! लेकिन ज्ञान के आधार मानव-अनुकूल भाषा में लिखे गए हैं। ज्ञान संचय चरण के बाद, आप संस्थाओं के बीच सभी कनेक्शन देख सकते हैं, और अधिक महत्वपूर्ण, आप उन कनेक्शनों की व्याख्या कर सकते हैं। यदि आप ज्ञान के आधार में एक तार काटते हैं, तो आपका मॉडल अपनी शक्ति का सिर्फ एक हिस्सा खो देगा, और आपको पता है कि वास्तव में यह क्या खो देगा; उदाहरण के लिए "सोलर सिस्टम" नोड से "प्लूटो" नोड को डिस्कनेक्ट करने के बाद, अपने मॉडल को बताएगा कि डेग्रसे टायसन ने हमें क्या बताया। लेकिन एक एमएल मॉडल में, यह इसे एक शुद्ध बेकार में बदल सकता है: यदि आप न्यूरॉन संख्या 14 और 47 के बीच एक एनएन मॉडल में इस्तेमाल किए गए कनेक्शन के साथ छेड़छाड़ करते हैं तो क्या होता है, यह भविष्यवाणी करने के लिए कि कौन से ग्रह सौर प्रणाली से संबंधित हैं ?!

  • एमएल मॉडल केवल डेटा का एक शिलालेख है। उनके पास अनुमान की शक्ति नहीं है, और वे आपको एक नहीं देते हैं। ज्ञान का आधार दूसरी ओर पूर्व ज्ञान से अनुमान के लिए सक्षम है जैसा कि आपने अपने प्रश्न में संकेत दिया था। यह दिखाया गया है कि DL मॉडल जिन्हें छवि वर्गीकरण डेटा के साथ प्रशिक्षित किया गया है, को ध्वनि पहचान समस्या पर भी लागू किया जा सकता है। लेकिन इसका मतलब यह नहीं है कि DL मॉडल छवियों के क्षेत्र में आवाज़ के क्षेत्र में अपना पूर्व ज्ञान लागू कर सकता है।

  • आपको पारंपरिक एमएल एल्गोरिदम के लिए किलो डेटा और डीएल वालों के लिए टन डेटा चाहिए। लेकिन डेटासेट का एक भी उदाहरण आपके लिए एक सार्थक ज्ञान आधार तैयार करेगा।

एनएलपी में दो मुख्य शोध विषय हैं: मशीन अनुवाद और प्रश्न का उत्तर देना। व्यावहारिक रूप से यह दिखाया गया है कि DL मशीन अनुवाद की समस्याओं के साथ महत्वपूर्ण रूप से काम करता है, लेकिन चुनौती का जवाब देने वाले प्रश्न में तरह तरह के बेवकूफ काम करता है, विशेष रूप से जब मानव-मशीन वार्तालाप में शामिल विषयों का डोमेन व्यापक है। नॉलेज बेस मशीनी अनुवाद के लिए कोई अच्छा विकल्प नहीं है, लेकिन संभवत: एक अच्छे प्रश्न का उत्तर देने वाली मशीन की कुंजी है। चूँकि मशीनी अनुवाद में जो बात होती है वह केवल एक पाठ का अनुवादित संस्करण है (और मुझे इसकी परवाह नहीं है कि पृथ्वी पर मशीन ने ऐसा कैसे किया है जहाँ तक यह सच है) लेकिन समस्या का जवाब देने में, मुझे तोते की आवश्यकता नहीं है उसी जानकारी को दोहराता है जो मैंने उसे दिया था, लेकिन एक बुद्धिमान प्राणी जो मुझे "सेब खाने योग्य है" के बाद मैं उसे बताता हूं कि "सेब एक फल है" और "


सभी फल खाने योग्य होते हैं, इसलिए जब तक वे रूपक नहीं होते, ऐसे फल "किसी के श्रम" के होते हैं। (फिर, हम "खा" एक रूपक अर्थ में, जैसे कि जब एक एक "स्वादिष्ट" ढेर जवाब निगल और उसकी सामग्री को हज़म के रूप में इस्तेमाल कर सकते हैं,)
DukeZhou
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.