क्या वैज्ञानिक जानते हैं कि कृत्रिम तंत्रिका नेटवर्क के अंदर क्या हो रहा है?


69

क्या वैज्ञानिकों या अनुसंधान विशेषज्ञों को रसोई से पता है कि कम से कम लाखों कनेक्शनों के साथ जटिल "गहन" तंत्रिका नेटवर्क के अंदर क्या हो रहा है? क्या वे इसके पीछे की प्रक्रिया को समझते हैं (जैसे कि अंदर क्या हो रहा है और यह वास्तव में कैसे काम करता है), या यह बहस का विषय है?

उदाहरण के लिए यह अध्ययन कहता है:

हालाँकि इस बात की कोई स्पष्ट समझ नहीं है कि वे इतना अच्छा प्रदर्शन क्यों करते हैं, या उन्हें कैसे बेहतर बनाया जा सकता है।

तो क्या इसका मतलब यह है कि वैज्ञानिक वास्तव में नहीं जानते कि जटिल नेटवर्क मॉडल कैसे काम करते हैं?


" वे इतना अच्छा प्रदर्शन क्यों करते हैं " - वे वास्तव में अच्छा प्रदर्शन नहीं करते हैं। अधिकांश नई तकनीक के साथ, विफलताओं को कम करके आंका जाता है।
टॉम ज़ातो

जवाबों:


51

कई दृष्टिकोण हैं जो एक प्रशिक्षित तंत्रिका नेटवर्क को "ब्लैक बॉक्स" की तरह अधिक व्याख्यात्मक और कम बनाने के लिए हैं, विशेष रूप से प्रासंगिक तंत्रिका नेटवर्क जो आपने उल्लेख किया है।

सक्रियण और परत भार की कल्पना करना

सक्रियण विज़ुअलाइज़ेशन पहला स्पष्ट और सीधा-आगे है। ReLU नेटवर्क के लिए, आमतौर पर सक्रियता अपेक्षाकृत अधिक घनी और घनी दिखना शुरू हो जाती है, लेकिन जैसे-जैसे प्रशिक्षण आगे बढ़ता है आम तौर पर गतिविधियाँ अधिक विरल हो जाती हैं (अधिकांश मान शून्य होते हैं) और स्थानीयकृत हो जाते हैं। यह कभी-कभी दिखाता है कि किसी छवि को देखने पर वास्तव में एक विशेष परत किस पर केंद्रित है।

सक्रियण पर एक और महान काम जिसका मैं उल्लेख करना चाहूंगा, वह है गहरा जो प्रत्येक परत पर प्रत्येक न्यूरॉन की प्रतिक्रिया दिखाता है, जिसमें पूलिंग और सामान्यीकरण की परतें शामिल हैं। यहां बताया गया है कि वे इसका वर्णन कैसे करते हैं :

संक्षेप में, हमने कुछ अलग-अलग तरीकों को इकट्ठा किया है जो आपको "ट्राइंगुलेट" करने की अनुमति देते हैं जो एक न्यूरॉन ने सीखा है, जो आपको समझने में मदद कर सकता है कि DNN कैसे काम करता है।

दूसरी आम रणनीति वज़न (फ़िल्टर) की कल्पना करना है। ये आमतौर पर पहली CONV परत पर सबसे अधिक व्याख्या करने योग्य होते हैं जो सीधे कच्चे पिक्सेल डेटा को देख रहे हैं, लेकिन यह संभव है कि नेटवर्क में फ़िल्टर वज़न को भी गहरा दिखाया जाए। उदाहरण के लिए, पहली परत आम तौर पर गैबर जैसे फिल्टर सीखती है जो मूल रूप से किनारों और ब्लब्स का पता लगाते हैं।

पहली परत फ़िल्टर

सम्यक् प्रयोग

यहाँ विचार है। मान लीजिए कि एक ConvNet एक कुत्ते के रूप में एक छवि को वर्गीकृत करता है। हम कैसे निश्चित हो सकते हैं कि यह वास्तव में पृष्ठभूमि या कुछ अन्य विविध वस्तु से कुछ प्रासंगिक संकेतों के विपरीत कुत्ते पर उठा रहा है?

यह जांचने का एक तरीका है कि छवि का कौन सा हिस्सा कुछ वर्गीकरण की भविष्यवाणी से आ रहा है, ब्याज की श्रेणी (उदाहरण के लिए कुत्ते वर्ग) की संभावना को साजिश रचने की स्थिति के रूप में है। यदि हम छवि के क्षेत्रों पर पुनरावृत्ति करते हैं, तो इसे सभी शून्य के साथ बदलें और वर्गीकरण परिणाम की जांच करें, हम एक विशेष छवि पर नेटवर्क के लिए सबसे महत्वपूर्ण क्या है के 2-आयामी गर्मी मानचित्र का निर्माण कर सकते हैं। इस दृष्टिकोण का उपयोग मैथ्यू ज़ाइलर के विज़ुअलाइज़िंग और अंडरस्टैंडिंग कन्वॉन्शनल नेटवर्क में किया गया है (जो आप अपने प्रश्न में देखें):

रोड़ा प्रयोग

deconvolution

एक अन्य दृष्टिकोण एक छवि को संश्लेषित करना है जो एक विशेष न्यूरॉन को आग लगाने का कारण बनता है, मूल रूप से न्यूरॉन की तलाश है। यह विचार वजन के संबंध में सामान्य ढाल के बजाय, छवि के संबंध में ढाल की गणना करना है। तो आप एक लेयर चुनें, ग्रेडिएंट को सेट करें, एक न्यूरॉन के लिए एक को छोड़कर सभी शून्य हो और छवि को बैकप्रॉप करें।

डेकोनव वास्तव में एक अच्छे दिखने वाले चित्र बनाने के लिए निर्देशित बैकप्रॉपैजेशन नामक कुछ करता है , लेकिन यह सिर्फ एक विवरण है।

अन्य तंत्रिका नेटवर्क के समान दृष्टिकोण

फ़ोरम की सिफारिश इस पद के लिए करपथी ने की , जिसमें उन्होंने रिक्रिएंट न्यूरल नेटवर्क्स (RNN) के साथ बहुत भूमिका निभाई। अंत में, वह यह देखने के लिए एक समान तकनीक लागू करता है कि वास्तव में न्यूरॉन्स क्या सीखते हैं:

इस छवि में हाइलाइट किया गया न्यूरॉन URL के बारे में बहुत उत्साहित लगता है और URL के बाहर बंद हो जाता है। LSTM इस न्यूरॉन का उपयोग यह याद रखने के लिए कर सकता है कि यह URL के अंदर है या नहीं।

निष्कर्ष

मैंने अनुसंधान के इस क्षेत्र में परिणामों का केवल एक छोटा सा अंश का उल्लेख किया है। यह बहुत सक्रिय है और नए तरीके हैं जो प्रत्येक वर्ष तंत्रिका नेटवर्क के आंतरिक कामकाज के लिए प्रकाश डालते हैं।

आपके प्रश्न का उत्तर देने के लिए, हमेशा कुछ ऐसा होता है जिसे वैज्ञानिक अभी तक नहीं जानते हैं, लेकिन कई मामलों में उनके पास एक अच्छी तस्वीर (साहित्यिक) है जो अंदर चल रहा है और कई विशेष प्रश्नों का उत्तर दे सकता है।

मुझे आपके प्रश्न का उद्धरण बस सटीकता सुधार के अनुसंधान के महत्व पर प्रकाश डाला गया है, लेकिन नेटवर्क की आंतरिक संरचना के रूप में अच्छी तरह से। जैसा कि मैट ज़िलर इस बात में बताते हैं , कभी-कभी एक अच्छा विज़ुअलाइज़ेशन बेहतर सटीकता के लिए, बदले में, नेतृत्व कर सकता है।


क्या दृश्यम ज्ञान है? या कि अज्ञानता के लिए सिर्फ एक फैशनेबल समाधान है? शायद गणितीय विकास वह क्षेत्र है जिसमें सबसे अधिक कठोरता और क्षमता का अभाव है।
फौच्रिशियन

1
@FauChristian आप इस बिंदु को याद कर रहे हैं। एक तंत्रिका नेटवर्क के अंदर वजन और सभी गणित ऑप्स को ठीक विधानसभा कोड की तरह ही जाना जाता है। यह सवाल से बाहर है। विज़ुअलाइज़िंग समझने की अनुमति देता है कि कुछ ऑप्स क्यों हो रहे हैं और अच्छे प्रदर्शन के लिए नेतृत्व कर रहे हैं। एक बार फिर, क्लासिक कंप्यूटर विज्ञान एल्गोरिदम की तरह। इसके अलावा, मैं आपको उत्तर में उल्लेख किया गया है कि आपको Zieler द्वारा पेपर पढ़ने के लिए प्रोत्साहित किया जाता है।
मैक्सिमम

1
मैंने उन बिंदुओं को याद नहीं किया, उन्हें एक स्नातक के रूप में अध्ययन किया। मैं हालांकि अपनी टिप्पणी में आलसी था। गुठली का प्रतिनिधित्व करने वाले बी एंड डब्ल्यू ग्रिड केवल इस बात में दिलचस्प है कि यह लहराती किनारे का पता लगाने की अवस्था के कुछ अराजक मैट्रिक्स को दर्शाता है, जो इसे समझने के लिए अराजकता को चिह्नित करने की आवश्यकता को दर्शाता है। उनके आकार वितरण, कोणीय वितरण और तिरछा वितरण क्या हैं? क्या ये वितरण इंगित करते हैं (क) कुछ डेटा सेटों के लिए विशिष्ट ओवर-फिट (बी) एक सामान्य पैटर्न जिसे कार्यात्मक ब्लॉक द्वारा अधिक कम्प्यूटेशनल दक्षता से बदला जा सकता है। ~~ एक बार दृश्य से नहीं बता सकते।
फौश्रीशियन

1
ठीक है, इन सभी वितरण (और कई-कई अन्य) की गणना यहां नहीं की गई है। इसका मतलब यह नहीं है कि वे नहीं कर सकते हैं या नहीं करना चाहिए गणना की। इसका अर्थ यह भी नहीं है कि मॉडल की व्याख्या का विज़ुअलाइज़ेशन से कोई लेना-देना नहीं है। मैं एक बार फिर आपको Zieler द्वारा अल में "विज़ुअलाइज़िंग एंड अंडरस्टैंडिंग कन्वर्सेशनल नेटवर्क" पढ़ने के लिए प्रोत्साहित करता हूँ, जहाँ लेखक इस पर विस्तार से चर्चा करते हैं।
मैक्सिम

लैब में हमारे पास है। मेरे सहयोगी कुछ कोड उदाहरणों के माध्यम से भागे। मैं इसे आँकड़े की ओर से देखूँगा। धन्यवाद।
फॉच्रिशियन

27

यह इस बात पर निर्भर करता है कि आपका क्या मतलब है "क्या हो रहा है"।

वैचारिक रूप से, हाँ: ANN nonlinear प्रतिगमन करते हैं। ANN के वेट मैट्रिक्स / एक्टिवेशन फंक्शन (एस) द्वारा दर्शाई गई वास्तविक अभिव्यक्ति का प्रतीकात्मक रूप में विस्तार किया जा सकता है (जैसे कि 1/1 )।1/1+e1/1+e

हालांकि, अगर 'पता' से आप कुछ विशिष्ट (ब्लैक बॉक्स) एएनएन के उत्पादन की भविष्यवाणी करते हैं , तो कुछ अन्य तरीकों से, तो बाधा एक एएनएन में अराजकता की उपस्थिति है जिसमें स्वतंत्रता की उच्च डिग्री है

विज़ुअलाइज़ेशन के माध्यम से एएनएन को समझने पर होड लिप्सन द्वारा हाल ही में कुछ अपेक्षाकृत काम किया गया है ।


13

लघु उत्तर नहीं है

मॉडल व्याख्याशीलता वर्तमान शोध का एक अति-सक्रिय और हाइपर-हॉट क्षेत्र है (पवित्र कंघी बनानेवाले की रेती, या कुछ और), जिसे विभिन्न कार्यों में गहन शिक्षण मॉडल की सफलता (अक्सर जबरदस्त) की वजह से हाल ही में आगे नहीं लाया गया है; ये मॉडल वर्तमान में केवल ब्लैक बॉक्स हैं, और हम स्वाभाविक रूप से इसके बारे में असहज महसूस करते हैं ...

इस विषय पर कुछ सामान्य (और हाल ही में दिसंबर 2017 के अनुसार) संसाधन हैं:

और अधिक व्यावहारिक स्तर (कोड आदि) पर:

हाल ही में, गहरी सीखने वाले तंत्रिका जाल के लिए एक अधिक सैद्धांतिक आधार का निर्माण शुरू करने के लिए ब्याज की वृद्धि हुई है। इस संदर्भ में, प्रख्यात सांख्यिकीविद् और कम्प्रेसिव सेंसिंग अग्रणी डेविड डोनोहो ने हाल ही में (पतन 2017) स्टैनफोर्ड, थ्योरी ऑफ़ डीप लर्निंग (STATS 385) में एक पाठ्यक्रम की पेशकश शुरू की , जिसमें लगभग सभी सामग्री ऑनलाइन उपलब्ध हैं; यह अत्यधिक की सिफारिश की है ...

अद्यतन :


नमस्ते। यह एक अच्छा जवाब लगता है, लेकिन आपको इसे साफ करने और थोड़ा सा व्यवस्थित करने की आवश्यकता है। पहला संसाधन सबसे अधिक सहायक और सामान्य होना चाहिए। फिर आप अधिक विशिष्ट संसाधनों और शोध पत्रों, आईएमएचओ को सूचीबद्ध कर सकते हैं। और बाद में आप उदाहरण के लिए ट्विटर थ्रेड या जो भी सूचीबद्ध कर सकते हैं।
नबर

10

सुनिश्चित नहीं है कि यह वही है जिसे आप खोज रहे हैं, लेकिन जब वे सफेद शोर से तंग आ चुके थे तो Google ने नेटवर्क से चित्र निकाले।

इंसेप्शनिज्म देखें : न्यूरल नेटवर्क्स (गूगल रिसर्च ब्लॉग) में डीपर जाना

इस तरह का प्रतिनिधित्व करता है कि नेटवर्क क्या जानता है।


8

मुझे डर है कि मेरे पास विशिष्ट प्रशंसा पत्र नहीं हैं, लेकिन मैंने एंड्रयू एनजी और जेफ्री हिंटन जैसे विशेषज्ञों द्वारा उद्धरण देखे / सुने हैं जहां वे स्पष्ट रूप से कहते हैं कि हम वास्तव में तंत्रिका नेटवर्क को नहीं समझते हैं। यही है, हम कुछ समझते हैं कि वे कैसे काम करते हैं (उदाहरण के लिए, पीछे प्रचार के पीछे का गणित) लेकिन हम वास्तव में यह नहीं समझते हैं कि वे क्यों काम करते हैं। यह एक सूक्ष्म अंतर की तरह है, लेकिन बात यह है कि नहीं, हम बहुत गहरे विवरणों को नहीं समझते हैं कि आप वास्तव में वजन के एक झुंड से कैसे जाते हैं, कहते हैं, एक बिल्ली को गेंद से खेलते हुए पहचानते हैं।

कम से कम छवि मान्यता के संदर्भ में, मैंने जो सबसे अच्छा स्पष्टीकरण सुना है वह यह है कि एक तंत्रिका नेटवर्क की क्रमिक परतें अधिक परिष्कृत विशेषताएं सीखती हैं, जो पहले के स्तरों से अधिक बारीक विशेषताओं से बनी होती हैं। यह कहना है, पहली परत "किनारों" या "सीधी रेखाओं" को पहचान सकती है। अगली परत फिर "बॉक्स", या "त्रिकोण" जैसी ज्यामितीय आकृतियों को सीख सकती है, और फिर एक उच्च परत उन "पहले" सुविधाओं के आधार पर "नाक" या "आंख" सीख सकती है, और फिर एक उच्च स्तरीय परत अभी भी "चेहरा" सीखती है। "आंख", "नाक", "जबड़ा" आदि से ऊपर, लेकिन यहां तक ​​कि जैसा कि मैं इसे समझता हूं, अभी भी काल्पनिक है और / या पूरी तरह से समझा नहीं गया है।


2
मुझे वास्तविक उद्धरण पढ़ने में दिलचस्पी होगी। व्यापक वैचारिक स्तर पर, "वे एक प्रतिगमन समस्या में त्रुटि को कम करने के लिए प्रशिक्षित यूनिवर्सल फ़ंक्शन सन्निकट हैं" क्यों
नीत्शेचियन

मैं देखूंगा कि क्या मैं उन्हें ट्रैक कर सकता हूं। मुझे पूरा यकीन है कि जियोफ्रे हिंटन का वह उद्धरण जो मैं सोच रहा हूं कि वह एक वीडियो में है .. या तो उसके कर्सरा क्लास से या कुछ वीडियो जो उसने यूट्यूब पर डाले हैं। अगर मैं इसे पा सकता हूं, तो मैं अपने उत्तर को संपादित करूंगा और इसे लिंक
करूंगा

मैं भूला नहीं हूँ। जब मुझे थोड़ा खाली समय मिलेगा तो मैं उन्हें खोजने की कोशिश करूँगा। मुझे लगता है कि मैं कम से कम एक व्यक्ति के बारे में सोच रहा हूं जो एक वीडियो से है जो एक कोर्टेरा कोर्स का हिस्सा है।
माइंडक्राइम

यह अध्ययन समान संदर्भ देने में मदद कर सकता है: 'हालांकि उन्हें इस बात की कोई स्पष्ट समझ नहीं है कि वे इतना अच्छा प्रदर्शन क्यों करते हैं, या उन्हें कैसे बेहतर बनाया जा सकता है।'
kenorb

4

यहाँ कार्लोस ई। पेरेज़ के प्रश्न का उत्तर दिया गया है कि गहरी शिक्षा के पीछे सिद्धांत क्या है?

[...]

डीप लर्निंग का अंतर्निहित गणित कई दशकों से अस्तित्व में है, हालांकि आज जो प्रभावशाली परिणाम हमें दिखाई दे रहे हैं, वे बहुत तेजी से हार्डवेयर, अधिक डेटा और तरीकों में वृद्धिशील सुधार का एक हिस्सा हैं।

सामान्य रूप से डीप लर्निंग को अनुकूलन समस्या के रूप में तैयार किया जा सकता है जहां उद्देश्य मॉडल त्रुटि का एक कार्य है। यह अनुकूलन समस्या यह समझना बहुत मुश्किल है कि मॉडल का पैरामीटर स्थान (यानी तंत्रिका नेटवर्क का वजन) अत्यधिक उच्च आयाम में एक समस्या की ओर जाता है। एक अनुकूलन एल्गोरिथ्म इस स्थान का पता लगाने में बहुत लंबा समय ले सकता है। इसके अलावा, एक असत्यापित विश्वास था कि समस्या गैर-उत्तल थी और संगणना हमेशा के लिए स्थानीय मिनीमा में अटक जाएगी।

[...]

मशीनों का सिद्धांत वास्तव में एक आकर्षित करने वाले या दूसरे शब्दों में क्यों जटिल पैटर्न को पहचानना सीखता है अभी भी अज्ञात है।

योग करने के लिए: हमारे पास कुछ विचार हैं, लेकिन हम निश्चित नहीं हैं।


3

क्या वैज्ञानिक जानते हैं कि कृत्रिम तंत्रिका नेटवर्क के अंदर क्या हो रहा है?

हाँ

क्या वैज्ञानिकों या अनुसंधान विशेषज्ञों को रसोई से पता है कि कम से कम लाखों कनेक्शनों के साथ जटिल "गहन" तंत्रिका नेटवर्क के अंदर क्या हो रहा है?

मुझे लगता है कि "रसोई से पता करने के लिए" का अर्थ है "विस्तार से जानने के लिए"?

मुझे आपको उपमाओं की एक श्रृंखला दें:

  1. क्या एक हवाई जहाज के इंजीनियर को रसोई से पता चलता है कि हवाई जहाज के अंदर क्या होता है?
  2. क्या एक चिप डिजाइनर को विस्तार से पता है कि उसने जो चिप (डिज़ाइन) बनाई है उसमें क्या होता है?
  3. क्या एक सिविल इंजीनियर को अपने द्वारा निर्मित घर के बारे में सब कुछ पता है?

शैतान विस्तार में है, लेकिन यहां एक महत्वपूर्ण बिंदु यह है कि यह कृत्रिम संरचनाओं के बारे में है। वे बेतरतीब ढंग से दिखाई नहीं देते हैं। आपको कुछ भी उपयोगी पाने के लिए बहुत सारे ज्ञान की आवश्यकता है। न्यूरल नेटवर्क्स के लिए, मैं कहूंगा कि मुख्य विचार (रोसेनब्लैट पर्सेप्ट्रॉन, 1957) के प्रकाशन से लेकर पहले आवेदन (यूएस पोस्टल सर्विस, 1989) तक लगभग 40 साल लग गए। और वहाँ से फिर से 13 साल के सक्रिय reserach के लिए वास्तव में प्रभावशाली सिस्टम (ImageNet 2012)।

हम सुपर सुपर को जानते हैं कि प्रशिक्षण कैसे काम करता है । क्योंकि इसे लागू करने की जरूरत है। इसलिए बहुत छोटी संरचना पर, हम इसे विस्तार से जानते हैं।

कंप्यूटर के बारे में सोचो। चिप डिजाइनर अच्छी तरह जानते हैं कि उनकी चिप कैसे काम करती है। लेकिन वे संभवतः केवल एक बहुत ही मोटा विचार करेंगे कि लिनक्स ऑपरेटिंग सिस्टम कैसे काम करता है।

एक अन्य उदाहरण भौतिकी और रसायन विज्ञान है: भौतिकी ब्रह्मांड की मूल शक्तियों का वर्णन करती है। क्या इसका मतलब है कि वे रसायन विज्ञान के बारे में सब कुछ जानते हैं? बिलकुल नहीं! एक "संपूर्ण" भौतिक विज्ञानी रसायन विज्ञान में सब कुछ समझा सकता है ... लेकिन यह बहुत बेकार होगा। उसे बहुत अधिक जानकारी की आवश्यकता होगी, अप्रासंगिक भागों को छोड़ने में सक्षम नहीं होना चाहिए। केवल इसलिए कि वह बहुत अधिक "ज़ूम इन" करता है - उन विवरणों पर विचार करता है जो व्यवहार में न तो दिलचस्प हैं और न ही महत्वपूर्ण हैं। कृपया ध्यान दें कि भौतिक विज्ञानी का ज्ञान गलत नहीं है। हो सकता है कि कोई इसे केमिस्ट से मिले ज्ञान को काट भी सकता है। लेकिन अणु सहभागिता की यह "उच्च-स्तरीय" समझ गायब है।

उन दो उदाहरणों से प्रमुख अंतर्दृष्टि अमूर्त परतें हैं: आप सरल संरचनाओं से जटिलता का निर्माण कर सकते हैं

और क्या?

हम अच्छी तरह से जानते हैं कि हमारे द्वारा डिज़ाइन किए गए तंत्रिका नेटवर्क के साथ सिद्धांत में क्या है :

  • एक तंत्रिका नेटवर्क जिसे गो खेलने के लिए डिज़ाइन किया गया है - चाहे कितना भी परिष्कृत हो - कभी भी शतरंज खेलने में सक्षम नहीं होगा। आप निश्चित रूप से, इसके चारों ओर एक और अमूर्त परत जोड़ सकते हैं और चीजों को जोड़ सकते हैं। लेकिन इस दृष्टिकोण को मनुष्य की आवश्यकता है।
  • बिल्लियों से कुत्तों को अलग करने के लिए डिज़ाइन किया गया एक तंत्रिका नेटवर्क जिसने केवल पुडल और फ़ारसी बिल्लियों को देखा है, संभवतः यॉर्कशायर टेरियर्स के लिए निर्णय लेने के लिए वास्तव में खराब प्रदर्शन करेगा।

ओह, और निश्चित रूप से हमारे पास तंत्रिका नेटवर्क के लिए विश्लेषणात्मक दृष्टिकोण हैं। मैंने अपने मास्टर्स थर्सिस को एनालिसिस और ऑप्टिमाइज़ेशन ऑफ कन्वेंशनल न्यूरल नेटवर्क आर्किटेक्चर के बारे में लिखा । इस संदर्भ में सीमा (स्थानीय व्याख्यात्मक मॉडल-अज्ञेय स्पष्टीकरण) अच्छा है:

यहाँ छवि विवरण दर्ज करें


1
उनमें से ज्यादातर जैविक मॉडल से प्रभावित हैं। यह कहते हुए कि वैज्ञानिकों ने एक समस्या के एक समारोह के रूप में एनएन का निर्माण किया है, यह विश्वास करना कठिन है ... खासकर जब किसी को भी पता नहीं है कि क्यों एक विशेष वास्तुकला या हाइपरपरमेटर्स का एक विशेष सेट अच्छी तरह से काम करता है एक भी समस्या ... मैं सटीक hyperparameters के बारे में बात नहीं कर रहा, लेकिन कोई भी क्या अनुमानित hyperparameters एक भी समस्या के लिए काम कर सकते हैं की एक सामान्य समझ (समस्या अच्छी तरह से परिभाषित किया गया है) .. है लगता है तो कोई वैज्ञानिकों को पता नहीं है कि अंदर क्या हो रहा है एक एन.एन.
दत्ता

शुरुआती दिन ऑटोमोबाइल / विमान इंजीनियरों के बारे में सोचें। क्या आप कहेंगे कि वे नहीं जानते कि उनके विमान / ऑटोमोबाइल के अंदर क्या हो रहा है, क्योंकि उन्होंने उन्हें नहीं बनाया, क्योंकि उनका आकार वायुगतिकीय नहीं था?
मार्टिन थॉमा

1
Ofc ... प्रौद्योगिकी की कमी के कारण कुछ नहीं जानना ... क्या सैद्धांतिक रूप से न जानने से कुछ अलग है..मैं मानता हूं कि यह हवाई जहाज के मामले में प्रौद्योगिकी था। यहाँ हम गणितीय रूप से प्रक्रिया करने में सक्षम नहीं हैं। भूल जाओ प्रौद्योगिकी
दत्ता

1

मैं बस कुछ जोड़ना चाहता था:

यह इस बात पर निर्भर करता है कि आपका वैज्ञानिक से क्या मतलब है:

मैं इलेक्ट्रिकल इंजीनियरिंग में पीएचडी का छात्र हूं और मैंने देखा कि इतने सारे शोधकर्ता एएनएन के साथ काम करते हैं, प्रतिगमन, भविष्यवाणी नियंत्रण, अनुकूली नियंत्रण और वर्गीकरण समस्याओं जैसी समस्याओं में।

आप स्पष्ट रूप से देख सकते हैं कि कोडिंग कौशल में उनकी कमी एक बड़ी कमी है, और वे वास्तव में काफी नहीं समझते हैं कि एक एएनएन के अंदर क्या चल रहा है, अब मैं डीप के बारे में भी बात नहीं कर रहा हूं , वे ADALINEs और ANFIS जैसे सरल सामान को समझने में संघर्ष करते हैं! आप सभी उन्हें कहते हैं: यह डेटा दे और यह अनुकूल होगा!


1
यद्यपि आप संभवतः सही रूप से सही हैं, आप कुछ वोट प्राप्त कर सकते हैं और संभवतः कुछ रचनात्मक मदद कर सकते हैं यदि आप अपने उत्तर को समाजशास्त्रीय अवलोकन के रूप में पढ़ने के बजाय एक पांडित्यपूर्ण टाईडर के रूप में लिखते हैं।
फ़ॉच्रिशियन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.