मशीन लर्निंग के लिए राजसी और गणितीय सिद्धांतों का होना इतना महत्वपूर्ण क्यों है?

25

मैं सोच रहा था, कि राजसी / सैद्धांतिक मशीन सीखना इतना महत्वपूर्ण क्यों है? एक मानव के रूप में एक व्यक्तिगत दृष्टिकोण से, मैं समझ सकता हूं कि राजसी मशीन सीखना महत्वपूर्ण क्यों होगा:

मनुष्य यह समझना पसंद करते हैं कि वे क्या कर रहे हैं, हम समझने के लिए सुंदरता और संतुष्टि पाते हैं।
एक सिद्धांत के दृष्टिकोण से, गणित मजेदार है
जब ऐसे सिद्धांत होते हैं जो चीजों के डिजाइन को निर्देशित करते हैं, तो यादृच्छिक अनुमान, अजीब परीक्षण और त्रुटि पर कम समय खर्च होता है। अगर हम समझते हैं, कहते हैं, वास्तव में तंत्रिका जाल कैसे काम करते हैं, तो शायद हम परीक्षण और त्रुटि की भारी मात्रा के बजाय उन्हें डिजाइन करने में बेहतर समय बिता सकते हैं जो अभी इसमें जाता है।
अधिक हाल ही में, यदि सिद्धांत स्पष्ट हैं और सिद्धांत भी स्पष्ट है, तो सिस्टम के लिए (उम्मीद) अधिक पारदर्शिता होनी चाहिए। यह अच्छा है क्योंकि अगर हम समझते हैं कि सिस्टम क्या काम कर रहा है, तो AI जोखिम है कि बहुत सारे लोग बहुत ज्यादा के बारे में प्रचार करते हैं तुरंत चले जाते हैं।
सिद्धांत दुनिया के लिए महत्वपूर्ण संरचनाओं को संक्षेप में प्रस्तुत करने और एक उपकरण का उपयोग करने के बजाय एक दूसरे के बजाय एक संक्षिप्त तरीका है।

हालांकि, क्या ये कारण वास्तव में मशीन लर्निंग के गहन सैद्धांतिक अध्ययन को सही ठहराने के लिए काफी मजबूत हैं? सिद्धांत की सबसे बड़ी आलोचना यह है कि क्योंकि ऐसा करने के लिए कठिन है, वे आम तौर पर कुछ बहुत ही प्रतिबंधित मामले का अध्ययन करते हैं या जिन मान्यताओं को अनिवार्य रूप से लाया जाना है, वे परिणामों को बेकार बनाते हैं। मुझे लगता है कि मैंने इसे एक बार तोर के निर्माता द्वारा एमआईटी में एक बात पर सुना था। टोर ने जो कुछ आलोचना सुनी है वह सैद्धांतिक तर्क है लेकिन अनिवार्य रूप से, लोग वास्तविक जीवन के वास्तविक परिदृश्यों के बारे में चीजों को साबित करने में कभी सक्षम नहीं हैं क्योंकि वे बहुत जटिल हैं।

इतनी कंप्यूटिंग शक्ति और डेटा के साथ इस नए युग में, हम अपने मॉडल का वास्तविक डेटा सेट और परीक्षण सेट के साथ परीक्षण कर सकते हैं। हम देख सकते हैं कि क्या चीजें अनुभववाद का उपयोग करके काम करती हैं। अगर हम इसके बजाय AGI या सिस्टम को प्राप्त कर सकते हैं जो इंजीनियरिंग और अनुभववाद के साथ काम करते हैं, तो क्या यह अभी भी मशीन सीखने के लिए राजसी और सैद्धांतिक औचित्य का पालन करने के लायक है, खासकर जब क्वांटिट सीमा को हासिल करना इतना मुश्किल है, लेकिन अंतर्ज्ञान और गुणात्मक उत्तर इतना आसान है। एक डेटा संचालित दृष्टिकोण के साथ प्राप्त? यह दृष्टिकोण शास्त्रीय आंकड़ों में उपलब्ध नहीं था, यही वजह है कि मुझे लगता है कि उन समय में सिद्धांत इतना महत्वपूर्ण था, क्योंकि गणित एकमात्र तरीका था जिससे हम यह सुनिश्चित कर सकते थे कि चीजें सही थीं या उन्होंने वास्तव में जिस तरह से हमने सोचा था कि उन्होंने जो किया था, वे काम करते हैं।

मैंने व्यक्तिगत रूप से हमेशा प्यार और विचार किया है और एक सैद्धांतिक दृष्टिकोण महत्वपूर्ण था। लेकिन वास्तविक डेटा और कंप्यूटिंग शक्ति के साथ चीजों को आज़माने में सक्षम होने की शक्ति ने मुझे आश्चर्यचकित कर दिया है यदि सैद्धांतिक खोज के उच्च प्रयास (और संभवतः कम पुरस्कार) अभी भी इसके लायक हैं।

क्या मशीन लर्निंग का सैद्धांतिक और राजसी खोज वास्तव में महत्वपूर्ण है?

— चार्ली पार्कर
स्रोत

"सिद्धांत के बिना, आप इस आशा पर भरोसा कर रहे हैं कि अनुभवजन्य परिणाम किसी भी नए डेटासेट पर लागू होते हैं, जिस पर आप एमएल तरीके लागू करेंगे। हालांकि, जब आपने अपने अनुभवजन्य परिणामों का अवलोकन किया तो कुछ संपत्तियों या मान्यताओं को धारण करना आवश्यक नहीं है। नए डेटासेट पर। "

— चार्ली पार्कर

17

इसका कोई सही जवाब नहीं है, लेकिन हो सकता है, "मॉडरेशन में सब कुछ।" जबकि मशीन सीखने में कई हालिया सुधार, यानी, ड्रॉपआउट, अवशिष्ट कनेक्शन, घने कनेक्शन, बैच सामान्यीकरण, विशेष रूप से गहरे सिद्धांत में निहित नहीं हैं (अधिकांश को कुछ पैराग्राफ में सही ठहराया जा सकता है), मुझे लगता है कि अंततः बस एक के लिए एक अड़चन है ऐसे परिणाम बहुत बड़ा प्रभाव डाल सकते हैं। कुछ बिंदु पर आपको बैठना होगा और अगली बड़ी छलांग लगाने के लिए कुछ अतिरिक्त सिद्धांत पर काम करना होगा। साथ ही, सिद्धांत अंतर्ज्ञान को निर्देशित कर सकता है क्योंकि यह एक मॉडल की गुणवत्ता या सीमाओं को एक उचित संदेह के भीतर साबित कर सकता है। यह कहने के लिए यह विशेष रूप से महत्वपूर्ण है कि, किसी विशेष समस्या के लिए SGD मोमेंटम से बेहतर है। सिद्धांत के बारे में यह अच्छी बात है: यह आपको समस्या को हल करने के लिए मजबूर करता है,

दिमाग में आने वाला बड़ा उदाहरण वेक्टर मशीनों का समर्थन है। वे मूल रूप से 60 के दशक की शुरुआत में वाप्निक और चेरोवेनेकिस द्वारा तैयार किए गए थे, लेकिन वास्तव में 90 के दशक की शुरुआत में जब वेपनिक और अन्य लोगों ने महसूस किया कि आप कर्नेल ट्रिक का उपयोग करके गैर-विहीन SVMs कर सकते हैं। वाप्निक और चेरोवेनेकिस ने भी वीसी आयाम के पीछे सिद्धांत पर काम किया, जो मशीन लर्निंग के लिए एक जटिलता उपाय के साथ आने का प्रयास है। मैं कुलपति आयाम के किसी भी व्यावहारिक अनुप्रयोग के बारे में नहीं सोच सकता, लेकिन मुझे लगता है कि एसवीएम का विचार संभवतः इस पर उनके काम से प्रभावित था। कर्नेल ट्रिक खुद हिल्बर्ट स्पेस के बारे में अमूर्त-बकवास गणित से आती है। यह कहना एक खिंचाव हो सकता है कि SVM के साथ आने के लिए इस सारगर्भित बकवास को जानना आवश्यक है, लेकिन, मुझे लगता है कि इसने संभवत: कुछ हद तक मदद की है, खासकर क्योंकि यह बहुत सारे गणितज्ञों ने मशीन सीखने के लिए उत्साहित किया।

ResNet के विषय पर, हाल ही में कुछ साफ-सुथरे काम किए गए हैं जो बताता है कि अवशिष्ट आर्किटेक्चर को वास्तव में 100s परतों की गहरी होने की आवश्यकता नहीं है। वास्तव में कुछ काम बताते हैं कि अवशिष्ट कनेक्शन RNN से बहुत मिलते-जुलते हैं, उदाहरण के लिए गैपिंग द बिडिंग इन रेजिडेंशल लर्निंग, रिक्रिएंट न्यूरल नेटवर्क्स एंड विजुअल कॉर्टेक्स ”, Liao et al। मुझे लगता है कि यह निश्चित रूप से इसे गहराई से देखने लायक बनाता है क्योंकि इससे पता चलता है कि यह सैद्धांतिक रूप से, कई परतों वाला रेसनेट वास्तव में अविश्वसनीय रूप से अक्षम और फूला हुआ है।

आरएनएन के लिए ढाल क्लिपिंग के विचार अब प्रसिद्ध पेपर " आवर्तक तंत्रिका नेटवर्क के प्रशिक्षण की कठिनाई पर " उचित थे - पास्कानु, एट। अल। जब आप संभवतः सभी सिद्धांत के बिना ढाल क्लिपिंग के साथ आ सकते हैं, तो मुझे लगता है कि यह समझने की दिशा में एक लंबा रास्ता तय करता है कि आरएनएन को कुछ फैंसी किए बिना प्रशिक्षित करने के लिए इतना कठिन क्यों है, विशेष रूप से डायनेमिक सिस्टम मैप्स के अनुरूपता ड्राइंग द्वारा (कागज के रूप में) )।

एन्ट्रॉपी स्टोचस्टिक ग्रेडिएंट डिसेंट तरीकों के बारे में बहुत उत्तेजना है । ये लैंग्विन गतिकी से प्राप्त हुए थे, और बहुत से सैद्धांतिक परिणाम शास्त्रीय सैद्धांतिक पीडीई सिद्धांत और सांख्यिकीय भौतिकी में दृढ़ता से निहित हैं। परिणाम आशाजनक हैं क्योंकि वे एक नए प्रकाश में, यह कैसे नुकसान समारोह के स्थानीय उतार-चढ़ाव में फंस जाता है के संदर्भ में, और कैसे एक स्थानीय रूप से नुकसान समारोह को सुचारू बनाने के लिए अधिक कुशल हो सकता है के रूप में एक नई रोशनी में डाली। यह समझने की दिशा में एक लंबा रास्ता तय करता है कि जब एसडब्ल्यूडी उपयोगी है और जब यह खराब व्यवहार करता है। यह ऐसा कुछ नहीं है जिसे आप विभिन्न प्रकार के मॉडल पर SGD की कोशिश करके अनुभवजन्य रूप से प्राप्त कर सकते हैं।

कागज में तंत्रिका नेटवर्क के गुणों को पहचानते हुए , लेखक संक्षेप में बताते हैं कि परतों के बीच उच्च लिपिचिट्ज़ स्थिरांक के कारण तंत्रिका नेटवर्क प्रतिकूल उदाहरणों के लिए संवेदनशील हैं (गणना के रूप में, एक छवि के स्लीपर गड़बड़ी के रूप में परिभाषित)। यह अभी भी अनुसंधान का एक सक्रिय क्षेत्र है और इसे केवल अधिक सैद्धांतिक व्युत्पत्तियों के माध्यम से बेहतर समझा जा सकता है।

टोपोलॉजिकल डेटा एनालिसिस का उदाहरण भी है , जिसके आसपास कम से कम एक कंपनी ( अयासदी ) का गठन किया गया है। यह एक विशेष रूप से दिलचस्प उदाहरण है क्योंकि इसके लिए इस्तेमाल की जाने वाली तकनीक इतनी विशिष्ट और सार है कि आज से भी, यह देखने के लिए बहुत समय लगेगा कि इस सिद्धांत के विचार कहां से समाप्त होते हैं। मेरी समझ यह है कि शामिल एल्गोरिदम की कम्प्यूटेशनल जटिलता काफी अधिक हो जाती है (लेकिन फिर 20 साल पहले भी तंत्रिका नेटवर्क के लिए समान रूप से उच्च थी)।

— एलेक्स आर।
स्रोत

7

इस सवाल का जवाब वास्तव में बहुत सरल है। मशीन लर्निंग मॉडल के पीछे सैद्धांतिक औचित्य के साथ हम कम से कम यह साबित कर सकते हैं कि जब कुछ अधिक या कम यथार्थवादी स्थितियां मिलती हैं, तो समाधान के लिए इष्टतमता की कुछ गारंटी होती है। इसके बिना, हमारे पास कोई गारंटी नहीं है। निश्चित रूप से, आप कह सकते हैं "चलो जाँचें कि क्या काम करता है और इसे विशेष समस्या के लिए उपयोग करें", लेकिन यह संभव नहीं है क्योंकि अनंत तरीके हैं कि आप किसी भी मशीन सीखने की समस्या को कैसे हल कर सकते हैं।

$Y$ $X$ $X + 42$ $X + 42.5$ $\sqrt{X - 42}$ $42$ $X$ $X+42$ $0$

— टिम
स्रोत

2

जाँच कर रहा है कि क्या आपका प्रशिक्षित मॉडल सत्यापन पर काम करता है और परीक्षण सेट पर्याप्त नहीं है? जैसे कि सैद्धांतिक सीमा की क्या गारंटी है अगर उनकी सीमा वास्तव में इस्तेमाल नहीं की जा सकती है?

— चार्ली पार्कर

6

X + c

$X + c$

c

$c$

(- \infty, \infty)

$(-\infty, \infty)$

5

बस सवाल देख रहा है: क्या मशीन लर्निंग का सैद्धांतिक और राजसी खोज वास्तव में महत्वपूर्ण है?

परिभाषित करें कि आपका क्या मतलब है "महत्वपूर्ण"। यदि आप किसी चीज़ का वर्णन करना चाहते हैं या किसी चीज़ को समझना चाहते हैं, तो एक दार्शनिक दृष्टिकोण से आ रहा है। कुछ हद तक जवाब में यह वैज्ञानिक या कुछ और होने के बीच का अंतर है। इसका व्यावहारिक हिस्सा अंतर्निहित प्रश्न से कोई सरोकार नहीं है। यदि कुछ साबित करना बहुत कठिन है, या अपने आप में यह साबित करना असंभव है, तो यह एक महत्वपूर्ण खोज है। (गोएडेल एट अल दर्ज करें।) लेकिन इसका मतलब यह नहीं है कि यह अप्रासंगिक है। यह एक व्यावहारिक दृष्टिकोण से कम से कम अप्रासंगिक लग सकता है। लेकिन इसे कम से कम प्रमुख महत्व और मूल्य के रूप में मान्यता दी जानी चाहिए।

एक सादृश्य पर विचार करें: एक पूरे के रूप में दवा (और उसके अतीत से) गैर वैज्ञानिक है। कुछ मायनों में यह वास्तव में कभी नहीं हो सकता है। यह एक ऐसा अनुशासन है जो पूरी तरह से इसके परिणाम से संचालित होता है। ज्यादातर मामलों में "सच्चाई" जैसा कुछ नहीं होता है। लेकिन यह पता चला है, कि कुछ हिस्से वास्तव में वैज्ञानिक हो सकते हैं - और यह वह जगह है जहाँ अधिकांश नियोजित प्रगति हो रही है।

एक और अत्यंत संक्षिप्त विवरण हो सकता है: सिद्धांत के बिना आप बहुत पैसा कमा सकते हैं। यदि यह "अधिक अच्छा" के लिए वास्तव में उपयोगी है, तो आपको इसके लिए नोबेल पुरस्कार भी मिल सकता है। लेकिन आपको कभी भी फील्ड्स मेडल नहीं मिलेगा।

— चेस्र्ब
स्रोत

1

+1 यह मुझे ओपी के लिए एक दिलचस्प जवाब लगता है, लेकिन आप इसे गैर-वैज्ञानिक के रूप में चिकित्सा पर विस्तृत करने के लिए कहेंगे। क्या यह पता लगाने की नैदानिक प्रक्रिया नहीं है कि एक रोगी कौन है, एक ऐसी प्रक्रिया जहां अंतर निदान (संदिग्ध रोगों की एक सैद्धांतिक अवधारणा) माना जाता है, और यह अनुमान लगाने के लिए डेटा एकत्र किया जाता है कि कौन सी बीमारी सबसे संभावित है? ...

— आईडब्ल्यूएस

(cont'd) ... क्या ऐसे पूर्वानुमान नहीं हैं, जहां डॉक्टर उपलब्ध आंकड़ों के आधार पर बीमारी के भविष्य के पाठ्यक्रम का अनुमान लगाने की कोशिश करते हैं, जो कि अनुवर्ती और अनुभवजन्य निष्कर्षों द्वारा जांची जा सकती है? और अंत में, क्या विज्ञान कुछ उच्च लेकिन विद्यमान सत्य की खोज है, या क्या हम सत्य के निर्माण का अनुमान लगाते हैं जो हम मानते हैं कि अभी मौजूद है?

— आईडब्ल्यूएस

वास्तव में चिकित्सा का सवाल थोड़ा गहरा है। विज्ञान मूल रूप से सिर्फ एक विधि या एक प्रक्रिया है। विज्ञान के लिए "काम" करने के लिए आपको मिथ्याकरण की अंतर्निहित संभावना के साथ समान जमीन पर परिकल्पना का परीक्षण करने की क्षमता है। संक्षेप में: यदि आप किसी सिद्धांत को गलत साबित नहीं कर सकते, तो यह गैर-वैज्ञानिक है। दवा के लिए इसके कई नैतिक निहितार्थ हैं और चूंकि आप एक ही समय में किसी का इलाज नहीं कर सकते हैं इसलिए विभिन्न विकल्पों की परिकल्पना परीक्षण वास्तव में कठिन है। [...]

— करूब

दूसरे भाग के बारे में (सत्य की खोज के रूप में विज्ञान) - फिर, यह सिर्फ एक विधि है। ऐसा लगता है कि सबसे सफल तरीका मानव जाति के साथ आया है। लेकिन यह विश्वास आधारित नहीं है, यह तथ्यों पर आधारित है। और कुछ मायनों में यह एक बंद प्रणाली भी है। सत्य और निर्माण के बीच कोई (वैज्ञानिक) भेद नहीं है जो कि समान प्रतीत होता है। वैज्ञानिक के बीच समझौते से आपको अंगूठे के कुछ नियम मिल सकते हैं (उदाहरण के लिए रेज़र), लेकिन विज्ञान गैर-विज्ञान के समुद्र में कम्पास नहीं है।

— करूब

5

मनुष्य सदियों से भौतिकी के नियमों के बिना जहाजों, गाड़ियों और इमारतों का निर्माण करने में सक्षम है। लेकिन आधुनिक विज्ञान के बाद से, हम उन तकनीकों को एक नए स्तर पर ले जाने में सक्षम हैं। एक सिद्ध सिद्धांत एक राजसी तरीके से सुधार करने की अनुमति देता है। हमने कभी भी चंद्रमा पर नहीं बनाया होगा या पदार्थ और गणना के गणितीय सिद्धांत के बिना कंप्यूटर होंगे।

मशीन लर्निंग किसी भी अन्य की तरह विज्ञान और इंजीनियरिंग का सिर्फ एक अन्य क्षेत्र है। मशीन लर्निंग के लिए एक राजसी दृष्टिकोण ने हमें कर्नेल मशीन, संरचित शिक्षण और पहनावा पद्धति (बूस्टिंग, रैंडम फॉरेस्ट) प्रदान किया है।

— jpmuc
स्रोत

5

यहाँ अपने काम से एक सरल उदाहरण है।

मैं निरंतर परिणामों के लिए बहुत सारे तंत्रिका जाल फिट करता हूं। एक बैकप्रोपैजेशन द्वारा वज़न निर्धारित करता है। आखिरकार, यह अभिसरण करेगा।

{(A^{T} A)}^{- 1} A^{T} y

$\mathbf{\left(A^TA\right)^{-1}A^Ty}$

A

$\mathbf{A}$

y

$y$

मेरा नेट तेजी से परिवर्तित होता है ।

धन्यवाद, सिद्धांत।

— generic_user
स्रोत

3

अनुभववाद बनाम सिद्धांत

आप ने लिखा:

सिद्धांत की सबसे बड़ी आलोचना यह है कि क्योंकि ऐसा करने के लिए कठिन है, वे आम तौर पर कुछ बहुत ही प्रतिबंधित मामले का अध्ययन करते हैं या जिन मान्यताओं को अनिवार्य रूप से लाया जाना है, वे परिणामों को बेकार बनाते हैं।

मुझे लगता है कि दो विचारों के बीच मुख्य विभाजन को प्रदर्शित करता है जिसे हम अनुभवजन्य और सैद्धांतिक कह सकते हैं ।

अनुभवजन्य दृष्टिकोण से, जैसा कि आपने वर्णित किया है, प्रमेय बेकार हैं क्योंकि वे वास्तविक दुनिया को मॉडल करने के लिए पर्याप्त जटिल नहीं हैं। वे सरलीकृत आदर्श परिदृश्यों के बारे में बात करते हैं जो वास्तविक दुनिया में कहीं भी लागू नहीं होते हैं। तो सिद्धांत करने की बात क्या है।

हालाँकि सैद्धांतिक दृष्टिकोण से विपरीत सत्य है। अनुभववाद हमें क्या सिखा सकता है "मैं इस डेटासेट पर यह विधि चलाता हूं और यह उसी डेटासेट पर अन्य विधि चलाने से बेहतर था"। यह एक उदाहरण के लिए उपयोगी है, लेकिन समस्या के बारे में बहुत कम कहता है।

सिद्धांत क्या करता है कुछ गारंटी प्रदान करता है। यह हमें सरलीकृत परिदृश्यों का अध्ययन करने की अनुमति देता है ताकि हम यह समझना शुरू कर सकें कि क्या चल रहा है।

उदाहरण

एक वास्तविक उदाहरण की कल्पना करें: आप यह देखना चाहते हैं कि कैसे अवधारणा बहाव (जब डेटा समय के साथ बदलता है) आपकी सीखने की क्षमता को प्रभावित करता है। एक शुद्ध अनुभववादी इस प्रश्न पर कैसे पहुंचेगा? सब वह वास्तव में कर सकता है विभिन्न तरीकों को लागू करना शुरू करना और उसके द्वारा किए जाने वाले गुर के बारे में सोचना। पूरी प्रक्रिया इस तरह हो सकती है:

पिछले 300 दिनों को लें और यह पता लगाने की कोशिश करें कि क्या उस चर का मतलब बदल गया है। ठीक है, यह कुछ हद तक काम किया।
क्या होगा अगर हम इसके बजाय 200 दिन की कोशिश करें?
ठीक है बेहतर है, चलो बहाव होने के बाद एल्गोरिथ्म को बदलने की कोशिश करें।
अधिक डेटासेट प्राप्त करें और देखें कि अब तक विकसित की गई कौन सी विधि सबसे अच्छी है।
परिणाम निर्णायक नहीं हैं, शायद अनुमान है कि एक से अधिक प्रकार के कॉन्सेप्ट ड्रिफ्ट चल रहे हैं?
सिमुलेशन की कोशिश करो। क्या होगा अगर हम कुछ कॉन्सेप्ट ड्रिफ्ट का अनुकरण करते हैं और फिर अलग-अलग तरीकों को लागू करने के लिए उपयोग किए जाने वाले दिनों की विभिन्न संख्याओं का पता लगाते हैं।

हमारे पास यहां कुछ डेटा सेट पर काफी सटीक परिणाम हैं। हो सकता है कि डेटा इतना था कि 200 पिछले दिनों की टिप्पणियों के आधार पर सीखने के एल्गोरिथ्म को अपडेट करने ने उच्चतम सटीकता दी। लेकिन क्या अन्य डेटा के लिए भी यही काम होगा? यह 200 दिनों का अनुमान कितना विश्वसनीय है? सिमुलेशन मदद करते हैं - लेकिन वे वास्तविक दुनिया को प्रतिबिंबित नहीं करते हैं - वही समस्या सिद्धांत था।

अब एक सैद्धांतिक दृष्टिकोण से उसी की कल्पना करें:

एक बेतुके स्तर पर परिदृश्य को सरल बनाएं। हो सकता है कि समय के साथ अचानक बदलते समय के साथ 2-वे सामान्य वितरण का उपयोग करें।
अपनी शर्तों को स्पष्ट रूप से चुनें - सामान्य डेटा पर इष्टतम मॉडल चुनें। मान लें कि डेटा सामान्य है। आप सभी को पता नहीं है कि साधन में बदलाव कब होता है।
शिफ्ट होने पर पता लगाने के लिए एक उपकरण का उपयोग करें। फिर से 200 पिछले टिप्पणियों के साथ शुरू कर सकते हैं।
इन सेटिंग के आधार पर हमें क्लासिफायर के लिए औसत त्रुटि की गणना करने में सक्षम होना चाहिए, एल्गोरिदम का औसत समय लगता है कि क्या परिवर्तन हुआ है और अपडेट हुआ है। शायद सबसे खराब स्थिति और 95% मौका स्तर के भीतर गारंटी।

अब यह परिदृश्य स्पष्ट है - हम सभी विवरणों को ठीक करके समस्या को अलग करने में सक्षम थे। हमें अपने क्लासीफायर की औसत त्रुटि पता है। संभवतया अनुमान लगा सकते हैं कि परिवर्तन होने में कितने दिन लगेंगे। यह किन मानकों पर निर्भर करता है, इसे कम करें (जैसे कि शायद परिवर्तन का आकार)। और अब कुछ पर आधारित एक व्यावहारिक समाधान का उत्पादन। लेकिन सबसे महत्वपूर्ण बात यह है: यह परिणाम (यदि सही तरीके से गणना की गई है) अपरिवर्तित है। यह हमेशा के लिए यहां है और कोई भी इससे सीख सकता है।

आधुनिक मशीन सीखने के पिता में से एक की तरह - जुरगेन श्मिधुबर कहना पसंद करते हैं:

आंकड़े आते हैं और जाते हैं - प्रमेय अनंत काल के लिए हैं।

अन्य क्षेत्रों से सबक

इसके अलावा संक्षेप में भौतिकी के लिए कुछ समानताएं का उल्लेख करना चाहता था। मुझे लगता है कि उनके पास भी यही दुविधा थी। भौतिक विज्ञानी अनंत अंतरिक्ष के अंदर घूम रहे अनंत द्रव्यमान के घर्षण रहित वस्तुओं का अध्ययन कर रहे थे। पहली नज़र में यह हमें वास्तविकता के बारे में क्या बता सकता है जहां हम जानना चाहते हैं कि हवा में बर्फ के टुकड़े कैसे चलते हैं। लेकिन ऐसा लगता है कि सिद्धांत ने उन्हें काफी लंबा रास्ता तय किया।

— करोलिस कोनसेविअस
स्रोत

2

आपने कुछ कारणों का उल्लेख किया है, जिनमें से एमएल परिणामों की व्याख्या करने की क्षमता सबसे महत्वपूर्ण है, मेरी राय में। बता दें कि AI संचालित प्रॉपर्टी गार्ड ने पड़ोसी के कुत्ते को गोली मारने का फैसला किया। यह समझना महत्वपूर्ण होगा कि उसने ऐसा क्यों किया। यदि भविष्य में ऐसा होने से नहीं रोका जाता है, तो कम से कम यह समझने के लिए कि कौन उत्तरदायी है और कौन मालिक मुआवजे का भुगतान करने जा रहा है।

हालांकि, मेरे लिए सबसे महत्वपूर्ण कारण यह है कि उन सिद्धांतों को समझना जिस पर एल्गोरिथम स्थापित किया गया है, इसकी सीमाओं को समझने और इसके प्रदर्शन में सुधार करने की अनुमति देता है। एमएल में यूक्लिडियन दूरी के उपयोग पर विचार करें। कई क्लस्टरिंग एल्गोरिदम में आप उदाहरण के बीच की दूरी की परिभाषा के साथ शुरू करते हैं, फिर उन समूहों की विशेषताओं के बीच की सीमाओं को खोजते हैं जो निकटता को दर्शाते हैं। एक बार जब आप सुविधाओं की संख्या बढ़ा देते हैं, तो कुछ बिंदु पर यूक्लिडियन दूरी काम करना बंद कर देती है। आप इसे काम करने की कोशिश में बहुत समय बिता सकते हैं, या - यदि आप जानते हैं कि निकटता माप के रूप में यूक्लिडियन दूरी अनंत आयामी सीमा में काम नहीं करती है - बस कुछ अन्य दूरी मीट्रिक, जैसे मैनहट्टन पर स्विच करें, फिर काम करने के लिए आगे बढ़ें वास्तविक समस्याओं पर। आप इस तरह के एक उदाहरण के एक टन पा सकते हैं,

— Aksakal
स्रोत

2

मैंने इस दावे को पहले सुना है, लेकिन मुझे नहीं लगता कि मैं किसी भी विशिष्ट उदाहरण से अवगत हूं जो यह प्रदर्शित करेगा: क्या कुछ डेटा का एक उदाहरण है जो यूक्लिडियन दूरी के साथ अच्छी तरह से क्लस्टरिंग नहीं कर रहे हैं लेकिन मैनहट्टन दूरी के साथ अच्छी तरह से क्लस्टरिंग कर रहे हैं ?

— अमीबा का कहना है कि मोनिका

1

@amoeba यहाँ आम संदर्भ है, हालांकि मैं एक अलग संदर्भ में इससे पहले भाग गया था। यदि आप एक इकाई हाइपरक्यूब के अंदर एक हाइपरस्फेयर की मात्रा के अनुपात को देखते हैं, तो यह शून्य तक सिकुड़ जाता है क्योंकि हाइपरक्यूब की गतिशीलता अनंतता में जाती है। मूल रूप से उच्च आयामों में सभी उत्तल निकायों अंक टुकड़ों में टूट - मेरी व्याख्या

— Aksakal

2

मुझे लगता है कि इसके लिए दार्शनिक चर्चा नहीं होना बहुत मुश्किल है। मेरा जवाब वास्तव में पहले से ही यहां बताए गए अच्छे बिंदुओं की पुनरावृत्ति है (सभी के लिए + 1s); मैं सिर्फ एंड्रयू गेलमैन के एक उद्धरण की ओर इशारा करना चाहता हूं जो वास्तव में मुझसे किसी ऐसे व्यक्ति के रूप में बात करता है जो कंप्यूटर वैज्ञानिक के रूप में प्रशिक्षित होता है। मुझे इस बात का आभास है कि जो लोग मशीन लर्निंग करते हैं, उनमें से कई कंप्यूटर साइंस से भी आते हैं। उद्धरण एक बात से है जो गेलमैन ने 2017 न्यू यॉर्क आर कॉन्फ्रेंस में सैद्धांतिक सांख्यिकी नामक थ्योरी दी है जो एप्लाइड सांख्यिकी का सिद्धांत है :

सिद्धांत स्केलेबल है।

सिद्धांत आपको बताता है कि कुछ शर्तों के तहत क्या समझ में आता है और क्या नहीं। क्या हम सच्चाई का अंदाजा लगाने के लिए हजारों या दसियों हजार या लाखों सिमुलेशन करना चाहते हैं? क्या हम अधिक से अधिक बेंचमार्क डेटासेट पर अनुभवजन्य तुलना करना चाहते हैं? इसमें कुछ समय लगने वाला है, और हमारे परिणाम अभी भी भंगुर हो सकते हैं। इसके अलावा, हम कैसे जानते हैं कि हम जो तुलना करते हैं वह समझ में आता है? हमें कैसे पता चलेगा कि 99.5% सटीकता के साथ हमारा नया डीप लर्नर वास्तव में पुराने की तुलना में बेहतर है जिसमें 99.1% सटीकता थी? कुछ सिद्धांत यहां मदद करेंगे।

मैं सिमुलेशन का बहुत बड़ा प्रशंसक हूं और मैं दुनिया की समझ बनाने के लिए उनका बहुत उपयोग करता हूं (या यहां तक कि सिद्धांत का अर्थ भी बताता हूं), लेकिन सैद्धांतिक मशीन लर्निंग लागू मशीन लर्निंग का सिद्धांत है।

— Einar
स्रोत