सह-कार्य या गुठली - वे वास्तव में क्या हैं?


13

मैं गॉसियन प्रक्रियाओं के क्षेत्र में नया हूँ और उन्हें मशीन लर्निंग में कैसे लागू किया जा रहा है। मैं इन तरीकों के मुख्य आकर्षण होने के बारे में सहसंयोजक कार्यों के बारे में पढ़ता और सुनता रहता हूं। तो क्या कोई भी सहज तरीके से समझा सकता है कि इन सहसंयोजक कार्यों में क्या हो रहा है?

अन्यथा, यदि आप उन्हें समझाते हुए एक विशिष्ट ट्यूटोरियल या दस्तावेज़ को इंगित कर सकते हैं।



यदि यह मुख्य रूप से एक संदर्भ अनुरोध समस्या है, तो आप "संदर्भ" टैग जोड़ सकते हैं। (यह प्रश्न व्यापक है, लेकिन यदि आप लोगों को यह स्वीकार करने के लिए स्वीकार करते हैं कि आपको क्या जाना चाहिए और पढ़ना चाहिए, यह काफी हद तक इस मुद्दे को हल करता है।)
सिल्वरफिश

जवाबों:


12

ढीला शब्दों में, एक कर्नेल या सहप्रसरण समारोह दो अंक के बीच सांख्यिकीय संबंध को निर्दिष्ट एक्स , एक्स ' अपने इनपुट अंतरिक्ष में; यह है कि, कैसे स्पष्ट रूप से पर गाऊसी प्रक्रिया (जीपी) के मूल्य में परिवर्तन एक्स में जीपी में परिवर्तन के साथ संबद्ध एक्स ' । कुछ अर्थों में, आप सोच सकते हैं कश्मीर ( , ) (*) आदानों के बीच एक समानता को परिभाषित करने के रूप में।(एक्स,एक्स')एक्स,एक्स'एक्सएक्स'(,)

विशिष्ट गुठली केवल अंकों के बीच यूक्लिडियन दूरी (या रैखिक परिवर्तन) पर निर्भर हो सकती है, लेकिन मज़ा तब शुरू होता है जब आपको एहसास होता है कि आप बहुत कुछ कर सकते हैं, बहुत अधिक।

जैसा कि डेविड डुवेनॉड कहते हैं:

कर्नेल को सभी प्रकार की डेटा संरचनाओं पर परिभाषित किया जा सकता है: पाठ, चित्र, मैट्रिक्स, और यहां तक ​​कि गुठली। एक नए प्रकार के डेटा पर कर्नेल के साथ आने से एनआईपीएस पेपर प्राप्त करने का एक आसान तरीका हुआ करता था।

GPs के लिए गुठली के एक आसान अवलोकन के लिए, मैं गर्म रूप से उसकी कर्नेल कुकबुक और उसके संदर्भों की सिफारिश करता हूं ।


(*) @ डिक्रान मार्सुपियल नोट्स के रूप में, इस बात से सावधान रहें कि काफिला सच नहीं है; सभी समानताएं वैध नहीं हैं गुठली (उसका उत्तर देखें)।


8

(एक्स,एक्स')=φ(एक्स)φ(एक्स')φ() एक फ़ंक्शन है जो इनपुट वैक्टर को फीचर स्पेस में मैप करता है।

तो क्यों कर्नेल को कुछ फीचर स्पेस में एक आंतरिक उत्पाद के रूप में व्याख्या योग्य होना चाहिए? कारण यह है कि रैखिक मॉडल (जैसे लॉजिस्टिक प्रतिगमन) के लिए सामान्यीकरण प्रदर्शन पर सैद्धांतिक सीमाएं तैयार करना बहुत आसान है, क्योंकि यह गैर-रैखिक मॉडल (जैसे तंत्रिका नेटवर्क) के लिए है। अधिकांश रैखिक मॉडल लिखे जा सकते हैं ताकि इनपुट वैक्टर केवल आंतरिक उत्पादों के रूप में दिखाई दें। इसका अर्थ है कि हम कर्नेल सुविधा स्थान में एक रैखिक मॉडल का निर्माण करके एक गैर-रैखिक मॉडल का निर्माण कर सकते हैं। यह डेटा का एक निश्चित परिवर्तन है, इसलिए रैखिक मॉडल के लिए सभी सैद्धांतिक प्रदर्शन सीमाएं नए कर्नेल गैर-रैखिक मॉडल * पर स्वचालित रूप से लागू होती हैं।

एक महत्वपूर्ण बिंदु जो पहली बार में समझाना मुश्किल है, वह यह है कि हम एक ऐसी सुविधा स्थान के बारे में नहीं सोचते हैं जो हमारे विशेष अनुप्रयोग के लिए अच्छा होगा और फिर उस सुविधा स्थान को जन्म देते हुए कर्नेल डिज़ाइन करेंगे। सामान्य तौर पर हम एक अच्छी समानता मीट्रिक के साथ आते हैं और फिर देखते हैं कि क्या यह एक कर्नेल है (परीक्षण सीधा है, अगर सामान्य स्थिति में बिंदुओं पर कर्नेल फ़ंक्शन के युग्मय मूल्यांकन का कोई भी मैट्रिक्स सकारात्मक निश्चित है, तो यह एक वैध कर्नेल है) ।

*


1
"एक कर्नेल (परीक्षण सीधा है, यदि कर्नेल फ़ंक्शन के युग्मयूल मूल्यांकन का कोई भी मैट्रिक्स सकारात्मक निश्चित है, तो यह एक वैध कर्नेल है)।" मेरा मानना ​​है कि आपको "अलग-अलग बिंदुओं पर" शामिल करने की आवश्यकता है।
मार्क एल। स्टोन
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.