एक कर्नेल क्या है और इसे अन्य कार्यों से अलग करता है


13

कई मशीन लर्निंग एल्गोरिदम प्रतीत होते हैं जो कर्नेल फ़ंक्शन पर निर्भर करते हैं। नाम के लिए SVM और NN लेकिन दो। तो कर्नेल फ़ंक्शन की परिभाषा क्या है और इसके वैध होने के लिए क्या आवश्यकताएँ हैं?


5
मैं यह नहीं कहूंगा कि NN कर्नेल फ़ंक्शंस पर भरोसा करते हैं - वे नॉनलाइनरिटी प्राप्त करने के लिए एक ट्रांसफर फ़ंक्शन पर भरोसा करते हैं , लेकिन यह कर्नेल फ़ंक्शन के समान नहीं है
tdc

जवाबों:


11

X, y पर S के लिए, कुछ फ़ंक्शन K (x, y) को एक आंतरिक उत्पाद (आमतौर पर एक अलग स्थान) के रूप में व्यक्त किया जा सकता है। K को अक्सर कर्नेल या कर्नेल फ़ंक्शन के रूप में संदर्भित किया जाता है। कर्नेल शब्द का प्रयोग पूरे गणित में अलग-अलग तरीकों से किया जाता है, लेकिन यह मशीन सीखने में सबसे आम उपयोग है।

कर्नेल ट्रिक एक सामान्य सेट S से आंतरिक उत्पाद स्पेस V (इसके प्राकृतिक मानदंड से सुसज्जित) से टिप्पणियों को मैप करने का एक तरीका है, बिना मैपिंग को स्पष्ट रूप से गणना किए बिना, इस उम्मीद में कि वी में सार्थक रेखीय संरचना प्राप्त होगी। यह दक्षता के मामले में महत्वपूर्ण है (एक बहुत ही उच्च आयामी स्थान में डॉट उत्पादों की गणना) और व्यावहारिकता (हम रैखिक एमएल एल्गोरिदम को गैर-रेखीय एमएल एल्गोरिदम में बदल सकते हैं)।

एक फ़ंक्शन K को एक वैध कर्नेल माना जाता है जिसके लिए मर्सर की शर्तों को पूरा करना पड़ता है । व्यावहारिक रूप में इसका मतलब है कि हमें कर्नेल मैट्रिक्स (आपके पास हर डेटा पॉइंट की कर्नेल उत्पाद की गणना करना) सुनिश्चित करना होगा जो हमेशा सकारात्मक अर्ध-निश्चित हो। यह सुनिश्चित करेगा कि प्रशिक्षण उद्देश्य समारोह उत्तल है, एक बहुत ही महत्वपूर्ण संपत्ति है।


धन्यवाद @carlosdc, लेकिन मुझे डर है कि आप इस पुराने कुत्ते, नए गुर सिखाने की कोशिश कर रहे हैं। मेरे सिर पर बहुत कुछ है। मैं मर्सर की शर्तों को पढ़ता हूं, लेकिन वास्तविक दुनिया में उनका अर्थ मुझ पर खो जाता है। मैं ऊपर से मानता हूं कि एक कर्नेल का अभिन्न परिमित मूल्य के लिए विवश होना चाहिए। क्या यह धारणा सही है?

1
यदि कर्नेल मैट्रिक्स PSD है तो वह उद्देश्य उत्तल है जो कि उद्देश्य पर निर्भर करता है। यह एसवीएम के लिए सही है, लेकिन गॉसियन प्रक्रियाओं के साथ बिंदु यह है कि कर्नेल मैट्रिक्स एक वैध सहसंयोजक मैट्रिक्स है और इस प्रकार उलटा है।
bayerj

2

से विलियम्स, क्रिस्टोफर KI, और कार्ल एडवर्ड रासमुसेन। " मशीन सीखने के लिए गॉसियन प्रक्रियाएं। " एमआईटी प्रेस 2, नहीं। 3 (2006)। पृष्ठ 80०

xXxXR

इसके अलावा, कर्नेल = कर्नेल फ़ंक्शन।

मशीन लर्निंग एल्गोरिदम में उपयोग किए जाने वाले कर्नेल आमतौर पर अधिक गुणों को संतुष्ट करते हैं, जैसे कि सकारात्मक अर्धचालक।


2

कम तकनीकी व्याख्या के लिए प्रयास करने जा रहे हैं।

सबसे पहले, दो वैक्टर के बीच डॉट उत्पाद के साथ शुरू करें। यह आपको बताता है कि वैक्टर कैसे "समान" हैं। यदि वैक्टर आपके डेटा सेट में बिंदुओं का प्रतिनिधित्व करता है, तो डॉट उत्पाद आपको बताता है कि वे समान हैं या नहीं।

लेकिन, कुछ (कई) मामलों में, डॉट उत्पाद समानता का सबसे अच्छा मीट्रिक नहीं है। उदाहरण के लिए:

  • हो सकता है कि कम बिंदु वाले उत्पाद कुछ अन्य कारणों से समान हों।
  • आपके पास डेटा आइटम हो सकते हैं जो बिंदुओं के रूप में अच्छी तरह से प्रतिनिधित्व नहीं करते हैं।

इसलिए, डॉट उत्पाद का उपयोग करने के बजाय, आप एक "कर्नेल" का उपयोग करते हैं जो केवल एक फ़ंक्शन है जो दो बिंदुओं को लेता है और आपको उनकी समानता का माप देता है। मैं 100% निश्चित नहीं हूं कि तकनीकी रूप से एक कर्नेल को पूरा करने के लिए एक तकनीकी स्थिति क्या होनी चाहिए, लेकिन यह विचार है।

एक बहुत अच्छी बात यह है कि कर्नेल आपके डोमेन ज्ञान को इस अर्थ में समस्या में डालने में मदद कर सकता है कि आप कह सकते हैं कि दो बिंदु xyz कारण से समान हैं जो कि डोमेन के बारे में जानने के बाद आपके सामने आते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.