कई मशीन लर्निंग एल्गोरिदम प्रतीत होते हैं जो कर्नेल फ़ंक्शन पर निर्भर करते हैं। नाम के लिए SVM और NN लेकिन दो। तो कर्नेल फ़ंक्शन की परिभाषा क्या है और इसके वैध होने के लिए क्या आवश्यकताएँ हैं?
कई मशीन लर्निंग एल्गोरिदम प्रतीत होते हैं जो कर्नेल फ़ंक्शन पर निर्भर करते हैं। नाम के लिए SVM और NN लेकिन दो। तो कर्नेल फ़ंक्शन की परिभाषा क्या है और इसके वैध होने के लिए क्या आवश्यकताएँ हैं?
जवाबों:
X, y पर S के लिए, कुछ फ़ंक्शन K (x, y) को एक आंतरिक उत्पाद (आमतौर पर एक अलग स्थान) के रूप में व्यक्त किया जा सकता है। K को अक्सर कर्नेल या कर्नेल फ़ंक्शन के रूप में संदर्भित किया जाता है। कर्नेल शब्द का प्रयोग पूरे गणित में अलग-अलग तरीकों से किया जाता है, लेकिन यह मशीन सीखने में सबसे आम उपयोग है।
कर्नेल ट्रिक एक सामान्य सेट S से आंतरिक उत्पाद स्पेस V (इसके प्राकृतिक मानदंड से सुसज्जित) से टिप्पणियों को मैप करने का एक तरीका है, बिना मैपिंग को स्पष्ट रूप से गणना किए बिना, इस उम्मीद में कि वी में सार्थक रेखीय संरचना प्राप्त होगी। यह दक्षता के मामले में महत्वपूर्ण है (एक बहुत ही उच्च आयामी स्थान में डॉट उत्पादों की गणना) और व्यावहारिकता (हम रैखिक एमएल एल्गोरिदम को गैर-रेखीय एमएल एल्गोरिदम में बदल सकते हैं)।
एक फ़ंक्शन K को एक वैध कर्नेल माना जाता है जिसके लिए मर्सर की शर्तों को पूरा करना पड़ता है । व्यावहारिक रूप में इसका मतलब है कि हमें कर्नेल मैट्रिक्स (आपके पास हर डेटा पॉइंट की कर्नेल उत्पाद की गणना करना) सुनिश्चित करना होगा जो हमेशा सकारात्मक अर्ध-निश्चित हो। यह सुनिश्चित करेगा कि प्रशिक्षण उद्देश्य समारोह उत्तल है, एक बहुत ही महत्वपूर्ण संपत्ति है।
से विलियम्स, क्रिस्टोफर KI, और कार्ल एडवर्ड रासमुसेन। " मशीन सीखने के लिए गॉसियन प्रक्रियाएं। " एमआईटी प्रेस 2, नहीं। 3 (2006)। पृष्ठ 80० ।
इसके अलावा, कर्नेल = कर्नेल फ़ंक्शन।
मशीन लर्निंग एल्गोरिदम में उपयोग किए जाने वाले कर्नेल आमतौर पर अधिक गुणों को संतुष्ट करते हैं, जैसे कि सकारात्मक अर्धचालक।
कम तकनीकी व्याख्या के लिए प्रयास करने जा रहे हैं।
सबसे पहले, दो वैक्टर के बीच डॉट उत्पाद के साथ शुरू करें। यह आपको बताता है कि वैक्टर कैसे "समान" हैं। यदि वैक्टर आपके डेटा सेट में बिंदुओं का प्रतिनिधित्व करता है, तो डॉट उत्पाद आपको बताता है कि वे समान हैं या नहीं।
लेकिन, कुछ (कई) मामलों में, डॉट उत्पाद समानता का सबसे अच्छा मीट्रिक नहीं है। उदाहरण के लिए:
इसलिए, डॉट उत्पाद का उपयोग करने के बजाय, आप एक "कर्नेल" का उपयोग करते हैं जो केवल एक फ़ंक्शन है जो दो बिंदुओं को लेता है और आपको उनकी समानता का माप देता है। मैं 100% निश्चित नहीं हूं कि तकनीकी रूप से एक कर्नेल को पूरा करने के लिए एक तकनीकी स्थिति क्या होनी चाहिए, लेकिन यह विचार है।
एक बहुत अच्छी बात यह है कि कर्नेल आपके डोमेन ज्ञान को इस अर्थ में समस्या में डालने में मदद कर सकता है कि आप कह सकते हैं कि दो बिंदु xyz कारण से समान हैं जो कि डोमेन के बारे में जानने के बाद आपके सामने आते हैं।