रैखिक डेटा के लिए यह निश्चित रूप से उपयोगी नहीं है, लेकिन गैर-रैखिक डेटा के लिए, यह हमेशा उपयोगी लगता है। ट्रेनिंग टाइम और स्केलेबिलिटी के मामले में लीनियर क्लासिफायर का इस्तेमाल नॉन-लीनियर की तुलना में बहुत आसान है।
@BartoszKP ने पहले ही समझाया कि कर्नेल ट्रिक क्यों उपयोगी है। आपके प्रश्न को पूरी तरह से संबोधित करने के लिए, हालांकि मैं यह बताना चाहूंगा कि गैर-रैखिक रूप से वियोज्य डेटा से निपटने के लिए कर्नेल का उपयोग एकमात्र विकल्प नहीं है ।
मॉडल के परिशोधन के लिए कम से कम तीन अच्छे, सामान्य विकल्प हैं :
- तटस्थ नेटवर्क आधारित विधियाँ, जहाँ आप प्रसंस्करण इकाइयों की एक (या अधिक) परतें जोड़ते हैं, जो आपके डेटा को रैखिक रूप से वियोज्य मामले में बदलने में सक्षम हैं। सरलतम मामले में यह सिग्मॉइड-आधारित परत है, जो प्रक्रिया में गैर-रैखिकता जोड़ता है। एक बार बेतरतीब ढंग से शुरू होने के बाद उन्हें ऊपरी परत के ढाल-आधारित अनुकूलन के दौरान अपडेट मिल रहे हैं (जो कि रैखिक समस्या को हल करता है)।
- विशेष रूप से - आगे लीनियर वर्गीकरण के लिए डेटा तैयार करने के लिए गहरी शिक्षण तकनीकों का उपयोग यहां किया जा सकता है। यह पिछले एक के समान विचार है, लेकिन यहां आप कुछ रैखिक मॉडल के प्रशिक्षण के आधार पर आगे की फाइन-ट्यूनिंग के लिए एक अच्छा प्रारंभिक बिंदु खोजने के लिए अपनी प्रसंस्करण परतों को प्रशिक्षित करते हैं।
- यादृच्छिक अनुमान - आप कुछ पूर्वनिर्धारित स्थान से (गैर रेखीय) अनुमानों को नमूना कर सकते हैं और उनके शीर्ष पर रेखीय वर्गीकरण को प्रशिक्षित कर सकते हैं। इस विचार का अत्यधिक मशीन लर्निंग नामक तथाकथित शोषण में उपयोग किया जाता है , जहाँ बहुत ही कुशल रैखिक सॉल्वरों का उपयोग यादृच्छिक अनुमानों पर एक साधारण क्लासिफायरियर को प्रशिक्षित करने के लिए किया जाता है, और बहुत अच्छा प्रदर्शन प्राप्त करने के लिए (वर्गीकरण और प्रतिगमन दोनों में गैर रेखीय समस्याओं पर, उदाहरण के लिए चरम शिक्षण की जाँच करें। मशीनें )।
योग करने के लिए - कर्नेलाइजेशन एक बेहतरीन डेलीएराइजेशन तकनीक है, और आप इसका उपयोग कर सकते हैं, जब समस्या रैखिक नहीं होती है, लेकिन यह अंधा नहीं होना चाहिए "अगर" तो एप्राच। यह कम से कम कुछ दिलचस्प तरीकों में से एक है, जो समस्या और आवश्यकताओं के आधार पर विभिन्न परिणामों को जन्म दे सकता है। विशेष रूप से, ईएलएम कर्नेलित एसवीएम द्वारा दिए गए उन लोगों के समान समाधान खोजने की कोशिश करता है, जबकि एक ही समय में उन्हें परिमाण की प्रशिक्षित पंक्तियों को तेजी से प्रशिक्षित किया जा सकता है (इसलिए यह कर्नेलित एसवीएम की तुलना में बहुत बेहतर होता है)।