आप वास्तव में साहित्य में एक खुले प्रश्न के बारे में सोच रहे हैं। जैसा कि आप कहते हैं, कई प्रकार की गुठली (जैसे, रैखिक, रेडियल आधार फ़ंक्शन, सिग्मोइड, बहुपद) हैं, और अपने वर्गीकरण कार्य को उनके संबंधित समीकरणों द्वारा परिभाषित स्थान में करेंगे। मेरी जानकारी के लिए, किसी ने भी यह निश्चित रूप से नहीं दिखाया है कि एक कर्नेल हमेशा एक प्रकार के पाठ वर्गीकरण कार्य को एक दूसरे पर सबसे अच्छा प्रदर्शन करता है।
एक बात पर विचार करें कि प्रत्येक कर्नेल फ़ंक्शन में 1 या अधिक पैरामीटर हैं जिन्हें आपके डेटा सेट के लिए अनुकूलित करने की आवश्यकता होगी, जिसका अर्थ है, यदि आप इसे ठीक से कर रहे हैं, तो आपके पास एक दूसरा होल्ड-आउट प्रशिक्षण संग्रह होना चाहिए, जिस पर आप कर सकते हैं इन मापदंडों के लिए सर्वोत्तम मूल्यों की जांच करें। (मैं एक दूसरा होल्ड-आउट संग्रह कहता हूं, क्योंकि आपके पास पहले से ही एक होना चाहिए जो आप अपने क्लासिफायरियर द्वारा सर्वश्रेष्ठ इनपुट सुविधाओं का पता लगाने के लिए उपयोग कर रहे हैं।) मैंने एक प्रयोग कुछ समय पहले किया था जिसमें मैंने प्रत्येक के बड़े पैमाने पर अनुकूलन किया था। एक साधारण पाठ्य वर्गीकरण कार्य के लिए इन मापदंडों और पाया कि प्रत्येक कर्नेल यथोचित प्रदर्शन करने के लिए दिखाई दिया, लेकिन अलग-अलग विन्यासों में ऐसा किया। अगर मुझे अपने परिणाम सही रूप से याद हैं, तो सिग्मॉइड ने सबसे अच्छा प्रदर्शन किया, लेकिन बहुत विशिष्ट पैरामीटर ट्यूनिंग पर ऐसा किया - जो मुझे मेरी मशीन को खोजने में एक महीने से अधिक समय लगा।