जवाबों:
मैं निम्नलिखित सैद्धांतिक मार्गदर्शन का सुझाव दूंगा। जब आप गाऊसी आरबीएफ कर्नेल का उपयोग कर रहे हैं, तो आपकी अलग सतह प्रत्येक समर्थन वेक्टर पर केंद्रित घंटी के आकार की सतहों के संयोजन पर आधारित होगी। प्रत्येक घंटी के आकार की सतह की चौड़ाई इसके विपरीत आनुपातिक होगी। यदि यह चौड़ाई आपके डेटा के लिए न्यूनतम जोड़ी-वार दूरी से छोटी है, तो आप अनिवार्य रूप से ओवरफिटिंग करते हैं। यदि यह चौड़ाई आपके डेटा के लिए अधिकतम जोड़ी-वार दूरी से बड़ी है, तो आपके सभी बिंदु एक ही श्रेणी में आते हैं और आपके पास अच्छा प्रदर्शन भी नहीं है। तो इन दो चरम सीमाओं के बीच इष्टतम चौड़ाई कहीं होनी चाहिए।
नहीं, यह अनिवार्य रूप से डेटा पर निर्भर है। ग्रिड खोज (लॉग-ट्रांसफ़ॉर्म किए गए हाइपर-पैरामीटर्स पर) एक बहुत अच्छी विधि है, यदि आपके पास ट्यून करने के लिए केवल बहुत कम हाइपर-पैरामीटर हैं, लेकिन ग्रिड रिज़ॉल्यूशन को बहुत अच्छा नहीं बनाते हैं या आप ट्यूनिंग को ओवर-फिट करने की संभावना रखते हैं कसौटी। कर्नेल मापदंडों की एक बड़ी संख्या के साथ समस्याओं के लिए, मुझे लगता है कि Nelder-Mead सिंप्लेक्स विधि अच्छी तरह से काम करती है।
pair-wise distance for your data
= स्केलिंग के बाद सरल यूक्लिडियन दूरी?