कर्नेल रिज प्रतिगमन दक्षता


11

रिज प्रतिगमन के रूप में व्यक्त किया जा सकता है

y^=(XX+aId)1Xx
कहाँ पे y^ अनुमानित लेबल है, Id d×d मैट्रिक्स की पहचान करें, x वह वस्तु जिसके लिए हम एक लेबल खोजने की कोशिश कर रहे हैं, और X n×d का मैट्रिक्स n वस्तुओं xi=(xi,1,...,xi,d)Rd ऐसा है कि:

X=(x1,1x1,2x1,dx2,1x2,2x2,dxn,1x1,2xn,d)

हम इसे इस प्रकार से कर्नेल कर सकते हैं:

y^=(K+aId)1k

कहाँ पे K है n×n कर्नेल कार्यों का मैट्रिक्स K

K=(K(x1,x1)K(x1,x2)K(x1,xn)K(x2,x1)K(x2,x2)K(x2,xn)K(xn,x1)K(xn,x2)K(xn,xn))

तथा k n×1 कॉलम कर्नेल फ़ंक्शंस के वेक्टर K

k=(K(x1,x)K(x2,x)K(xn,x))

प्रशन:

(a) यदि अधिक वस्तुएँ हैं xiआयामों की तुलना में यह गुठली का उपयोग नहीं करने के लिए समझ में आता है ? उदाX ए हो 50×3 तब मैट्रिक्स XX होगा एक 3×3 और हम अंत में एक inverting करेंगे 3×3 के बजाय मैट्रिक्स 50×50मैट्रिक्स हम उलटा होगा हम गुठली का उपयोग करने के लिए थे। क्या इसका मतलब यह है कि यदिdn हमें गुठली का उपयोग नहीं करना चाहिए?

(b) सरलतम संभव कर्नेल का उपयोग किया जाना चाहिए? ऐसा लगता है कि रिज रिग्रेशन में गुठली का उपयोग आयामीता के प्रभावों को नकारने के लिए किया जाता है और फीचर स्पेस के कुछ गुणों का उपयोग न करने के लिए (समर्थन वेक्टर मशीनों के विपरीत)। हालाँकि, गुठली वस्तुओं के बीच की दूरी को बदल सकती है इसलिए क्या रिज रिग्रेशन में कोई लोकप्रिय गुठली का उपयोग किया जाता है?

(c) क्या है O रिज प्रतिगमन और / या कर्नेल रिज प्रतिगमन की समय जटिलता?


आंकड़ों में 'दक्षता' का एक अलग अर्थ है। क्या आपका मतलब 'कम्प्यूटेशनल जटिलता' था? (शीर्षक में)
मेमोरियल

मेरा मतलब था "एल्गोरिथम दक्षता"। हालांकि यह सच है कि मेरे सवाल अनिवार्य रूप से "कम्प्यूटेशनल जटिलता" को कम कर देते हैं।
हेलिक्स

जवाबों:


5

(ए) कर्नेल का उपयोग करने का उद्देश्य इस मामले में एक nonlinear प्रतिगमन समस्या को हल करना है। एक अच्छा कर्नेल आपको संभवतः अनंत-आयामी सुविधा स्थान में समस्याओं को हल करने की अनुमति देगा। लेकिन, एक रैखिक कर्नेल का उपयोग करते हुएK(x,y)=xy और दोहरी अंतरिक्ष में कर्नेल रिज प्रतिगमन कर रहा है जैसे कि समतल स्थान में समस्या को हल करना, अर्थात, यह कोई लाभ नहीं लाता है (यह सिर्फ बहुत धीमा है क्योंकि आपके द्वारा देखे गए नमूने की संख्या बढ़ती है)।

(b) सबसे लोकप्रिय विकल्पों में से एक वर्ग घातीय कर्नेल है K(x,y)=exp(τ2||xy||2)जो सार्वभौमिक है (नीचे रेफरी देखें)। कई कर्नेल हैं, और उनमें से प्रत्येक आपके फीचर स्थान पर अलग-अलग आंतरिक उत्पाद (और इसलिए मीट्रिक) को प्रेरित करेगा।

(c) सीधे कार्यान्वयन के लिए आकार के रैखिक समीकरण को हल करने की आवश्यकता होती है n, तो यह O(n3)। Nyström सन्निकटन जैसे कई तेज़ सन्निकटन विधियाँ हैं। यह सक्रिय अनुसंधान का एक क्षेत्र है।

संदर्भ:

  1. भरथ श्रीपेरुम्बुदूर, केंजी फुकुमिजू, और गर्ट लैंक्रिएट। सार्वभौमिकता, विशेषता गुठली और RKHS उपायों के बीच संबंध पर। जर्नल ऑफ़ मशीन लर्निंग रिसर्च, 9: 773–780, 2010।
  2. बर्नहार्ड शल्कोफ, अलेक्जेंडर जे। स्मोला। कर्नेल के साथ सीखना: वेक्टर मशीनों, नियमितीकरण, अनुकूलन और 2002 से परे का समर्थन करें
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.