मुझे लगता है कि जादू की कुंजी चिकनाई है। मेरा लंबा उत्तर जो इस प्रकार है कि इस सहजता के बारे में समझाना है। यह एक उत्तर हो सकता है या नहीं, जिसकी आप अपेक्षा करते हैं।
संक्षिप्त जवाब:
एक सकारात्मक निश्चित कर्नेल को देखते हुए , इसके कार्यों H की इसी जगह मौजूद है । कार्यों के गुण कर्नेल द्वारा निर्धारित किए जाते हैं। यह पता चला है कि यदि k एक गाऊसी कर्नेल है, तो H में कार्य बहुत सुचारू हैं। तो, एक सीखा फ़ंक्शन (जैसे, एक प्रतिगमन फ़ंक्शन, कर्नेल पीसीए में आरकेएचएस में प्रमुख घटक) बहुत चिकना है। आमतौर पर चिकनाई की धारणा ज्यादातर डेटासेट से निपटने के लिए समझदार होती है। यह बताता है कि एक गाऊसी कर्नेल क्यों जादुई है।kHkH
एक गाऊसी कर्नेल क्यों चिकनी कार्य देता है के लिए लंबा जवाब:
एक सकारात्मक निश्चित गिरी को परिभाषित करता है (परोक्ष) एक आंतरिक उत्पाद कश्मीर ( एक्स , वाई ) = ⟨ φ ( एक्स ) , φ ( y ) ⟩ एच
फीचर वेक्टर के लिए φ ( एक्स ) से अपने इनपुट का निर्माण एक्स , और
H एक हिल्बर्ट स्पेस है। अंकन ⟨ φ ( एक्स ) , φ ( y ) ⟩k(x,y)k(x,y)=⟨ϕ(x),ϕ(y)⟩Hϕ(x)xH⟨ϕ(x),ϕ(y)⟩
के बीच एक आंतरिक उत्पाद का मतलब है और φ ( y ) । हमारे उद्देश्य के लिए, आप कल्पना कर सकते हैं कि एच हमेशा की तरह यूक्लिडियन स्पेस है, लेकिन संभवत: विभिन्न प्रकार के आयामों के साथ। हमेशा की तरह वेक्टर वह यह है कि असीम लंबे तरह कल्पना कीजिए φ ( एक्स ) = ( φ 1 ( एक्स ) , φ 2 ( एक्स ) , ... ) । कर्नेल विधियों में, एचϕ(x)ϕ(y)Hϕ(x)=(ϕ1(x),ϕ2(x),…)Hफ़ंक्शंस की एक जगह है जिसे कर्नेल हिल्बर्ट स्पेस (RKHS) कहा जाता है। इस स्थान के लिए एक विशेष संपत्ति `` प्रजनन संपत्ति '' कहा जाता है जो यह है कि है । यह कहना है कि मूल्यांकन करने के लिए च ( एक्स ) , पहले आप एक फीचर वेक्टर का निर्माण (असीम लंबे समय के रूप में उल्लेख किया है) के लिए च । फिर आप ϕ ( x ) (असीम रूप से लंबे) द्वारा निरूपित x के लिए अपनी सुविधा वेक्टर का निर्माण करते हैं । च ( x ) का मूल्यांकनf(x)=⟨f,ϕ(x)⟩f(x)fxϕ(x)f(x)दोनों का आंतरिक उत्पाद लेकर दिया जाता है। जाहिर है, व्यवहार में, कोई भी असीम रूप से लंबे वेक्टर का निर्माण नहीं करेगा। चूँकि हम केवल इसके आंतरिक उत्पाद की परवाह करते हैं, हम सीधे कर्नेल मूल्यांकन करते हैं । स्पष्ट सुविधाओं की गणना को दरकिनार करते हुए और सीधे अपने आंतरिक उत्पाद की गणना करके "कर्नेल ट्रिक" के रूप में जाना जाता है।k
विशेषताएं क्या हैं?
मैं सुविधाओं कह रखा निर्दिष्ट करने के लिए वे क्या कर रहे हैं के बिना। कर्नेल k को देखते हुए , सुविधाएँ अद्वितीय नहीं हैं। लेकिन
⟨ φ ( एक्स ) , φ ( y ) ⟩ विशिष्ट निर्धारित किया जाता है। कार्यों की चिकनाई की व्याख्या करने के लिए, आइए हम फूरियर विशेषताओं पर विचार करें। एक अनुवाद अपरिवर्तनीय कर्नेल k , जिसका अर्थ k ( x , y ) = k ( x - y है , मान लेंϕ1(x),ϕ2(x),…k⟨ϕ(x),ϕ(y)⟩k
अर्थात, कर्नेल केवल दो तर्कों के अंतर पर निर्भर करता है। गाऊसी कर्नेल में यह गुण है। चलो k निरूपित फूरियर के बदलने कश्मीर ।k(x,y)=k(x−y)k^k
इस फूरियर दृष्टिकोण में, की सुविधाओं
द्वारा दिया जाता है च : = ( ⋯ , च एल / √f। यह कह रही है कि अपने कार्य की सुविधा प्रतिनिधित्वच
अपने फूरियर द्वारा दिया जाता है Fourer से विभाजित बदलने कर्नेल का बदलनाकश्मीर। की सुविधा प्रतिनिधित्वएक्स, जो हैφ(एक्स)
है(⋯,√f:=(⋯,f^l/k^l−−√,⋯)fkxϕ(x)
जहांमैं=√(⋯,k^l−−√exp(−ilx),⋯) । एक दिखा सकता है कि प्रजनन संपत्ति रखती है (पाठकों के लिए एक व्यायाम)।i=−1−−−√
किसी भी हिल्बर्ट अंतरिक्ष की तरह, अंतरिक्ष से संबंधित सभी तत्वों का परिमित मानदंड होना चाहिए। हमें एक की चुकता आदर्श पर विचार करें :f∈H
∥f∥2H=⟨f,f⟩H=∑∞l=−∞f^2lk^l.
तो जब यह मानक परिमित है, अंतरिक्ष के अंतर्गत आता है? यह तब होता है जब तेजी से से गिरता है ताकि योग परिवर्तित हो जाए। अब, एक गाऊसी कर्नेल का फूरियर रूपांतरणच 2 एल कश्मीर एल कश्मीर ( एक्स , वाई ) = exp ( - ‖ एक्स - y ‖ 2ff^2lk^l k(x,y)=exp(−∥x−y∥2σ2)
एक और गाऊसी है, जहां साथ तेजी से घट जाती है । इसलिए यदि को इस स्थान पर होना है, तो उसके फूरियर ट्रांसफॉर्म को की तुलना में तेजी से छोड़ना चाहिए । इसका मतलब है कि फ़ंक्शन में उच्च भार के साथ प्रभावी रूप से केवल कुछ कम आवृत्ति घटक होंगे। केवल कम आवृत्ति घटकों के साथ एक संकेत `` अधिक 'wiggle' नहीं करता है। यह बताता है कि एक गाऊसी कर्नेल आपको एक चिकनी फ़ंक्शन क्यों देता है।एलएफकश्मीरk^llfk
अतिरिक्त: एक लाप्लास कर्नेल के बारे में क्या?
यदि आप एक लाप्लास कर्नेल , तो
इसका फूरियर ट्रांसफ़ॉर्म एक कॉची वितरण है जो घातीय की तुलना में धीमा हो जाता है गॉसियन कर्नेल के फूरियर रूपांतरण में कार्य। इसका मतलब है कि एक फ़ंक्शन में अधिक उच्च आवृत्ति वाले घटक होंगे। नतीजतन, एक लाप्लास कर्नेल द्वारा दिया गया फ़ंक्शन गॉसियन कर्नेल द्वारा दिए गए तुलना में `` मोटा '' है।चk(x,y)=exp(−∥x−y∥σ)f
गाऊसी कर्नेल की एक संपत्ति क्या है जो अन्य गुठली नहीं है?
गाऊसी चौड़ाई के बावजूद, एक गुण यह है कि गाऊसी कर्नेल `` सार्वभौमिक '' है। सहज रूप से, इसका मतलब है, एक बंधे हुए निरंतर फ़ंक्शन (मनमाना) को देखते हुए, वहाँ एक फ़ंक्शन जैसे कि और
करीब हैं (in the sense of तक मनमानी परिशुद्धता की जरूरत है। मूल रूप से, इसका मतलब है कि गॉसियन कर्नेल फ़ंक्शंस देता है जो "अच्छा" (बंधे, निरंतर) कार्यों को मनमाने ढंग से ठीक कर सकता है। गाऊसी और लाप्लास गुठली सार्वभौमिक हैं। एक बहुपद कर्नेल, उदाहरण के लिए, नहीं है।च ∈ एच एफ जी ‖ ⋅ ‖ ∞ )gf∈Hfg∥⋅∥∞)
क्यों, हम एक Cauchy पीडीएफ के माध्यम से आदर्श नहीं कहते हैं, और एक ही परिणाम की उम्मीद है?
सामान्य तौर पर, आप तब तक कुछ भी कर सकते हैं जब तक कि परिणामी
सकारात्मक निश्चित है। सकारात्मक निश्चितता को
लिए सभी , और सभी
(प्राकृतिक संख्याओं का सेट) । यदि सकारात्मक निश्चित नहीं है, तो यह एक आंतरिक उत्पाद स्थान के अनुरूप नहीं है। सभी विश्लेषण टूट जाते हैं क्योंकि आपके पास उल्लिखित फ़ंक्शन का स्थान भी नहीं होता है
। बहरहाल, यह अनुभवजन्य रूप से काम कर सकता है। उदाहरण के लिए, अतिशयोक्तिपूर्ण स्पर्शरेखा कर्नेल ( इस पृष्ठ पर नंबर 7 देखें )Σ एन मैं = 1 Σ एन जे = 1 कश्मीर ( एक्स मैं , एक्स जे ) α मैं α j > 0 α मैं ∈ आर { x मैं } एन मैं = 1 एन ∈ एन कश्मीर एचk∑Ni=1∑Nj=1k(xi,xj)αiαj>0αi∈R{xi}Ni=1N∈NkH
k(x,y)=tanh(αx⊤y+c)
जिसका उद्देश्य तंत्रिका नेटवर्क में सिग्मॉइड सक्रियण इकाइयों की नकल करना है, केवल और की कुछ सेटिंग्स के लिए सकारात्मक निश्चित है । फिर भी यह बताया गया कि यह व्यवहार में काम करता है।सीαc
अन्य प्रकार की सुविधाओं के बारे में क्या?
मैंने कहा कि विशेषताएं अद्वितीय नहीं हैं। गॉसियन कर्नेल के लिए, सुविधाओं का एक और सेट मर्सर विस्तार द्वारा दिया गया है । प्रसिद्ध गाऊसी प्रक्रिया पुस्तक की धारा 4.3.1 देखें । इस स्थिति में, विशेषताएँ पर मूल्यांकन किए गए हर्मीट बहुपद हैं ।एक्सϕ(x)x