कैसे साबित किया जाए कि रेडियल आधार फ़ंक्शन एक कर्नेल है?


35

यह कैसे साबित करें कि रेडियल आधार फ़ंक्शन एक कर्नेल है? जहां तक ​​मैं समझता हूं, यह साबित करने के लिए हमें निम्नलिखित में से किसी एक को साबित करना होगा:k(x,y)=exp(||xy||2)2σ2)

  1. वैक्टर मैट्रिक्स = के किसी भी सेट के लिए सकारात्मक अर्धविराम है।x1,x2,...,xnK(x1,x2,...,xn)(k(xi,xj))n×n

  2. एक मानचित्रण Φ रूप में इस तरह प्रस्तुत किया जा सकता k(x,y) = ।Φ(x),Φ(y)

कोई मदद?


1
बस इसे और अधिक स्पष्ट रूप से लिंक करने के लिए: इस सवाल में फ़ीचर मैप पर भी चर्चा की गई है , विशेष रूप से टेलर श्रृंखला और खदान पर आधारित मार्क क्लेसेन के उत्तर पर जो आरकेएचएस और डगलस द्वारा दिए गए एल 2 एम्बेडिंग के सामान्य संस्करण दोनों पर चर्चा करता है । L2
डगल

जवाबों:


26

ज़ेन उपयोग विधि 1. यहाँ विधि 2 है: मैप x एक गोलाकार सममित गौसियन वितरण में हिल्बर्ट अंतरिक्ष एल 2 में पर केंद्रित है । मानक विचलन और एक स्थिर कारक को ठीक से काम करने के लिए इसे मोड़ना होगा। उदाहरण के लिए, एक आयाम में,xL2

exp[(xz)2/(2σ2)]2πσexp[(yz)2/(2σ2)2πσdz=exp[(xy)2/(4σ2)]2πσ.

तो, के मानक विचलन का उपयोग σ/2 और गाऊसी वितरण पैमाने पर प्राप्त करने के लिएk(x,y)=Φ(x),Φ(y)। यह अंतिम पुनर्विक्रय होता है क्योंकिसामान्य वितरण काL2मानक सामान्य रूप सेनहीं है1


2
@ ज़ेन, डगलस ज़ारे: आपके शानदार जवाब के लिए धन्यवाद। अब मुझे आधिकारिक उत्तर का चयन कैसे करना चाहिए?
सिंह

23

मैं विधि 1 का उपयोग करूंगा। विधि 2 का उपयोग करते हुए एक प्रमाण के लिए डगलस ज़ारे के उत्तर की जाँच करें।

मैं मामला है जब साबित होगा , वास्तविक संख्याएं हैं तो कश्मीर ( एक्स , वाई ) = exp ( - ( एक्स - y ) 2 / 2 σ 2 ) । सामान्य मामला एक ही तर्क से उत्परिवर्ती उत्परिवर्तन का अनुसरण करता है, और करने योग्य है।x,yk(x,y)=exp((xy)2/2σ2)

व्यापकता की हानि के बिना, मान लीजिए कि σ2=1

, जहां h ( t ) = exp ( - t 2 ) लिखेंk(x,y)=h(xy)एन(0,1)वितरण केसाथएक यादृच्छिक चरजेडकी विशेषता कार्य है।

h(t)=exp(t22)=E[eitZ]
ZN(0,1)

वास्तविक संख्या के लिए और एक 1 , ... , एक n , हम n Σ j , k = 1 के लिए एक jx1,,xna1,,an जो यहकहता हैकि k एक सकारात्मक अर्धचालक कार्य है, उर्फ ​​कर्नेल है।

j,k=1najakh(xjxk)=j,k=1najakE[ei(xjxk)Z]=E[j,k=1najeixjZakeixkZ]=E[|j=1najeixjZ|2]0,
k

इस परिणाम को अधिक सामान्यता में समझने के लिए, Bochner की प्रमेय की जाँच करें: http://en.wikipedia.org/wiki/Positive-definite_function


2
यह एक अच्छी शुरुआत है, दो दिशाओं के साथ, सही दिशा में: (ए) दिखाए गए अपेक्षा के बराबर नहीं है (घातांक में संकेत की जांच करें) और (बी) यह इस मामले पर ध्यान देने के लिए प्रकट होता है जहां x और y स्केलर हैं न कि वैक्टर। मैंने इस बीच अपवित्र किया है, क्योंकि प्रदर्शनी अच्छी और साफ है और मुझे यकीन है कि आप जल्दी से इन छोटे अंतरालों को प्लग करेंगे। :-)h(t)xy
कार्डिनल

1
टी.के.एस! मैं यहां जल्दी में हूं। :-)
ज़ेन

1
क्षमा करें, मैं वास्तव में यह नहीं देखता कि आप यहां के म्यूटिस म्यूटेंडिस का प्रबंधन कैसे करते हैं। यदि आप फॉर्म में पास होने से पहले मानदंड विकसित करते हैं , तो आपको उत्पाद मिल गए हैं और आप उत्पादों और राशि को स्वैप नहीं कर सकते। और मैं बस यह नहीं देखता हूं कि एक अच्छी अभिव्यक्ति प्राप्त करने के लिए एच फॉर्म में पास होने के बाद आदर्श कैसे विकसित किया जाए। क्या आप मुझे वहां ले जा सकते हैं? :)h
अल्बर्कर्क

23

मैं एक तीसरी विधि जोड़ूंगा, बस विविधता के लिए: पीडी कर्नेल बनाने के लिए ज्ञात सामान्य चरणों के अनुक्रम से कर्नेल का निर्माण। चलो निरूपित नीचे और कर्नेल के डोमेन φ सुविधा नक्शे।Xφ

  • Scalings: यदि एक पीडी गिरी है, इसलिए है γ κ किसी भी निरंतर के लिए γ > 0κγκγ>0

    सबूत: अगर के लिए सुविधा नक्शा है κ , φκके लिए एक वैध सुविधा नक्शा हैगामाκγφγκ

  • रकम: यदि और κ 2 पीडी कर्नेल हैं, इसलिए है κ 1 + κ 2κ1κ2κ1+κ2

    φ1φ2x[φ1(x)φ2(x)]

  • κ1,κ2,κ(x,y):=limnκn(x,y)x,yκ

    Proof: For each m,n1 and every {(xi,ci)}i=1mX×R we have that i=1mciκn(xi,xj)cj0. Taking the limit as n gives the same property for κ.

  • Products: If κ1 and κ2 are pd kernels, so is g(x,y)=κ1(x,y)κ2(x,y).

    Proof: It follows immediately from the Schur product theorem, but Schölkopf and Smola (2002) give the following nice, elementary proof. Let

    (V1,,Vm)N(0,[κ1(xi,xj)]ij)(W1,,Wm)N(0,[κ2(xi,xj)]ij)
    be independent. Thus
    Cov(ViWi,VjWj)=Cov(Vi,Vj)Cov(Wi,Wj)=κ1(xi,xj)κ2(xi,xj).
    Covariance matrices must be psd, so considering the covariance matrix of (V1W1,,VnWn) proves it.
  • Powers: If κ is a pd kernel, so is κn(x,y):=κ(x,y)n for any positive integer n.

    Proof: immediate from the "products" property.

  • Exponents: If κ is a pd kernel, so is eκ(x,y):=exp(κ(x,y)).

    Proof: We have eκ(x,y)=limNn=0N1n!κ(x,y)n; use the "powers", "scalings", "sums", and "limits" properties.

  • Functions: If κ is a pd kernel and f:XR, g(x,y):=f(x)κ(x,y)f(y) is as well.

    Proof: Use the feature map xf(x)φ(x).

Now, note that

k(x,y)=exp(12σ2xy2)=exp(12σ2x2)exp(1σ2xTy)exp(12σ2y2).
Start with the linear kernel κ(x,y)=xTy, apply "scalings" with 1σ2, apply "exponents", and apply "functions" with xexp(12σ2x2).
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.