LOOCV फॉर्मूला का प्रमाण


18

से सांख्यिकीय लर्निंग के लिए एक परिचय जेम्स द्वारा एट अल।, छुट्टी-एक-बाहर पार सत्यापन (LOOCV) अनुमान से परिभाषित किया गया है जहां ।

CV(n)=1ni=1nMSEi
MSEi=(yiy^i)2

प्रमाण के बिना, समीकरण (5.2) बताता है कि कम से कम वर्गों या बहुपद प्रतिगमन के लिए (चाहे यह केवल एक चर पर प्रतिगमन पर लागू होता है मेरे लिए अज्ञात है), जहां " है मूल कम से कम वर्गों से वें सज्जित मूल्य (फिट पता नहीं इसका क्या मतलब, वैसे , इसका उपयोग करने से मतलब है सभी डेटा सेट? में अंकों की) और h_i लाभ उठाने "जिसके द्वारा परिभाषित किया गया है है h_i = \ dfrac {1} {n} + \ _ dfrac {(x_i - \ bar {x}) ^ 2} {\ _ \ _ limit_ {j = 1} ^ {n} (x_j - \ bar {x}) 2} \ _ पाठ {।}yमैंमैं

CV(n)=1ni=1n(yiy^i1hi)2
y^iihi
hi=1n+(xix¯)2j=1n(xjx¯)2.

यह कैसे साबित होता है?

मेरे प्रयास: एक देख कि द्वारा शुरू कर सकता है

y^i=β0+i=1kβkXk+some polynomial terms of degree 2
लेकिन अलग इससे (और अगर मुझे याद है, तो h_i के लिए यह सूत्र hiकेवल सरल रैखिक प्रतिगमन के लिए सही है ...), मुझे यकीन नहीं है कि यहां से कैसे आगे बढ़ना है।

या तो आपके समीकरण i एक से अधिक चीजों के लिए उपयोग करने लगते हैं या मैं अत्यधिक भ्रमित हूं। किसी भी तरह से अतिरिक्त स्पष्टता अच्छी होगी।
Glen_b -Reinstate Monica

@Glen_b मैं कल ही LOOCV के बारे में जान गया था, इसलिए मैं शायद कुछ चीजों को ठीक से समझ नहीं पाया। जो मैं समझता हूं, आपके पास डेटा बिंदुओं का एक सेट है, । LOOCV साथ, आप प्रत्येक (पूर्णांक सकारात्मक) तय करने के लिए है कुछ सत्यापन सेट और एक परीक्षण सेट प्रत्येक लिए एक फिट मॉडल उत्पन्न करता था । तो कहते हैं, उदाहरण के लिए, हम तीन डेटा बिंदुओं, साथ सरल रेखीय प्रतिगमन का उपयोग करके अपने मॉडल को फिट करते हैं । हमारे पास (जारी रखने के लिए) होगाX={(xi,yi):iZ+}kVk={(xk,yk)}Tk=XVkkX={(0,1),(1,2),(2,3)}
क्लैरिएनिस्ट

@Glen_b और । में बिंदुओं का उपयोग करके , हम पा सकते हैं कि एक सरल रेखीय प्रतिगमन का उपयोग करके, हमें मॉडल । फिर हम गणना का उपयोग कर सत्यापन सेट के रूप में और प्राप्त (बस बिंदु दिए गए प्रयोग करके) और , । ठीक है, शायद सुपरस्क्रिप्ट का उपयोग करना सबसे अच्छा विचार नहीं था - मैं इसे मूल पोस्ट में बदल दूंगा। टी 1 ={(1,2),(2,3)} टी 1 y मैं =एक्स+1एमएसई वी 1 y 1 =1 y ( 1 ) 1 =0+1=1 एमएसई 1 =0V1={(0,1)}T1={(1,2),(2,3)}T1y^i=X+1MSEV1y1=1y^1(1)=0+1=1MSE1=0
क्लैरिनेटिस्ट

यहाँ व्युत्पन्न पृष्ठों
जेवियर

जवाबों:


17

मैं किसी भी कई रैखिक प्रतिगमन के लिए परिणाम दिखाऊंगा, चाहे को बहुपद हैं या नहीं। वास्तव में, यह आपके द्वारा पूछे जाने की तुलना में थोड़ा अधिक दिखाता है, क्योंकि यह दर्शाता है कि प्रत्येक एलओओसीवी अवशिष्ट पूर्ण प्रतिगमन से संबंधित लीवरेज-वेटेड अवशिष्ट के समान है, न कि केवल आप (5.2) के रूप में एलओओसीवी त्रुटि प्राप्त कर सकते हैं। अन्य तरीके हो सकते हैं जिसमें औसत सहमत हैं, भले ही औसत में प्रत्येक शब्द समान न हो)।Xt

मुझे थोड़ा अनुकूलित नोटेशन का उपयोग करने के लिए स्वतंत्रता लेनी चाहिए।

हम पहले दिखाते हैं कि जहां सभी डेटा और कर अनुमान है बाहर निकलते समय अनुमान , अवलोकन । आइए एक पंक्ति वेक्टर के रूप में परिभाषित किया जा ऐसी है कि । अवशिष्ट हैं।

β^β^(t)=(u^t1ht)(XX)1Xt,(A)
β^β^(t)X(t)tXty^t=Xtβ^u^t

प्रमाण निम्नलिखित मैट्रिक्स बीजीय परिणाम का उपयोग करता है।

आज्ञा देना nonsingular मैट्रिक्स, एक वेक्टर और एक अदिश। यदि तब Abλ

λ1bA1b
(A+λbb)1=A1(λ1+λbA1b)A1bbA1(B) 

(बी) के प्रमाण का सत्यापन तुरंत से

{A1(λ1+λbA1b)A1bbA1}(A+λbb)=I.

निम्नलिखित परिणाम साबित करने के लिए सहायक है (ए)

(X(t)X(t))1Xt=(11ht)(XX)1Xt. (C)

(सी) का सबूत: तक (बी) हमारे पास है, का उपयोग करते हुए , तो हम t=1TXtXt=XX

(X(t)X(t))1=(XXXtXt)1=(XX)1+(XX)1XtXt(XX)11Xt(XX)1Xt.
(X(t)X(t))1Xt=(XX)1Xt+(XX)1Xt(Xt(XX)1Xt1Xt(XX)1Xt)=(11ht)(XX)1Xt.

(A) का प्रमाण अब (C) से निम्नानुसार है: As हम और , इसलिए जहां (सी) से अंतिम समानता निम्नानुसार है।

XXβ^=Xy,
(X(t)X(t)+XtXt)β^=X(t)y(t)+Xtyt,
{Ik+(X(t)X(t))1XtXt}β^=β^(t)+(X(t)X(t))1Xt(Xtβ^+u^t).
β^=β^(t)+(X(t)X(t))1Xtu^t=β^(t)+(XX)1Xtu^t1ht,

अब, नोट । द्वारा (A) के माध्यम से गुणा करें , दोनों तरफ जोड़ें और के साथ प्राप्त करने के लिए पुनर्व्यवस्थित करें, जिसके परिणामस्वरूप ( , या ht=Xt(XX)1XtXtytu^(t)β^(t)ytXtβ^(t)

u^(t)=u^t+(u^t1ht)ht
u^(t)=u^t(1ht)+u^tht1ht=u^t1ht

आपके उत्तर में की परिभाषा गायब है। मुझे लगता है कि यह एक मैट्रिक्स जिसमें पंक्ति हटा दिया गया है। X(t)XXt
एमपिकटास

इस तथ्य का भी उल्लेख करना कि भी उपयोगी होगा। XX=t=1TXtXt
एमपिकेटास

@mpiktas, हाँ, संकेत के लिए धन्यवाद। मैंने पहली टिप्पणी को ध्यान में रखा। वास्तव में दूसरी मदद कहां होगी? या बस इसे अपनी टिप्पणी में छोड़ दें?
क्रिस्टोफ हनक

3
जब आप (C) का प्रमाण शुरू करते हैं तो आप लिखते हैं । यह एक अच्छी चाल है, लेकिन मुझे संदेह है कि आकस्मिक पाठक इसके बारे में जानते हैं। (X(t)X(t))1=(XXXtXt)1
mpiktas

1
दो साल बाद ... मैं इस जवाब की और भी सराहना करता हूं, अब जब मैं स्नातक स्तर के रैखिक मॉडल अनुक्रम से गुजर चुका हूं। मैं इस सामग्री को इस नए दृष्टिकोण के साथ फिर से सीख रहा हूं। क्या आपके पास कोई सुझावित संदर्भ (पाठ्यपुस्तकें) हैं जो व्युत्पत्तियों से गुजरते हैं जैसे कि आपके पास इस उत्तर में विस्तार से क्या है?
शहनाई
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.