अपेक्षित पूर्वानुमान त्रुटि - व्युत्पत्ति


20

मैं प्रति व्यक्ति (ईएसएल) प्रति पूर्वानुमानित त्रुटि की व्युत्पत्ति को समझने के लिए संघर्ष कर रहा हूं, विशेष रूप से 2.11 और 2.12 (कंडीशनिंग, बिंदु-वार न्यूनतम की ओर कदम) की व्युत्पत्ति पर। किसी भी संकेत या लिंक बहुत सराहना की।

नीचे मैं ईएसएल पृष्ठ से अंश की रिपोर्ट कर रहा हूं। 18. पहले दो समीकरण हैं, क्रम में, समीकरण 2.11 और 2.12।


चलो कोई वास्तविक मूल्यवान यादृच्छिक इनपुट वेक्टर, AND दर्शा एक असली मूल्यवान यादृच्छिक उत्पादन चर, संयुक्त वितरण के साथ । हम इनपुट दिए गए मानों की भविष्यवाणी के लिए एक फ़ंक्शन चाहते हैं । इस थ्योरी के लिए पूर्वानुमान में त्रुटियों को दंडित करने के लिए एक हानि फ़ंक्शन आवश्यकता होती है , और अब तक सबसे सामान्य और सुविधाजनक चुकता त्रुटि हानि है : । यह हमें चुनने के लिए एक कसौटी की ओर ले जाता है ,XRpYRPr(X,Y)f(X)YX L(Y,f(X))L(Y,f(X))=(Yf(X))2f

EPE(f)=E(Yf(X))2=[yf(x)]2Pr(dx,dy)

अपेक्षित (चुकता) पूर्वानुमान त्रुटि। पर कंडीशनिंग करके , हम EPE को इस प्रकार लिख सकते हैंX

EPE(f)=EXEY|X([Yf(X)]2|X)

और हम देखते हैं कि यह EPE बिंदु-वार को कम करने के लिए पर्याप्त है:

f(x)=argmincEY|X([Yc]2|X)

उपाय है

f(x)=E(Y|X=x)

सशर्त अपेक्षा, जिसे प्रतिगमन समारोह के रूप में भी जाना जाता है।


कुल अपेक्षा के कानून पर विकिपीडिया लेख में पहले समीकरण में और अदला-बदली (2.9) और (2.11) की समानता देता है। प्रमाण के लिए वह लेख पढ़ें। (२.१२) तत्काल है, इस समझ पर कि ईपीई को कम करने के लिए को चुना जाना है। वाई एफXYf
whuber


2
इस पुस्तक को पढ़ने वाले लोगों के लिए,
वेथर्मैक्स

@ डोडी वह लिंक मर गया है: (
मैथ्यू ड्र्यू

2
@MatthewDrury सौभाग्य से "वेदरमैक्स और एपस्टीन सांख्यिकी" की एक गुगली ने
Authors

जवाबों:


16

EPE(f)=[yf(x)]2Pr(dx,dy)=[yf(x)]2p(x,y)dxdy=xy[yf(x)]2p(x,y)dxdy=xy[yf(x)]2p(x)p(y|x)dxdy=x(y[yf(x)]2p(y|x)dy)p(x)dx=x(EY|X([Yf(X)]2|X=x))p(x)dx=EXEY|X([Yf(X)]2|X=x)

3
मैं समझता हूं कि आपने क्या लिखा है, लेकिन क्या आपको लगता है कि अगर ओपी को इस सवाल में दिखाया गया व्युत्पत्ति से भ्रमित किया गया था, कि वह आपके जवाब को समझेगा? बेशक, मैंने पहले ही प्रश्न में दिखाए गए व्युत्पत्ति को समझ लिया था।
मार्क एल। स्टोन

मैं एक ही सवाल के साथ Google से यहां आया था और वास्तव में इस व्युत्पत्ति को वैसा ही पाया जैसा मुझे चाहिए था।
सेमीकॉलन और डक्ट टेप

1
@ MarkL.Stone - यह एक बेवकूफी भरा सवाल हो सकता है, लेकिन क्या आप बता सकते हैं कि क्या मतलब है Pr(dx,dy)और यह कैसे बन जाता है p(x,y)dxdy? धन्यवाद एक गुच्छा
जेवियर बोरेट सिसिलोट

1
पूर्व का जो अर्थ है वह बाद का है। मुझे लगता है कि इसके बजाय dP (x, y) या dF (x, y) का उपयोग करना अधिक सामान्य है। 1D में, आप अक्सर dF (x) का अर्थ f (x) dx देखेंगे, जहाँ f (x) प्रायिकता घनत्व फ़ंक्शन है, लेकिन अंकन असतत प्रायिकता मास फ़ंक्शन (संक्षेप में) या यहां तक ​​कि मिश्रण का भी अनुमति दे सकता है निरंतर घनत्व और असतत संभावना द्रव्यमान।
मार्क एल। स्टोन

कहना ज्यादा सटीक नहीं होगा (अंतिम सूत्र) ? EX(EY|X([Yf(X)]2|X=x))
D1X

12

समीकरण (2.11) निम्नलिखित छोटी समानता का एक परिणाम है। किसी भी दो यादृच्छिक चर और Z 2 के लिए , और कोई फ़ंक्शन जीZ1Z2g

EZ1,Z2(g(Z1,Z2))=EZ2(EZ1Z2(g(Z1,Z2)Z2))

संकेतन संयुक्त वितरण की अपेक्षा है । अंकन जेड 1 | जेड 2 अनिवार्य रूप से कहते हैं, "की सशर्त वितरण पर एकीकृत जेड 1 के रूप में अगर जेड 2 तय किया गया था"।EZ1,Z2EZ1Z2Z1Z2

इस मामले में यह सत्यापित करना आसान है कि और जेड 2 केवल शामिल परिभाषाओं को खोलकर यादृच्छिक चर असतत हैंZ1Z2

EZ2(EZ1Z2(g(Z1,Z2)Z2))=EZ2(z1g(z1,Z2)Pr(Z1=z1Z2))=z2(z1g(z1,z2)Pr(Z1=z1Z2=z2))Pr(Z2=z2)=z1,z2g(z1,z2)Pr(Z1=z1Z2=z2)Pr(Z2=z2)=z1,z2g(z1,z2)Pr(Z1=z1,Z2=z2)=EZ1,Z2(g(Z1,Z2))

निरंतर मामले को या तो अनौपचारिक रूप से इस तर्क की सीमा के रूप में देखा जा सकता है, या औपचारिक रूप से सत्यापित हो जाने के बाद कि सभी उपाय सिद्धांतिक डो-डैड जगह पर हैं।

आवेदन को कम करने के लिए, , Z 2 = X , और g ( x , y ) = ( y - f ( x ) ) 2 लें । सब कुछ ठीक-ठाक।Z1=YZ2=Xg(x,y)=(yf(x))2

दावे (2.12) हमें कम से कम विचार करने के लिए कहते हैं

EXEYX(Yf(X))2

जहाँ हम अपनी इच्छानुसार चुनने के लिए स्वतंत्र हैं । फिर, असतत मामले पर ध्यान केंद्रित करते हुए, और आधे रास्ते को ऊपर की ओर खोलना में, हम देखते हैं कि हम कम कर रहे हैंf

x(y(yf(x))2Pr(Y=yX=x))Pr(X=x)

बड़े कोष्ठक के अंदर सब कुछ गैर-नकारात्मक है, और आप व्यक्तिगत रूप से सारांश को न्यूनतम करके गैर-नकारात्मक मात्रा का योग कर सकते हैं। संदर्भ में, इसका मतलब है कि हम को न्यूनतम करने के लिए चुन सकते हैंf

y(yf(x))2Pr(Y=yX=x)

प्रत्येक असतत मूल्य के लिए व्यक्तिगत रूप से । यह बिल्कुल वही सामग्री है जो ईएसएल दावा कर रही है, केवल कट्टरपंथी संकेतन के साथ।x


8

मुझे इस पुस्तक एक्सप्रेस में कुछ हिस्से ऐसे मिले हैं, जिन्हें समझना मुश्किल है, खासकर उन लोगों के लिए, जिनकी सांख्यिकी में मजबूत पृष्ठभूमि नहीं है।

I will try to make it simple and hope that you can get rid of confusion.

Claim 1 (Smoothing) E(X)=E(E(X|Y)),X,Y

Proof: Notice that E(Y) is a constant but E(Y|X) is a random variable depending on X.

E(E(X|Y))=E(X|Y=y)fY(y)dy=xfX|Y(x|y)dxfY(y)dy=xfX|Y(x|y)fY(y)dxdy=xfXY(x,y)dxdy=x(fXY(x,y)dy)dx=xfX(x)dx=E(X)

Claim 2: E(Yf(X))2E(YE(Y|X))2,f

Proof:

E((Yf(X))2|X)=E(([YE(Y|X)]+[E(Y|X)f(X)])2|X)=E((YE(Y|X))2|X)+E((E(Y|X)f(X))2|X)+2E((YE(Y|X))(E(Y|X)f(X))|X)=E((YE(Y|X))2|X)+E((E(Y|X)f(X))2|X)+2(E(Y|X)f(X))E(YE(Y|X))|X)( since E(Y|X)f(X) is constant given X)=E((YE(Y|X))2|X)+E((E(Y|X)f(X))2|X) ( use Claim 1 )E((YE(Y|X))2|X)

Taking expectation both sides of the above equation give Claim 2 (Q.E.D)

Therefore, the optimal f is f(X)=E(Y|X)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.