(यह ग्रेंजर एंड न्यूबोल्ड (1986) "फोरकास्टिंग इकोनॉमिक टाइम सीरीज़" से एक अनुकूलन है)।
निर्माण करके, अपने त्रुटि लागत समारोह है । यह एक महत्वपूर्ण धारणा को शामिल करता है (कि त्रुटि लागत फ़ंक्शन शून्य के आसपास सममित है) -एक अलग त्रुटि लागत फ़ंक्शन आवश्यक रूप से सशर्त अपेक्षित मूल्य नहीं होगा जैसा कि इसके अपेक्षित मूल्य के है। आप अपनी त्रुटि लागत फ़ंक्शन को कम नहीं कर सकते क्योंकि इसमें अज्ञात मात्राएँ हैं। तो आप इसके बजाय इसके अपेक्षित मूल्य को कम करने का निर्णय लेते हैं। तब आपका उद्देश्य कार्य बन जाता है[Y−g(X)]2argmin
E[Y−g(X)]2=∫∞−∞[y−g(X)]2fY|X(y|x)dy
जो मैं मानता हूं कि उत्तर आपके दूसरे प्रश्न भी हैं। यह सहज है कि पर मूल्य सशर्त होगा , क्योंकि हम आधार पर का अनुमान लगाने / पूर्वानुमान करने की कोशिश कर रहे हैं । प्राप्त करने के लिए वर्ग का विरोध करेंYXYX
E[Y−g(X)]2=∫∞−∞y2fY|X(y|x)dy−2g(X)∫∞−∞yfY|X(y|x)dy+[g(X)]2∫∞−∞fY|X(y|x)dy
पहले शब्द में नहीं है, इसलिए यह न्यूनता को प्रभावित नहीं करता है, और इसे अनदेखा किया जा सकता है। दूसरे कार्यकाल में अभिन्न की सशर्त उम्मीद मूल्य के बराबर होती है दिया , और अंतिम पद में अभिन्न एकता के बराबर होती है। इसलिएg(X)YX
argming(x)E[Y−g(X)]2=argming(x){−2g(X)E(Y∣X)+[g(X)]2}
पहले व्युत्पन्न wrt है न्यूनीकरण के लिए पहले के आदेश हालत के लिए अग्रणी , जबकि दूसरा व्युत्पन्न के बराबर है जो न्यूनतम के लिए पर्याप्त है।g(X)−2E(Y∣X)+2g(X)g(X)=E(Y∣X)2>0
ADDENDUM: प्रमाण दृष्टिकोण को "जोड़ें और घटाएं" का तर्क।
ओपी प्रश्न में बताए गए दृष्टिकोण से हैरान है, क्योंकि यह तांत्रिक लगता है। यह नहीं है, क्योंकि जोड़ने और घटाने की रणनीति का उपयोग करते हुए जोड़े और घटाए गए शब्द की मनमानी पसंद के लिए उद्देश्य फ़ंक्शन का एक विशिष्ट हिस्सा शून्य हो जाता है, यह मूल्य फ़ंक्शन , अर्थात् उद्देश्य के मूल्य की बराबरी नहीं करता है उम्मीदवार न्यूनतम पर मूल्यांकन कार्य।
पसंद हमारे पास मान फ़ंक्शन
मनमानी पसंद हमारे पास मूल्य वर्धन ।g(X)=E(Y∣X)V(E(Y∣X))=E[(Y−E(Y∣X))2∣X]g(X)=h(X)V(h(X))=E[(Y−h(X))2∣X]
मैं दावा करता हूं कि
V(E(Y∣X))≤V(h(X))
⇒E(Y2∣X)−2E[(YE(Y∣X))∣X]+E[(E(Y∣X))2∣X]≤E(Y2∣X)−2E[(Yh(X))∣X]+E[(h(X))2∣X]
LHS और RHS का पहला कार्यकाल रद्द हो जाता है। यह भी ध्यान दें कि पर बाहरी अपेक्षा सशर्त है । सशर्त अपेक्षाओं के गुणों के साथ हम समाप्त होते हैंX
...⇒−2E(Y∣X)⋅E(Y∣X)+[E(Y∣X)]2≤−2E(Y∣X)h(X)+[h(X)]2
⇒0≤[E(Y∣X)]2−2E(Y∣X)h(X)+[h(X)]2
⇒0≤[E(Y∣X)−h(x)]2
जो सख्त असमानता के साथ रखती है अगर । तो ग्लोबल और यूनिक मिनिमाइज़र है।
h(x)≠E(Y∣X)E(Y∣X)
लेकिन यह भी कहता है कि "ऐड-एंड-घटाना" दृष्टिकोण यहां प्रमाण का सबसे रोशन तरीका नहीं है।