संख्यात्मक स्थिरता और ओवरफिटिंग कुछ अर्थों में अलग-अलग लेकिन अलग-अलग मुद्दों पर हैं।
क्लासिक OLS समस्या:
क्लासिक कम से कम वर्गों की समस्या पर विचार करें:
छोटा करना( ओवर बी )( y - एक्सख)टी( y - एक्सबी )
समाधान क्लासिक । एक विचार यह है कि बड़ी संख्या के कानून द्वारा:b^=(X′X)−1(X′y)
limn→∞1nX′X→E[xx′]limn→∞1nX′y→E[xy]
इसलिए ओएलएस अनुमान भी । (रैखिक बीजगणित शब्दों में, यह यादृच्छिक चर के रैखिक काल पर यादृच्छिक चर का रैखिक प्रक्षेपण है ।)b^E[xx′]−1E[xy]yx1,x2,…,xk
समस्या?
यंत्रवत्, क्या गलत हो सकता है? संभावित समस्याएं क्या हैं?
- छोटे नमूनों के लिए, हमारा नमूना और खराब होने का अनुमान लगा सकता है।E[xx′]E[xy]
- यदि कॉलम समतुल्य हैं (या तो अंतर्निहित संपुटितता या छोटे नमूने के आकार के कारण), तो समस्या का समाधान जारी रहेगा! समाधान अद्वितीय नहीं हो सकता है।
X
- यह तब होता है जब रैंक की कमी होती है।E[xx′]
- यह तब भी होता है यदि मुद्दों की संख्या के सापेक्ष छोटे नमूने के आकार के कारण रैंक की कमी है।X′X
समस्या (1) के कारण ओवरफिटिंग हो सकती है क्योंकि अनुमान नमूने में पैटर्न को प्रतिबिंबित करना शुरू कर देता है जो कि अंतर्निहित आबादी में नहीं हैं। अनुमान और में पैटर्न को प्रतिबिंबित कर सकता है जो वास्तव में में मौजूद नहीं है औरb^1nX′X1nX′yE[xx′]E[xy]
समस्या (2) का अर्थ है एक समाधान अद्वितीय नहीं है। कल्पना कीजिए कि हम व्यक्तिगत जूतों की कीमत का अनुमान लगाने की कोशिश कर रहे हैं, लेकिन जूतों के जोड़े हमेशा एक साथ बिकते हैं। यह एक बीमार समस्या है, लेकिन मान लीजिए कि हम इसे वैसे भी कर रहे हैं। हम विश्वास कर सकते हैं कि बाएं जूते की कीमत और सही जूते की कीमत $ 50 के बराबर है , लेकिन हम व्यक्तिगत कीमतों के साथ कैसे आ सकते हैं? क्या बाएं जूते की कीमत और दाएं जूते की कीमत ठीक है? हम सभी संभावनाओं से कैसे चुन सकते हैं?pl=45pr=5
पेश है जुर्माना:L2
अब विचार करें:
minimize(over b)(y−Xb)T(y−Xb)+λ∥b∥2
इससे हमें दोनों प्रकार की समस्याओं में मदद मिल सकती है। दंड का हमारा अनुमान धक्का शून्य की ओर। यह एक बायेसियन के रूप में प्रभावी रूप से पहले कार्य करता है कि गुणांक मानों पर वितरण आसपास केंद्रित है । जो ओवरफिटिंग में मदद करता है। हमारा अनुमान डेटा और हमारी प्रारंभिक मान्यताओं दोनों को प्रतिबिंबित करेगा कि शून्य के पास है।L2b0b
L2 नियमितीकरण भी हमें हमेशा बीमार समस्याओं के लिए एक अनूठा समाधान खोजने के लिए। यदि हम बाएं और दाएं जूते की कीमत कुल जानते हैं , तो मान को न्यूनतम करने समाधान ।$50L2pl=pr=25
क्या यह जादू है? नियमितीकरण डेटा जोड़ने के समान नहीं है जो वास्तव में हमें सवाल का जवाब देने की अनुमति देगा। कुछ अर्थों में नियमितीकरण इस दृष्टिकोण को अपनाता है कि यदि आपके पास डेटा की कमी है, तो अनुमानों को करीब चुनें ।L20