... अपेक्षित [चुकता त्रुटि] नुकसान एक चुकता पूर्वाग्रह अवधि में विघटित हो सकता है (जो वर्णन करता है कि सच्चे मॉडल से औसत भविष्यवाणियां कितनी दूर हैं), एक विचरण शब्द (जो औसत के आसपास की भविष्यवाणियों के प्रसार का वर्णन करता है), और एक शोर शब्द (जो डेटा का आंतरिक शोर देता है)।
जब चुकता त्रुटि को देखते हुए अपघटन
मुझे केवल दो शब्द दिखाई देते हैं: एक पूर्वाग्रह के लिए और दूसरा एक अनुमानक या भविष्यवक्ता के विचरण के लिए, । अपेक्षित नुकसान में कोई अतिरिक्त शोर नहीं है। चूँकि परिवर्तनशीलता होनी चाहिए क्योंकि परिवर्तनशीलता , न कि केवल नमूने की।
Eθ[(θ−δ(X1:n))2]=(θ−Eθ[δ(X1:n)])2+Eθ[(Eθ[δ(X1:n)]−δ(X1:n))2]
δ ( एक्स 1 : एन )δ(X1:n)δ(X1:n)
- क्या पूर्वाग्रह-विघटन अपघटन को नुकसान वाले कार्यों के अलावा चुकता नुकसान के साथ किया जा सकता है?
चुकता पूर्वाग्रह + विचरण विघटन [और जिस तरह से मैं इसे सिखाता हूं] की मेरी व्याख्या यह है कि यह पाइथागोर के प्रमेय के सांख्यिकीय समतुल्य है, अर्थात् एक अनुमानक और एक निश्चित सेट के भीतर एक बिंदु के बीच चुकता दूरी वर्ग दूरी का योग है। एक अनुमानक और सेट के बीच, सेट पर ऑर्थोगोनल प्रक्षेपण और सेट के भीतर बिंदु के बीच की चुकता दूरी। किसी दिए गए मॉडल के डेटासेट के साथ एक दूरी के आधार पर कोई भी नुकसान, क्या एक से अधिक मॉडल है जिसकी अपेक्षित हानि सभी मॉडलों पर न्यूनतम है, और यदि ऐसा है, तो इसका मतलब है कि पूर्वाग्रह और भिन्नता के विभिन्न संयोजन हो सकते हैं जो उपज देते हैं समान न्यूनतम अपेक्षित हानि; ओर्थोगोनल प्रक्षेपण की भावना, अर्थात, एक आंतरिक उत्पाद, अर्थात, अनिवार्य रूप से हिल्बर्ट रिक्त स्थान, इस अपघटन को संतुष्ट करता है।
- किसी दिए गए मॉडल डेटासेट के लिए, क्या एक से अधिक मॉडल हैं जिनकी अपेक्षित हानि सभी मॉडलों पर न्यूनतम है, और यदि ऐसा है, तो क्या इसका मतलब यह है कि पूर्वाग्रह और भिन्नता के विभिन्न संयोजन हो सकते हैं जो समान न्यूनतम अपेक्षित नुकसान देते हैं?
प्रश्न स्पष्ट नहीं है: यदि न्यूनतम मॉडल से अधिक है, तो आप
तो कई उदाहरण हैं सांख्यिकीय मॉडल और एक निरंतर अपेक्षित हानि (या जोखिम) के साथ जुड़े निर्णय । उदाहरण के लिए MLE को एक सामान्य साधन के लिए लें।
minθEθ[(θ−δ(X1:n))2]
- यदि आप सच्चे मॉडल को नहीं जानते हैं तो आप पूर्वाग्रह की गणना कैसे कर सकते हैं?
एक सामान्य अर्थ में, पूर्वाग्रह वितरण के ग्रहण किए गए परिवार के भीतर सच्चे मॉडल और निकटतम मॉडल के बीच की दूरी है। यदि सही मॉडल अज्ञात है, तो बूटस्ट्रैप द्वारा पूर्वाग्रह का पता लगाया जा सकता है।
- क्या ऐसी परिस्थितियां हैं, जिनमें अपेक्षित हानि (वर्गित पूर्वाग्रह और भिन्नता का योग) के बजाय पूर्वाग्रह या विचरण को कम करना अधिक समझ में आता है?
जब दूसरे नुकसान के कार्य पर विचार किया जाता है, जैसे
धक्का शून्य करने के लिए कहते हैं पूर्वाग्रह पर मूल्यांकन का सबसे धक्का जबकि अनंत को स्विच विचरण पर ध्यान दें।
(θ−Eθ[δ(X1:n)])2+α[(Eθ[δ(X1:n)]−δ(X1:n))2]0<α
αα