इसका जवाब नहीं है , क्योंकि पूर्वाग्रह और भिन्नता मॉडल मापदंडों की विशेषता है, बजाय डेटा का अनुमान लगाने के लिए उनका उपयोग किया जाता है। उस कथन का एक आंशिक अपवाद है, जो भविष्यवक्ता स्थान के माध्यम से पूर्वाग्रह और भिन्नता (हा!) से संबंधित है; उस पर और अधिक। ध्यान दें कि यह भविष्यवाणियों और प्रतिक्रिया चर से संबंधित कुछ "सच" फ़ंक्शन को जानने के लिए बिल्कुल कुछ नहीं है।
के अनुमान पर विचार करें एक रेखीय प्रतिगमन, में है, जहां एक है भविष्यवक्ताओं की मैट्रिक्स, एक है पैरामीटर अनुमान के वेक्टर, और प्रतिक्रियाओं का एक वेक्टर है। आइए तर्क के लिए मान लें कि हमारे पास डेटा की एक अनंत आबादी है, जिसमें से ड्रा करना है (यह पूरी तरह से हास्यास्पद नहीं है, अगर हम सक्रिय रूप से कुछ भौतिक प्रक्रिया से डेटा रिकॉर्ड कर रहे थे, तो हम एक त्वरित दर पर भविष्यवक्ता और प्रतिक्रिया डेटा रिकॉर्ड कर सकते हैं , इस प्रकार व्यावहारिक रूप से इस धारणा को संतुष्ट करना)। तो हम टिप्पणियों, प्रत्येक एक प्रतिक्रिया मूल्य और प्रत्येक के लिए एक मूल्य से मिलकर आकर्षित करते हैंββ^=(XTX)−1XTYXN×Pβ^P×1YN×1NP भविष्यवाणियों। हम तो हमारे द्वारा अनुमानित गणना और मूल्यों रिकॉर्ड है। आइए फिर हम इस पूरी प्रक्रिया को लेते हैं और इसे बार दोहराते हैं , हर बार जनसंख्या से स्वतंत्र ड्रा बनाते हैं । हम जमा हो के अनुमान जिस पर हम पैरामीटर वेक्टर में प्रत्येक तत्व के विचरण की गणना कर सकते हैं। ध्यान दें कि इन पैरामीटर अनुमानों का विचलन विपरीत आनुपातिक है और समानुपाती है , भविष्यवाणियों की रूढ़िवादिता को मानते हुए।β^NiterNNiterβ^NP
प्रत्येक पैरामीटर के पूर्वाग्रह का अनुमान इसी तरह लगाया जा सकता है। हालांकि हमारे पास "सही" फ़ंक्शन तक पहुंच नहीं हो सकती है, मान लीजिए कि हम आबादी से एक बड़ी संख्या में ड्रॉ बना सकते हैं ताकि गणना की जा , जो "सही" पैरामीटर मान के लिए एक प्रॉक्सी के रूप में काम करेगा। । हम मान लेंगे कि यह एक निष्पक्ष अनुमान है (साधारण न्यूनतम वर्ग) और उपयोग की गई टिप्पणियों की संख्या पर्याप्त रूप से इतनी बड़ी थी कि इस अनुमान का विचरण नगण्य है। से प्रत्येक के लिए मापदंडों, हम गणना , जहां से लेकर को । हम इन अंतरों के औसत को संबंधित पैरामीटर में पूर्वाग्रह के अनुमान के रूप में लेते हैं।β^bestPβ^bestj−β^jj1Niter
डेटा से संबंधित पूर्वाग्रह और भिन्नता के समान तरीके हैं, लेकिन वे थोड़े अधिक जटिल हैं। जैसा कि आप देख सकते हैं, रैखिक मॉडल के लिए पूर्वाग्रह और विचरण का अनुमान लगाया जा सकता है, लेकिन आपको काफी हद तक होल्ड-आउट डेटा की आवश्यकता होगी। एक और अधिक गंभीर समस्या यह है कि एक बार जब आप एक निश्चित डेटासेट के साथ काम करना शुरू कर देते हैं, तो आपके विश्लेषण आपके व्यक्तिगत परिवर्तन से प्रदूषित हो जाएंगे , इसमें आप पहले से ही पथरीले रास्तों के बगीचे से भटकना शुरू कर देंगे और यह जानने का कोई तरीका नहीं है कि कैसे जब तक आप सिर्फ एक मॉडल के साथ नहीं आए (तब तक यह विश्लेषण चला और इसे उसके बाद अकेले छोड़ने के लिए प्रतिबद्ध)।
डेटा के मामले के बारे में खुद को इंगित करता है, सबसे सही (और तुच्छ) उत्तर यह है कि यदि और बीच कोई अंतर हैYY^, आपको एक अधिक जटिल मॉडल की आवश्यकता है (यह मानते हुए कि आप सभी प्रासंगिक भविष्यवाणियों की सही पहचान कर सकते हैं; आप नहीं कर सकते)। "त्रुटि" की दार्शनिक प्रकृति पर एक उबाऊ ग्रंथ में जाने के बिना, लब्बोलुआब यह है कि वहाँ कुछ चल रहा था जिससे आपके मॉडल को अपना निशान चूक गया। समस्या यह है कि जटिलता को जोड़ने से विचरण बढ़ जाता है, जो संभवतः अन्य डेटा बिंदुओं पर निशान से चूक जाएगा। इसलिए, व्यक्तिगत डेटा बिंदु स्तर पर त्रुटि के आरोप के बारे में चिंता करना एक सार्थक प्रयास होने की संभावना नहीं है। अपवाद (पहले पैराग्राफ में उल्लिखित) इस तथ्य से उपजा है कि पूर्वाग्रह और विचरण वास्तव में स्वयं भविष्यवक्ताओं के कार्य हैं, इसलिए आपके पास भविष्यवक्ता के एक भाग में बड़े पूर्वाग्रह और दूसरे में छोटे पूर्वाग्रह हो सकते हैं (विचरण के लिए समान)।Y−Y^कई बार (जहां और not का अनुमान पर आधारित नहीं था ) और के मूल्यों के एक फ़ंक्शन के रूप में इसके पूर्वाग्रह (औसत) और विचरण की साजिश रच रहा था । हालांकि, मुझे लगता है कि यह एक विशेष चिंता का विषय है।Y^=Xβ^β^ YX