पूर्वाग्रह विचलन व्यापार-बंद माध्य वर्ग त्रुटि के टूटने पर आधारित है:
MSE(y^)=E[y−y^]2=E[y−E[y^]]2+E[y^−E[y^]]2
पूर्वाग्रह-विचरण व्यापार को देखने का एक तरीका यह है कि मॉडल फिट में डेटा सेट के गुणों का उपयोग किया जाए। सरल मॉडल के लिए, यदि हम मानते हैं कि ओएलएस प्रतिगमन को सीधी रेखा में फिट करने के लिए उपयोग किया गया था, तो लाइन को फिट करने के लिए केवल 4 नंबर का उपयोग किया जाता है:
- X और y के बीच का नमूना covariance
- X का नमूना प्रसरण
- नमूना का मतलब एक्स
- Y का नमूना मतलब
तो, जो भी ग्राफ ऊपर 4 की संख्या में ले जाता है, वह ठीक उसी लाइन (10 अंक, 100 अंक, 100000000 अंक) तक ले जाएगा। तो एक मायने में यह विशेष नमूने के प्रति असंवेदनशील है। इसका मतलब यह है कि यह "पक्षपाती" होगा क्योंकि यह प्रभावी रूप से डेटा के हिस्से की अनदेखी करता है। यदि डेटा का वह उपेक्षित हिस्सा महत्वपूर्ण हुआ, तो भविष्यवाणियां लगातार त्रुटि में रहेंगी। यदि आप एक डेटा बिंदु को हटाने से प्राप्त फिट लाइनों के लिए सभी डेटा का उपयोग करके फिट लाइन की तुलना करते हैं, तो आप इसे देखेंगे। वे काफी स्थिर होंगे।
अब दूसरा मॉडल डेटा के प्रत्येक स्क्रैप का उपयोग करता है, जो इसे प्राप्त कर सकता है, और जितना संभव हो उतना डेटा फिट बैठता है। इसलिए, हर डेटा बिंदु की सटीक स्थिति मायने रखती है, और इसलिए आप OLS के लिए फिट किए गए मॉडल को बदले बिना प्रशिक्षण डेटा को आसपास स्थानांतरित नहीं कर सकते। इस प्रकार आपके द्वारा निर्धारित विशेष प्रशिक्षण के लिए मॉडल बहुत संवेदनशील है। यदि आप एक ही ड्रॉप-वन डेटा पॉइंट प्लॉट करते हैं, तो फिट किया गया मॉडल बहुत अलग होगा।