कुछ डेटा के लिए फिट किसी भी प्रतिगमन रेखा की कल्पना करें।
अब एक अतिरिक्त डेटा बिंदु की कल्पना करें, जो डेटा के मुख्य शरीर से कुछ दूर है, लेकिन एक जो उस प्रतिगमन रेखा के साथ कहीं स्थित है।
यदि प्रतिगमन रेखा को परिष्कृत किया जाना था, तो गुणांक नहीं बदलेगा। इसके विपरीत, अतिरिक्त बाहरी को हटाने से गुणांक पर शून्य प्रभाव होगा।
तो, एक बाहरी या उत्तोलन बिंदु का शून्य प्रभाव होगा यदि यह पूरी तरह से डेटा और बाकी मॉडल के अनुरूप है।
यदि वांछित है तो "लाइन" के लिए "प्लेन" या "हाइपरप्लेन" पढ़ें, लेकिन दो चर और स्कैटर प्लॉट का सबसे सरल उदाहरण यहां पर्याप्त है।
हालांकि, जैसा कि आप परिभाषाओं के शौकीन हैं - अक्सर, ऐसा लगता है, उनमें बहुत अधिक पढ़ने की प्रवृत्ति है - यहां मेरी पसंदीदा परिभाषाएं हैं:
"आउटलेयर ऐसे नमूना मूल्य हैं जो नमूने के बहुमत के संबंध में आश्चर्य का कारण बनते हैं" (डब्ल्यूएन वेनबेल्स और बीडी रिप्ले। 2002। एस। न्यूयॉर्क के साथ आधुनिक लागू आंकड़े : स्प्रिंगर, पी .19)।
गंभीर रूप से, आश्चर्य देखने वाले के मन में है और यह डेटा के कुछ मौन या स्पष्ट मॉडल पर निर्भर है। एक और मॉडल हो सकता है जिसके तहत आउटलाइन बिल्कुल भी आश्चर्यजनक नहीं है, कहते हैं कि क्या डेटा वास्तव में सामान्य के बजाय तार्किक या गामा हैं।
पीएस मुझे नहीं लगता है कि लीवरेज अंक जरूरी पड़ोसी टिप्पणियों का अभाव है। उदाहरण के लिए, वे जोड़े में हो सकते हैं।