पहले, मुझे यह बताना चाहिए कि मैंने उत्तर के लिए इस साइट पर खोज की है। मुझे या तो ऐसा प्रश्न नहीं मिला जिसने मेरे प्रश्न का उत्तर दिया हो या मेरे ज्ञान का स्तर इतना कम हो कि मुझे एहसास ही नहीं हुआ कि मैंने पहले ही उत्तर पढ़ लिया है।
मैं एपी सांख्यिकी परीक्षा के लिए अध्ययन कर रहा हूं। मुझे रैखिक प्रतिगमन सीखना है और विषयों में से एक अवशिष्ट है। मेरे पास पृष्ठ 253 पर सांख्यिकी और डेटा विश्लेषण के परिचय की एक प्रति है।
द्विभाजित डेटा सेट में असामान्य बिंदु वे होते हैं जो दिशा या वाई दिशा में स्कैप्लेटोट के अधिकांश अन्य बिंदुओं से दूर हो जाते हैं
एक अवलोकन संभावित रूप से एक प्रभावशाली अवलोकन है यदि इसमें एक मान है जो बाकी डेटा ( एक्स दिशा में बाकी डेटा से अलग) से बहुत दूर है । यह निर्धारित करने के लिए कि क्या अवलोकन वास्तव में प्रभावशाली है, हम आकलन करते हैं कि क्या इस अवलोकन को हटाने से ढलान के मूल्य या कम से कम वर्ग रेखा के अवरोधन पर बड़ा प्रभाव पड़ता है।
अगर यह एक बड़ा अवशिष्ट है, तो एक अवलोकन एक बाहरी है । बाह्य रूप से अवलोकन दिशा में सबसे कम-वर्ग रेखा से बहुत दूर पड़ता है ।
Stattreck.com चार तरीकों को बताता है जो अवशिष्ट से एक बाहरी रूपरेखा निर्धारित करता है:
डेटा बिंदु जो समग्र पैटर्न से बड़े पैमाने पर विचलन करते हैं, आउटलेयर कहलाते हैं। वहाँ चार तरीके हैं कि एक डेटा बिंदु एक बाहरी माना जा सकता है।
- यह अन्य डेटा बिंदुओं की तुलना में एक एक्स एक्स मूल्य हो सकता है।
- अन्य डेटा बिंदुओं की तुलना में इसका चरम Y मान हो सकता है।
- इसमें अत्यधिक X और Y मान हो सकते हैं।
- यह चरम एक्स या वाई मूल्यों के बिना भी, बाकी डेटा से दूर हो सकता है।
ये दोनों स्रोत एक-दूसरे से टकराते दिख रहे हैं। किसी को भी मेरी उलझन को दूर करने में मदद कर सकता है। इसके अलावा, कैसे एक चरम को परिभाषित करता है। एपी सांख्यिकी नियम का उपयोग करती है यदि डेटा बिंदु (Q1-1.5IQR, Q3 + 1.5IQR) के बाहर है, तो यह एक बाहरी है। मैं नहीं जानता कि कैसे लागू करने के लिए बस एक ग्राफ से अवशिष्ट।