मैं इसे सहज शब्दों में चर्चा करूँगा।
प्रतिगमन में विश्वास अंतराल और भविष्यवाणी अंतराल दोनों इस तथ्य को ध्यान में रखते हैं कि अवरोधन और ढलान अनिश्चित हैं - आप डेटा से मूल्यों का अनुमान लगाते हैं, लेकिन जनसंख्या मान भिन्न हो सकते हैं (यदि आपने एक नया नमूना लिया है, तो आप अलग-अलग अनुमान लगाएंगे। मान)।
एक प्रतिगमन रेखा से होकर गुज़रेगी , और उस बिंदु के चारों ओर होने वाले परिवर्तनों के बारे में चर्चा को केंद्र में रखना सबसे अच्छा होगा - जो कि लाइन बारे में सोचना है (इस सूत्रीकरण में, )।(x¯,y¯)y=a+b(x−x¯)a^=y¯
यदि वह रेखा उस बिंदु से गुज़रती है, लेकिन ढलान थोड़ा अधिक या कम था (अर्थात यदि मीन रेखा की ऊँचाई निश्चित थी लेकिन ढलान थोड़ा अलग था), तो वह क्या होगा हमशक्ल?(x¯,y¯)
आप देखेंगे कि नई रेखा वर्तमान रेखा से मध्य की ओर छोर के पास से आगे की ओर निकलेगी, एक तरह का तिरछी एक्स बना सकती है जो कि मध्य से पार हो जाती है (जैसा कि नीचे की बैंगनी रेखाओं में से प्रत्येक लाल रेखा के संबंध में है। ; बैंगनी लाइनों का अनुमान ढलान का प्रतिनिधित्व ढलान के दो मानक त्रुटियों)।±
यदि आप ढलान के साथ इस तरह की लाइनों का एक संग्रह अपने अनुमान से थोड़ा अलग करते हैं, तो आपको 'फैन आउट' के पास अनुमानित मूल्यों का वितरण दिखाई देगा (कल्पना करें कि ग्रे में छायांकित दो बैंगनी रेखाओं के बीच का क्षेत्र, उदाहरण के लिए, क्योंकि हमने फिर से नमूना लिया और अनुमानित एक के पास ऐसे कई ढलानों को खींचा, हम बिंदु ( ) के माध्यम से एक लाइन बूटस्ट्रैप करके इसका एक अर्थ प्राप्त कर सकते हैं । यहां पैरामीट्रिक बूटस्ट्रैप के साथ 2000 के अवशेषों का उपयोग करके एक उदाहरण दिया गया है:x¯,y¯
आप निरंतर में अनिश्चितता के कारण ले तो बेहतर होगा आप (बनाने लाइन गुजरती पास पर काफी नहीं के माध्यम से ), कि किसी भी पर मतलब के लिए ऊपर और नीचे लाइन ले जाता है, तो अंतराल होगा फिट लाइन के ऊपर और नीचे बैठें।(x¯,y¯)x
(यहाँ बैंगनी लाइनें हैं निरंतर अवधि या तो अनुमान लाइन के किनारे के दो मानक त्रुटियों)।±
जब आप दोनों एक साथ करते हैं (लाइन एक छोटे से ऊपर या नीचे हो सकती है, और ढलान थोड़ा सख्त या उथला हो सकता है), तो आपको माध्य में अनिश्चितता के कारण, कुछ मात्रा में फैलता है, , स्थिरांक, और आप ढलान की अनिश्चितता के कारण कुछ अतिरिक्त फैनिंग प्राप्त करते हैं, उनके बीच आपके भूखंडों की विशेषता हाइपरबोलिक आकार का उत्पादन करते हैं।x¯
वह अंतर्ज्ञान है।
अब, यदि आप चाहें, तो हम थोड़ा बीजगणित पर विचार कर सकते हैं (लेकिन यह आवश्यक नहीं है):
यह वास्तव में उन दो प्रभावों के वर्गों के योग का वर्गमूल है - आप इसे विश्वास अंतराल के सूत्र में देख सकते हैं। चलो टुकड़ों का निर्माण करते हैं:
साथ मानक त्रुटि में जाना जाता है (याद यहाँ की उम्मीद मूल्य है पर की संकरी , नहीं सामान्य अवरोधन; यह सिर्फ एक मतलब का एक मानक त्रुटि है)। यह माध्य ( ) पर रेखा की स्थिति का मानक त्रुटि है ।abσ/n−−√ayxx¯
के साथ मानक त्रुटि जाना जाता है । कुछ मान पर ढलान में अनिश्चितता का प्रभाव कई गुना है कि आप माध्य से कितनी दूर हैं ( ) (क्योंकि स्तर में परिवर्तन ढलान के समय में परिवर्तन है जो आप दूरी से चलते हैं), ।baσ/∑ni=1(xi−x¯)2−−−−−−−−−−−√x∗x∗−x¯(x∗−x¯)⋅σ/∑ni=1(xi−x¯)2−−−−−−−−−−−√
अब समग्र प्रभाव सिर्फ उन दो चीजों के वर्गों के योग का वर्गमूल है (क्यों? क्योंकि असंबद्ध चीजों के भिन्न रूप जोड़ते हैं, और यदि आप रूप में अपनी लाइन लिखते हैं और के अनुमान असंबंधित हैं। इसलिए समग्र मानक त्रुटि समग्र विचरण का वर्गमूल है, और विचरण घटकों के भिन्न रूप का योग है - अर्थात, हमारे पास हैy=a+b(x−x¯)ab
(σ/n−−√)2+[(x∗−x¯)⋅σ/∑ni=1(xi−x¯)2−−−−−−−−−−−√]2−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−−√
एक छोटी सी साधारण हेरफेर औसत मान के अनुमान की मानक त्रुटि के लिए सामान्य अवधि देता है पर :x∗
σ1n+(x∗−x¯)2∑ni=1(xi−x¯)2−−−−−−−−−−−−√
यदि आप इसे एक समारोह के रूप में आकर्षित करते हैं , तो आप देखेंगे कि यह कम से कम साथ एक वक्र (एक मुस्कान की तरह दिखता है) बनाता है , जो आपके बाहर निकलते ही बड़ा हो जाता है। यह वही है जो फिट लाइन से जोड़ा / घटाया जाता है (अच्छी तरह से, यह एक वांछित विश्वास स्तर प्राप्त करने के लिए, इसका एक गुण है)।x∗x¯
[भविष्यवाणी अंतराल के साथ, प्रक्रिया परिवर्तनशीलता के कारण स्थिति में भिन्नता भी है; यह एक और शब्द जोड़ता है जो सीमाओं को ऊपर और नीचे स्थानांतरित करता है, जिससे बहुत व्यापक प्रसार होता है, और क्योंकि यह शब्द आमतौर पर वर्गमूल के तहत राशि पर हावी होता है, वक्रता बहुत कम स्पष्ट होती है।]