क्यों अवरोधन की मानक त्रुटि बढ़ जाता है आगे 0 से है?


13

अवरोधन शब्द ( ) की मानक त्रुटि में जहां है का मतलब है ।y=β1एक्स+β0+εएस( β 0)2=σ2[1β^0y=β1x+β0+εixxi

SE(β^0)2=σ2[1n+x¯2i=1n(xix¯)2]
x¯xi

मैं जो समझता हूं, एसई आपकी अनिश्चितता को उदाहरण के लिए, 95% नमूनों में, अंतराल में true शामिल । मैं यह समझने में असफल रहा कि एसई, अनिश्चितता का एक उपाय, साथ कैसे बढ़ता है । यदि मैं केवल अपना डेटा शिफ्ट करता हूं, तो उस , मेरी अनिश्चितता कम हो जाती है? यह अनुचित लगता है।β 0 ˉ एक्स ˉ x = 0[β^02SE,β^0+2SE]β0x¯x¯=0

एक समकालिक व्याख्या है - मेरे डेटा के अनचाहे संस्करण में, , पर मेरी भविष्यवाणी से मेल खाती है , जबकि केंद्रित डेटा में, , से मेरी भविष्यवाणी से मेल खाती है । तो क्या इसका मतलब यह है कि पर मेरी भविष्यवाणी के बारे में मेरी अनिश्चितता पर मेरी भविष्यवाणी के बारे में मेरी अनिश्चितता से अधिक है ? यह अनुचित भी लगता है, त्रुटि में सभी मानों के लिए समान रूपांतर है , इसलिए मेरे पूर्वानुमानित मूल्यों में अनिश्चितता सभी लिए समान होनी चाहिए ।एक्स=0 β 0एक्स= ˉ एक्स एक्स=0एक्स= ˉ एक्स εएक्सएक्सβ^0x=0β^0x=x¯x=0x=x¯ϵxx

मेरी समझ में अंतराल हैं मुझे यकीन है। क्या कोई मुझे समझने में मदद कर सकता है कि क्या चल रहा है?


3
क्या आपने कभी किसी तारीख के खिलाफ कुछ हासिल किया है? कई कंप्यूटर सिस्टम दूर के अतीत में अपनी तारीखें शुरू करते हैं, अक्सर 100 से अधिक या 2000 साल पहले। अवरोधन का अनुमान है अपने डेटा के मूल्य पीछे की ओर वाग्विस्तार कि शुरू करने के लिए समय। 21 वीं शताब्दी के आंकड़ों की एक श्रृंखला को पुनःप्राप्त करने के आधार पर, वर्ष 0 ई। में इराक के सकल घरेलू उत्पाद के बारे में आप कितना निश्चित हैं?
whuber

मैं सहमत हूं, यह समझ में आता है अगर आप इसके बारे में इस तरह सोचते हैं। यह और गंग का जवाब, चीजों को स्पष्ट करते हैं।
एलेक्सॉबी

2
यह उत्तर एक सहज ज्ञान युक्त व्याख्या देता है, आरेखों के साथ) यह कैसे उत्पन्न होता है, माध्य में फिट के संदर्भ में फिट लाइन को कास्टिंग करके (फिट की गई रेखा से गुजरती है ) और पता चलता है कि क्यों जहां आप जा सकते हैं, वहां की स्थिति बाहर फैल जाती है क्योंकि आप (जो ढलान में अनिश्चितता के कारण होता है) से दूर जाते हैं। ( ˉ एक्स , ˉ y ) ˉ एक्सx¯(x¯,y¯)x¯
Glen_b -Reinstate मोनिका

जवाबों:


16

क्योंकि सामान्य से कम वर्ग द्वारा फिट की जाने वाली प्रतिगमन रेखा आपके डेटा (यानी, माध्यम से ज़रूरी हो जाएगी - कम से कम जब तक आप अवरोधन को दबाते नहीं हैं - सही मूल्य के बारे में अनिश्चितता ढलान का (अर्थात, ) के माध्यम से रेखा की ऊर्ध्वाधर स्थिति पर कोई प्रभाव नहीं पड़ता है । इससे कम ऊर्ध्वाधर अनिश्चितता का अनुवाद जितना कि आप आगे वाले से दूर हैं। अवरोध पैदा करते हैं जहां अगर है , तो यह की सही कीमत के बारे में अपनी अनिश्चितता को कम कर देंगेएक्स y ˉ एक्स ˉ एक्स ˉ एक्स एक्स = 0 ˉ एक्स β 0 β 0(x¯,y¯)xy^x¯x¯x¯x=0x¯β0। गणितीय शब्दों में, यह लिए मानक त्रुटि के सबसे छोटे संभव मान में अनुवाद । β^0

यहाँ एक त्वरित उदाहरण है R:

set.seed(1)                           # this makes the example exactly reproducible
x0      = rnorm(20, mean=0, sd=1)     # the mean of x varies from 0 to 10
x5      = rnorm(20, mean=5, sd=1)
x10     = rnorm(20, mean=10, sd=1)
y0      = 5 + 1*x0  + rnorm(20)       # all data come from the same  
y5      = 5 + 1*x5  + rnorm(20)       #  data generating process
y10     = 5 + 1*x10 + rnorm(20)
model0  = lm(y0~x0)                   # all models are fit the same way
model5  = lm(y5~x5)
model10 = lm(y10~x10)

यहाँ छवि विवरण दर्ज करें

यह आंकड़ा थोड़ा व्यस्त है, लेकिन आप कई अलग-अलग अध्ययनों से डेटा देख सकते हैं जहां का वितरण करीब या उससे आगे था । ढलान अध्ययन से अध्ययन करने के लिए थोड़ा अलग है, लेकिन काफी हद तक समान हैं। (सूचना वे परिक्रमा एक्स कि मैं मार्क करने के लिए इस्तेमाल के माध्यम से सभी जाने ।) बहरहाल, उन ढलानों की सही कीमत के बारे में अनिश्चितता के बारे में अनिश्चितता का कारण बनता है आगे आप से प्राप्त कर विस्तार करने के लिए , जिसका अर्थ है कि उस डेटा के लिए बहुत व्यापक है जिसे के पड़ोस में सैंपल किया गया था , और उस अध्ययन के लिए बहुत संकीर्ण है जिसमें डेटा पास सैंपल किया गया था । 0 ( ˉ एक्स , ˉ y ) y ˉ एक्स एस ( β 0 ) एक्स = 10 x = 0x0(x¯,y¯)y^x¯SE(β^0)x=10x=0


टिप्पणी के जवाब में संपादित करें: दुर्भाग्य से, आपके डेटा को आपके पास रखने के बाद उन्हें आपकी मदद नहीं करेगा यदि आप कुछ मान पर संभावित मान जानना चाहते हैं । इसके बजाय, आपको अपने डेटा संग्रह को उस बिंदु पर केंद्रित करने की आवश्यकता है जिस पर आप पहली बार ध्यान रखते हैं। इन मुद्दों को और अधिक पूरी तरह से समझने के लिए, यह आपको यहाँ मेरा जवाब पढ़ने में मदद कर सकता है: रैखिक प्रतिगमन भविष्यवाणी अंतरालyxxnew


तो, किसी कारण से कहता हूं कि मैं मूल्य की भविष्यवाणी में सबसे अधिक दिलचस्पी रखता हूं । उपर्युक्त व्याख्या का अर्थ है कि मुझे अपना डेटा (यानी शिफ्ट उस ) पर केंद्रित नहीं करना चाहिए , बल्कि इसे इस तरह शिफ्ट करना चाहिए ताकि । क्या ये सही है? x=xxx¯=0x¯=x
एलेक्सॉबी

सामान्य सूत्र है के बजाय अंश में : कोई स्थानांतरण की जरूरत है। (xx¯)2x¯2
whuber

@elexhobby, मैंने आपकी टिप्पणी का उत्तर देने के लिए कुछ जानकारी जोड़ी है, आप लिंक की गई सामग्री को देखना चाहते हैं। मुझे पता है अगर आप अभी भी अधिक की जरूरत है।
गूँज - मोनिका

यहां बताया गया है कि मैं कैसे समझ सकता हूं - मैंने कहीं और पढ़ा है कि । अब ढलान में इस अनिश्चितता के कारण पर अनुमानित मूल्य में त्रुटि । इसके अलावा, लाइन की ऊर्ध्वाधर स्थिति में अनिश्चितता के कारण त्रुटि । इन एक साथ जोड़, और हम में अनिश्चितता की वजह से भविष्यवाणी की मूल्य में अनिश्चितता मिल और है । यदि मैं गलत हूं तो मुझे सही करों। SE(β^1)=σ2(xix¯)2xnewSE(β^1)(xnewx¯)2σ2nβ^1β^0σ2n+σ2(xnewx¯)2(xix¯)2
एलेक्सॉबी

1
इसके अलावा, यह स्पष्ट है कि ऊर्ध्वाधर स्थिति में त्रुटि - हम जानते हैं कि लाइन को पर से होकर गुजरना पड़ता है । अब में iid त्रुटियों का औसत होता है , और इसलिए SE के पास बराबर होगा । वाह! आपके आरेख और स्पष्ट स्पष्टीकरण के लिए बहुत बहुत धन्यवाद, मैं वास्तव में सराहना करता हूं। ˉ y एक्स= ˉ एक्स ˉ y nσ2σ2ny¯x=x¯y¯nσ2n
एलेक्सॉबी
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.