रैखिक प्रतिगमन में विश्वास बैंड के आकार और गणना को समझना


33

मैं एक ओएलएस रैखिक प्रतिगमन के साथ जुड़े विश्वास बैंड के घुमावदार आकार की उत्पत्ति को समझने की कोशिश कर रहा हूं और यह कैसे प्रतिगमन मापदंडों (ढलान और अवरोधन) के आत्मविश्वास अंतराल से संबंधित है, उदाहरण के लिए (आर का उपयोग करके):

require(visreg)
fit <- lm(Ozone ~ Solar.R,data=airquality)
visreg(fit)

यहाँ छवि विवरण दर्ज करें

ऐसा प्रतीत होता है कि बैंड 2.5% अवरोधन और 97.5% ढलान के साथ-साथ 97.5% अवरोधन, और 2.5% ढलान (हालांकि काफी नहीं) के साथ गणना की गई रेखाओं की सीमा से संबंधित है।

xnew <- seq(0,400)
int <- confint(fit)
lines(xnew, (int[1,2]+int[2,1]*xnew))
lines(xnew, (int[1,1]+int[2,2]*xnew))

यहाँ छवि विवरण दर्ज करें

जो मैं नहीं समझता वह दो चीजें हैं:

  1. 2.5% ढलान और 2.5% अवरोधन के साथ-साथ 97.5% ढलान और 97.5% अवरोधन के संयोजन के बारे में क्या? ये ऐसी लाइनें देते हैं जो स्पष्ट रूप से ऊपर दिए गए बैंड के बाहर होती हैं। शायद मैं एक आत्मविश्वास अंतराल का अर्थ नहीं समझता, लेकिन अगर 95% मामलों में मेरे अनुमान विश्वास अंतराल के भीतर हैं, तो ये एक संभावित परिणाम की तरह प्रतीत होते हैं?
  2. ऊपरी और निचली सीमा के बीच न्यूनतम दूरी क्या निर्धारित करती है (यानी उस बिंदु के करीब जहां अवरोधन के ऊपर दो रेखाएं जोड़ी जाती हैं)?

मुझे लगता है कि दोनों प्रश्न उठते हैं क्योंकि मैं नहीं जानता / समझता हूं कि इन बैंडों की वास्तव में गणना कैसे की जाती है।

मैं प्रतिगमन मापदंडों के विश्वास अंतराल का उपयोग करके ऊपरी और निचली सीमाओं की गणना कैसे कर सकता हूं (भविष्यवाणी पर निर्भर किए बिना) (या एक समान फ़ंक्शन, यानी हाथ से)? मैंने R में प्रेडिक्ट.एलएम फंक्शन को समझने की कोशिश की, लेकिन कोडिंग मुझसे परे है। मैं संबंधित साहित्य या स्पष्टीकरण के लिए किसी भी संकेत की सराहना करता हूं जो सांख्यिकी शुरुआती के लिए उपयुक्त है।

धन्यवाद।


4
आपके पास नीचे दो अच्छे उत्तर हैं। यदि आप अधिक जानकारी चाहते हैं, तो यह आपको मेरा उत्तर पढ़ने में मदद कर सकता है: रैखिक प्रतिगमन भविष्यवाणी अंतराल , जो भविष्यवाणी अंतराल से संबंधित है, लेकिन विचार बहुत समान है।
गूँग - २०:०२ पर मोनिका


टीए सहायक उत्तर और उत्कृष्ट लिंक के लिए।
डेविड

जवाबों:


19

बिंदु पर प्रतिगमन लाइन की मानक त्रुटि (यानी रों वाई एक्स ) हाथ गणना (है ! Yech ) का उपयोग:एक्सरोंY^एक्स

रोंY^एक्स=रोंY|एक्स1n+(एक्स-एक्स¯)2Σमैं=1n(एक्समैं-एक्स¯)2 ,

जहाँ अनुमान की मानक त्रुटि (अर्थात ) का उपयोग करके हाथ की गणना ( डबल yech! ) की जाती है:रोंY|एक्स

रोंY|एक्स=Σमैं=1n(Yमैं-Y^)2n-2

आत्मविश्वास बैंड प्रतिगमन लाइन के बारे में तो के रूप में प्राप्त किया जाता है।Y^±tν=n2,α/2sY^

ध्यान रखें कि प्रतिगमन रेखा के बारे में विश्वास बैंड प्रतिगमन रेखा के बारे में भविष्यवाणी बैंड के रूप में एक ही जानवर नहीं है (प्रतिगमन रेखा का अनुमान लगाने में की तुलना में मान दिए जाने की भविष्यवाणी में अधिक अनिश्चितता है )। और, जैसा कि आप समझने के लिए संघर्ष कर रहे हैं, इंटरसेप्ट और ढलान के बारे में विश्वास अंतराल अभी तक अन्य मात्राएं हैं।YX

इसके अलावा, आप विश्वास अंतराल को नहीं समझते हैं: "यदि 95% मामलों में मेरे अनुमान विश्वास अंतराल के भीतर हैं, तो ये संभावित परिणाम की तरह प्रतीत होते हैं?" विश्वास के अंतराल के अनुमान का 95% होते हैं, 'नहीं है बल्कि प्रत्येक अलग नमूने के लिए (एक ही अध्ययन डिजाइन द्वारा उत्पादित), 95% की (अलग से प्रत्येक नमूने के लिए गणना) 95% विश्वास अंतराल' सच आबादी पैरामीटर 'होते हैं (यानी असली ढलान, सही अवरोधन, आदि) उस और का अनुमान लगा रहे हैं।β^α^


1
क्या कोई पाठ्यपुस्तक है जो बताती है कि ये सूत्र कहाँ से आए हैं?
माइकल गोएरज

1
@MichaelGoerz किसी भी परिचयात्मक आँकड़े, बायोस्टैटिस्टिक्स, इकोनॉमिक्स, आदि पाठ्यपुस्तक में साधारण कम से कम वर्ग रेखीय प्रतिगमन को शामिल किया जाना चाहिए।
एलेक्सिस

मेरे पास Wasserman - सांख्यिकी के सभी, जेम्स एट अल - सांख्यिकीय शिक्षा का एक परिचय, और Hastie एट अल। - सांख्यिकीय सबक के तत्व। मैं उनमें से किसी में रैखिक प्रतिगमन विश्वास बैंड के लिए समीकरणों को खोजने में सक्षम नहीं हुआ हूं। क्या आपके पास इनमें से किसी के लिए एक अध्याय / eq नंबर है, या कुछ अन्य व्यापक रूप से उपलब्ध पुस्तक है?
माइकल गोएरज

2
एलेक्सिस जिस तरह की किताबों की चर्चा कर रहे हैं, उनमें से कोई भी किताब आपके बारे में नहीं है। एप्लाइड रिग्रेशन पर फॉक्स की किताब में यह है अगर मैं सही ढंग से याद करता हूं।
Glen_b -Reinstate Monica

1
@MichaelGoerz जैसा कि पगानो, एम और गौरेवु, के (2000) दोनों करते हैं। बायोस्टैटिस्टिक्स के सिद्धांत । Duxbury Press, Pacific Grove, CA, दूसरा संस्करण और Glantz, SA (2011)। बायोस्टैटिस्टिक्स के प्राइमर । मैकग्रा-हिल मेडिकल, न्यूयॉर्क, एनवाई, 7 वें संस्करण भले ही वे प्रतिगमन-विशिष्ट ग्रंथ नहीं हैं।
एलेक्सिस

16

अच्छा प्रश्न। इन अवधारणाओं को समझना महत्वपूर्ण है और वे सीधे नहीं हैं।

y¯y¯y¯

जब हम हर संभव एक्स के लिए आत्मविश्वास के अंतराल को जोड़ते हैं, तो यह हमें ग्रे बैंड देता है जिसे आप आउटपुट में देखते हैं।

कार्यात्मक रूप से इसका मतलब यह है कि हम 95% आश्वस्त हैं कि असली प्रतिगमन रेखा उस ग्रे ज़ोन में कहीं है।

क्योंकि प्रत्येक व्यक्तिगत बिंदु के लिए 95% विश्वास अंतराल का उपयोग करके विश्वास बैंड की गणना की जाती है, यह अवरोधन के लिए 95% CI से बहुत निकट से संबंधित है। वास्तव में, x = 0 पर ग्रे ज़ोन के किनारों को अवरोधन के लिए 95% CI के साथ बिल्कुल मेल खाएगा, क्योंकि हमने विश्वास बैंड उत्पन्न किया है। इसीलिए आपके ऊपर जोड़ी गई रेखाएँ बाईं ओर ग्रे बैंड के किनारे से टकराती हैं।

हालांकि, ढलान थोड़ा अलग है। यह सीमा में योगदान देता है, जैसा कि आपने ऊपर देखा है, लेकिन एक रेखीय प्रतिगमन में ढलान और अवरोधन अलग नहीं हैं। इसलिए, आप वास्तव में यह नहीं कह सकते हैं कि "क्या होगा यदि अवरोधक CI रेंज के न्यूनतम पर था और ढलान भी न्यूनतम था?" यह रेखा उन बिंदुओं को उत्पन्न करेगी जो हमारे 95% CI के बहुत सारे x के बाहर हैं। इसका मतलब है कि हम 95% आश्वस्त हैं कि हमारी असली प्रतिगमन रेखा नहीं है।

एक्स¯रोंy^एक्स(एक्स-एक्स¯)एक्स=एक्स¯

यहाँ एक अच्छा पावरपॉइंट है जो आपको इनमें से कुछ चीजों की कल्पना करने में मदद कर सकता है: http://www.stat.duke.edu/~tjl13/s101/slides/unit6lec3H.pdf


2
मुझे लगता है कि मैंने इसे ठीक कर दिया - यत को यारों से बदल दिया। क्या यह अधिक सही है? मैं हमेशा चिल्लाता हूं।
डंकन

टा। एक बात जो मेरे लिए अस्पष्ट है, वह यह है कि निम्नलिखित दो कथनों को सुसंगत कैसे बनाया जाए: "इसका कार्यात्मक अर्थ यह है कि हम 95% आश्वस्त हैं कि सच्चा प्रतिगमन रेखा उस धूसर क्षेत्र में कहीं है।" बनाम "[...] इंटरसेप्ट और ढलान के बारे में विश्वास अंतराल अभी तक अन्य मात्रा में हैं।" यदि पहला कथन सही है, तो अंतर और ढलान के सीआई और ऊपर दिए गए बैंड के बीच कुछ (गणितीय?) संबंध होना चाहिए। मुझे लगता है कि यह मेरे प्रश्न के एक भाग से संबंधित है: मैं ढलान और अवरोधन के CI का उपयोग करके ऊपर (यदि संभव हो) बैंड की गणना कैसे कर सकता हूं?
डेविड

1
एक्स¯

अच्छी समझ में आने वाली पोस्ट और बढ़िया लिंक! +1
theestestecologist
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.