एक रेखीय मॉडल में भविष्यवाणी सीमा के लिए एक सूत्र प्राप्त करना (यानी: भविष्यवाणी अंतराल)


18

चलो निम्नलिखित उदाहरण लेते हैं:

set.seed(342)
x1 <- runif(100)
x2 <- runif(100)
y <- x1+x2 + 2*x1*x2 + rnorm(100)
fit <- lm(y~x1*x2)

यह OLS प्रतिगमन का उपयोग करके, X1 और x2 के आधार पर y का एक मॉडल बनाता है। यदि हम किसी दिए गए x_vec के लिए y की भविष्यवाणी करना चाहते हैं, तो हम बस उस सूत्र का उपयोग कर सकते हैं जो हम प्राप्त करते हैं summary(fit)

हालांकि, क्या होगा अगर हम y की निचली और ऊपरी भविष्यवाणी करना चाहते हैं? (किसी दिए गए आत्मविश्वास के स्तर के लिए)।

तब हम कैसे सूत्र का निर्माण करेंगे?


आत्मविश्वास नई टिप्पणियों पर इंटरवल की धारा यह पेज मदद मिल सकती है।
GaBorgulya

@ ताल क्षमा करें, लेकिन यह वास्तव में मेरे लिए स्पष्ट नहीं है कि आप वास्तव में "y की निचली और ऊपरी भविष्यवाणियों की भविष्यवाणी" से क्या मतलब है। क्या यह भविष्यवाणी या सहिष्णुता बैंड के साथ कुछ करना है?
३:११ को

@ ताल - प्रश्नों की एक जोड़ी। जब आप कहते हैं ".. y, X1 और x2 पर आधारित है, एक OLS प्रतिगमन का उपयोग कर रहा है।" , आप मतलब है कि अपने एक रैखिक मॉडल बनाने और OLS का उपयोग कर मापदंडों का अनुमान है । क्या मैं सही हू? और @ chl का प्रश्न - क्या आप भविष्यवाणी अंतराल के लिए निचले और ऊपरी सीमा की भविष्यवाणी करना चाहते हैं?
सनकूलू

@chl, अधिक स्पष्ट नहीं होने के लिए खेद है। मैं दो सूत्रों की तलाश कर रहा हूं जो उस समय के 95% y के "वास्तविक" मूल्य को "पकड़" के लिए एक अंतराल देगा। मुझे लगता है कि मैं इस अर्थ के लिए सीआई के लिए परिभाषाओं का उपयोग कैसे कर रहा हूं, जब शायद कोई और शब्द है जिसका मुझे उपयोग करना चाहिए, इसके बारे में खेद है ...
ताल गैलिली

@suncoolsu - हाँ और हाँ।
ताल गैलिली

जवाबों:


25

आपको मैट्रिक्स अंकगणित की आवश्यकता होगी। मुझे यकीन नहीं है कि एक्सेल उसके साथ कैसे जाएगा। वैसे भी, यहाँ विवरण हैं।

अपने प्रतिगमन रूप में लिखा है मान लीजिए y=Xβ+e

चलो (के स्वरूप में ही एक पंक्ति के पूर्वानुमान के लिए भविष्यवक्ताओं के मूल्यों से युक्त वेक्टर हो एक्स )। तब पूर्वानुमान द्वारा दिया जाता है y = एक्स * β = एक्स * ( एक्स ' एक्स ) - 1 एक्स ' वाई के साथ एक संबद्ध विचरण σ 2 [ 1 + एक्स * ( एक्स ' एक्स ) - 1 ( एक्स * ) ' ]XX

y^=Xβ^=X(XX)1XY
σ2[1+X(XX)1(X)].
फिर एक 95% भविष्यवाणी अंतराल गणना की जा सकती (सामान्य रूप से वितरित त्रुटियों कल्पना करते हुए) के रूप में y ± 1.96 σ यह त्रुटि शब्दई केकारण अनिश्चितता और गुणांक अनुमानों में अनिश्चितता के कारण होता है। हालाँकि, यह Xमें किसी भी त्रुटि को अनदेखा करता है। इसलिए यदि भविष्यवक्ताओं के भविष्य के मूल्य अनिश्चित हैं, तो इस अभिव्यक्ति का उपयोग करके गणना की गई अंतराल बहुत संकीर्ण हो जाएगी।
y^±1.96σ^1+X(XX)1(X).
eX

1
+1, उत्कृष्ट उत्तर। मुझे हालांकि ध्यान देना चाहिए, कि प्रतिगमन मॉडल हमेशा सशर्त अपेक्षा का अनुमान लगाता है, इसलिए यह उतना ही अच्छा है जितना कि इसके प्रतिपादक हैं। इसलिए अंतिम टिप्पणी हालांकि बहुत अच्छी है, यह कड़ाई से आवश्यक नहीं है, क्योंकि यदि आप प्रतिगमन मॉडल का निर्माण करते हैं तो आपको रजिस्टरों पर भरोसा करना चाहिए।
mpiktas

y^=Xβ+X(XX)1Xevary^=varX(XX)1Xe=σ2X(XX)1(X)

y^

N×N

X

7

क्या आप विभिन्न प्रकार के पूर्वानुमान अंतराल के बाद संयोग से हैं? predict.lmमैन्युअल पृष्ठ है

 ## S3 method for class 'lm'
 predict(object, newdata, se.fit = FALSE, scale = NULL, df = Inf, 
         interval = c("none", "confidence", "prediction"),
         level = 0.95, type = c("response", "terms"),
         terms = NULL, na.action = na.pass,
         pred.var = res.var/weights, weights = 1, ...)

तथा

'अंतराल' की स्थापना निर्दिष्ट 'स्तर' पर आत्मविश्वास या भविष्यवाणी (सहिष्णुता) अंतराल की गणना को निर्दिष्ट करती है, जिसे कभी-कभी संकीर्ण बनाम विस्तृत अंतराल के रूप में संदर्भित किया जाता है।

क्या आपके मन में ऐसा था?


हाय डिर्क, यह वास्तव में मैं क्या ढूंढना चाहता हूं, लेकिन मैं चाहता हूं कि ऊपरी और निचले बांड एक सूत्र के रूप में हों (इसलिए बाद में सांख्यिकीय सॉफ्टवेयर के कुछ निम्न रूप में लागू करने के लिए, उदाहरण के लिए, एक्सेल ...)
ताल गैली

ps: मैं अब देख रहा हूँ कि मेरे प्रश्न के शीर्षक में एक संपादन था जो आपको सोचने के लिए प्रेरित कर सकता था कि मैं उनसे प्रेडिक्ट के बारे में पूछ रहा था। मैं अंतराल पैरामीटर (जो मैं नहीं हूँ) :)
ताल गैली

8
आप यहां शब्दावली का दुरुपयोग कर रहे हैं। एक्सेल सांख्यिकीय सॉफ्टवेयर नहीं है।
डिर्क एडल्डबुलेटेल

1
आप सही हैं, मेरी बोली, "स्प्रेडशीट एप्लिकेशन" के बारे में कैसे?
ताल गैली

3
में इसके साथ जी सकता हूँ; यह शैतान को इसके नाम से
पुकारता है

6

@ ताल: मैं कुटनेर एट अल को रैखिक मॉडल के लिए एक शानदार स्रोत के रूप में सुझा सकता हूं ।

एक व्यक्ति के नए अवलोकन X_vec, 2 से Y की एक भविष्यवाणी) X_vec पर वातानुकूलित Y की अपेक्षित मान के बीच 1) का अंतर है। E(Y|Xvec)

E(Y|Xvec)Y^ ±αY^Y^Y^σ2nXvecX¯)2σ2(XiX¯)2


1
(+1) भेद बनाने के लिए। हालांकि, मेरा मानना ​​है कि ओपी (1), नहीं (2) के लिए पूछ रहा है (और मैंने तदनुसार प्रश्न का शीर्षक संपादित किया है)। यह भी ध्यान दें कि आपका सूत्र यह मानता है कि प्रतिगमन केवल एक चर पर निर्भर करता है।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.