@ शुभकर्ता ने आपको तीन अच्छे उत्तर दिए हैं, लेकिन शायद मैं अभी भी कुछ मूल्य लिख सकता हूं। आपका स्पष्ट प्रश्न, जैसा कि मैं समझता हूँ, यह है:
मेरी फिट यह देखते हुए y मैं = मीटर x मैं + खy^मैं= एम^एक्समैं+ बी^ (नोटिस मैं 'टोपी' जोड़ा) , और मेरे बच सामान्य रूप से वितरित मानते हैं, , मैं अभी तक के रूप में एक है कि भविष्यवाणी कर सकते हैं अप्रत्यक्ष प्रतिक्रिया, y एन ई डब्ल्यू , के साथ एक ज्ञात कारक मूल्य, एक्स एन ई डब्ल्यू , अंतराल के भीतर गिर जाएगी ( y - σ ई , y + σएन(0,σ^2e)ynewxnew , प्रायिकता ६%% के साथ?(y^−σe,y^+σe)
सहज रूप से, उत्तर ऐसा लगता है कि यह 'हाँ' होना चाहिए, लेकिन सही उत्तर शायद है । इस मामले में हो जाएगा जब मानकों (यानी, और σ ) जाना जाता है और बिना किसी त्रुटि के। चूंकि आपने इन मापदंडों का अनुमान लगाया है, इसलिए हमें उनकी अनिश्चितता को ध्यान में रखना होगा। m,b,σ
आइए पहले अपने अवशिष्टों के मानक विचलन के बारे में सोचें। क्योंकि यह आपके डेटा से अनुमानित है, इसलिए अनुमान में कुछ त्रुटि हो सकती है। नतीजतन, आपके द्वारा अपनी भविष्यवाणी अंतराल बनाने के लिए उपयोग किए जाने वाले वितरण को सामान्य नहीं, बल्कि होना चाहिए । हालांकि, चूंकि टी तेजी से सामान्य में परिवर्तित हो जाता है, इसलिए व्यवहार में यह समस्या होने की संभावना कम है। tdf errort
तो, हम सिर्फ उपयोग कर सकते हैं y नई ± टी ( 1 - α / 2 , df त्रुटि ) एस के बजाय y नई ± z ( 1 - α / 2 ) एस , और हमारे प्रमुदित तरीके के बारे में जाना? दुर्भाग्यवश नहीं। बड़ा मुद्दा वहाँ अनिश्चितता की वजह से उस स्थान पर प्रतिक्रिया की सशर्त मतलब के अपने अनुमान के बारे में अनिश्चितता है कि अपने अनुमानों में है हूँ और ख । इस प्रकार,y^new±t(1−α/2, df error)sy^new±z(1−α/2)sm^b^आपकी भविष्यवाणियों के मानक विचलन को केवल से अधिक शामिल करने की आवश्यकता हैserror । क्योंकि प्रसरण जोड़ने , भविष्यवाणियों की अनुमानित विचरण हो जाएगा:
सूचना है कि " एक्स " नए के लिए विशिष्ट मूल्य का प्रतिनिधित्व करने के subscripted है अवलोकन, और कहा कि " एस 2 " तदनुसार subscripted है। यही है, आपका पूर्वानुमान अंतराल एक्स के साथ नए अवलोकन के स्थान पर आकस्मिक है
s2predictions(new)=s2error+Var(m^xnew+b^)
xs2xएक्सिस। आपके पूर्वानुमानों के मानक विचलन को निम्नलिखित सूत्र के साथ अधिक आसानी से अनुमान लगाया जा सकता है:
के रूप में एक दिलचस्प ओर ध्यान दें, हम इस समीकरण से भविष्यवाणी अंतराल के बारे में कुछ तथ्यों अनुमान लगा सकते हैं। सबसे पहले, भविष्यवाणी अंतराल अधिक डेटा हम था जब हम (इस में कम अनिश्चितता है क्योंकि भविष्यवाणी मॉडल बनाया संकरा हो जाएगा
मीटरऔर
ख)। दूसरा, भविष्यवाणियां सबसे सटीक होंगी यदि वे आपकेमूल्यों को अपने मॉडल को विकसित करने के लिए उपयोग किए जाने वाले
xमानों केमाध्यम से किए जाते हैं, क्योंकि तीसरे पद के लिए अंश
0होगा। कारण यह है कि सामान्य परिस्थितियों में,
एक्सके मतलब में अनुमानित ढलान के बारे में अनिश्चितता नहीं है
spredictions(new)=s2error(1+1N+(xnew−x¯)2∑(xi−x¯)2)−−−−−−−−−−−−−−−−−−−−−−−−√
m^b^x0x, प्रतिगमन लाइन की सही ऊर्ध्वाधर स्थिति के बारे में कुछ अनिश्चितता। इस प्रकार, भविष्यवाणी मॉडल के निर्माण के लिए सीखे जाने वाले कुछ सबक हैं: अधिक डेटा सहायक है, न कि 'महत्व' खोजने के साथ, बल्कि भविष्य की भविष्यवाणियों की सटीकता में सुधार के साथ; और आपको अंतराल पर अपने डेटा संग्रह प्रयासों को केंद्र में रखना चाहिए जहां आपको भविष्य में (उस अंश को कम करने के लिए) भविष्यवाणियां करने की आवश्यकता होगी, लेकिन टिप्पणियों को उस केंद्र से व्यापक रूप से फैलाएं जैसा कि आप कर सकते हैं (उस भाजक को अधिकतम करने के लिए)।
इस तरह से सही मूल्य की गणना करने के बाद हम फिर उचित साथ उपयोग कर सकते हैं वितरण जैसा कि ऊपर उल्लेख। t