रैखिक प्रतिगमन में एक भविष्यवाणी अंतराल के लिए आप अंतराल बनाने के लिए अभी भी का उपयोग करते हैं। आप इसका उपयोग का विश्वास अंतराल उत्पन्न करने के लिए भी करते हैं । दोनों में क्या अंतर है?ई[Y| x0]
रैखिक प्रतिगमन में एक भविष्यवाणी अंतराल के लिए आप अंतराल बनाने के लिए अभी भी का उपयोग करते हैं। आप इसका उपयोग का विश्वास अंतराल उत्पन्न करने के लिए भी करते हैं । दोनों में क्या अंतर है?ई[Y| x0]
जवाबों:
आपका प्रश्न काफी सही नहीं है। जैसा कि आप कहते हैं एक आत्मविश्वास अंतराल लिए एक सीमा देता है । एक पूर्वानुमान अंतराल खुद लिए एक सीमा देता है। स्वाभाविक रूप से, के लिए अपना सर्वश्रेष्ठ अनुमान है अंतराल दोनों एक ही मूल्य, के आसपास केंद्रित किया जाएगा, ताकि ।यई [ y | x ] एक्स β
@Greg कहते हैं, मानक त्रुटियों अलग होने जा रहे हैं --- हम की उम्मीद मूल्य लगता है कि अधिक सटीक से हम अनुमान ही। अनुमान लगाने के लिए आवश्यकता होती है, जिसमें सही त्रुटि शब्द से आता है।y y
अंतर को स्पष्ट करने के लिए, कल्पना करें कि हम अपने गुणांक के सही अनुमान प्राप्त कर सकते हैं । फिर, हमारा अनुमान सही होगा। लेकिन हमें अभी भी यकीन नहीं होगा कि खुद क्या था क्योंकि एक वास्तविक त्रुटि शब्द है जिसे हमें विचार करने की आवश्यकता है। हमारा आत्मविश्वास "अंतराल" सिर्फ एक बिंदु होगा क्योंकि हम अनुमान लगाते हैं कि बिल्कुल सही है, लेकिन हमारा पूर्वानुमान अंतराल व्यापक होगा क्योंकि हम सही त्रुटि शब्द को ध्यान में रखते हैं।ई [ y | x ] y ई [ y | x ]
इसलिए, एक अनुमान अंतराल एक आत्मविश्वास अंतराल की तुलना में व्यापक होगा।
एक भविष्यवाणी अंतराल और एक आत्मविश्वास अंतराल के बीच का अंतर मानक त्रुटि है।
माध्य पर एक विश्वास अंतराल के लिए मानक त्रुटि नमूने के कारण अनिश्चितता को ध्यान में रखती है। आपके नमूने से आपके द्वारा गणना की गई रेखा उस रेखा से भिन्न होगी जो गणना की गई होगी यदि आपके पास पूरी आबादी थी, तो मानक त्रुटि इस अनिश्चितता को ध्यान में रखती है।
एक व्यक्ति अवलोकन पर एक भविष्यवाणी अंतराल के लिए मानक त्रुटि ऊपर की तरह नमूना लेने के कारण अनिश्चितता को ध्यान में रखती है, लेकिन अनुमानित अर्थ के आसपास के व्यक्तियों की परिवर्तनशीलता को भी ध्यान में रखती है। भविष्यवाणी अंतराल के लिए मानक त्रुटि विश्वास अंतराल की तुलना में व्यापक होगी और इसलिए भविष्यवाणी अंतराल विश्वास अंतराल की तुलना में व्यापक होगा।
मुझे निम्नलिखित स्पष्टीकरण मददगार लगे:
आत्मविश्वास अंतराल आपको इस बारे में बताता है कि आपने कितनी अच्छी तरह से इसका मतलब निर्धारित किया है। मान लें कि डेटा वास्तव में एक गाऊसी वितरण से यादृच्छिक रूप से नमूना है। यदि आप ऐसा कई बार करते हैं, और प्रत्येक नमूने से माध्य के एक विश्वास अंतराल की गणना करते हैं, तो आप उन अंतरालों के लगभग 95% की उम्मीद करेंगे जिसमें जनसंख्या का सही मान शामिल हो। मुख्य बिंदु यह है कि विश्वास अंतराल आपको वास्तविक जनसंख्या पैरामीटर की संभावित स्थिति के बारे में बताता है।
भविष्यवाणी अंतराल आपको बताते हैं कि आप अगले डेटा बिंदु को नमूना देखने की उम्मीद कर सकते हैं। मान लें कि डेटा वास्तव में एक गाऊसी वितरण से यादृच्छिक रूप से नमूना है। डेटा का एक नमूना लीजिए और एक भविष्यवाणी अंतराल की गणना करें। फिर जनसंख्या से एक और मूल्य का नमूना लें। यदि आप ऐसा कई बार करते हैं, तो आपसे अपेक्षा की जाएगी कि अगला मान 95% नमूनों में उस भविष्यवाणी अंतराल के भीतर है। प्रमुख बिंदु यह है कि भविष्यवाणी अंतराल आपको मूल्यों के वितरण के बारे में बताता है, न कि जनसंख्या के निर्धारण में अनिश्चितता के बारे में। मतलब है।
भविष्यवाणी का अंतराल जनसंख्या के मूल्य, प्लस डेटा बिखराव के मूल्य को जानने में अनिश्चितता दोनों के लिए होना चाहिए। इसलिए एक पूर्वानुमान अंतराल हमेशा एक आत्मविश्वास अंतराल की तुलना में व्यापक होता है।
एक भविष्य अवलोकन का एक पूर्वानुमान है, और दूसरा एक अनुमानित मतलब प्रतिक्रिया है। मैं अंतर को स्पष्ट रूप से स्पष्ट करने के लिए और अधिक विस्तृत उत्तर दूंगा और यह कहां से आता है, साथ ही यह अंतर विश्वास के लिए भविष्यवाणी से व्यापक अंतराल में कैसे प्रकट होता है।
यह उदाहरण विश्वास और भविष्यवाणी अंतराल के बीच के अंतर को स्पष्ट कर सकता है: मान लें कि हमारे पास एक प्रतिगमन मॉडल है जो कि बेडरूम, आकार आदि की संख्या के आधार पर घरों की कीमत की भविष्यवाणी करता है। दो प्रकार की भविष्यवाणियां हैं जो हम किसी दिए गए लिए कर सकते हैं :
हम एक विशिष्ट नए घर के लिए कीमत का अनुमान लगा सकते हैं जो विशेषताओं के साथ बाजार में आता है ( "इस घर के लिए अनुमानित कीमत क्या है?" )। इसकी असली कीमत । चूंकि , अनुमानित मूल्य , इस भविष्यवाणी के विचरण का आकलन करने के लिए, हमें अपनी अनिश्चितता के बारे में , साथ ही हमारी भविष्यवाणी (हमारी भविष्यवाणी की त्रुटि) के बारे में हमारी अनिश्चितता और इसलिए के विचरण (हमारी भविष्यवाणी की त्रुटि) को शामिल करना चाहिए । इसे आमतौर पर भविष्य के मूल्य की भविष्यवाणी कहा जाता है ।एक्स 0 y = एक्स टी 0 बीटा + ε ई ( ε ) = 0 y = एक्स टी 0 बीटा बीटा ε
हम विशेषताओं के साथ एक घर की औसत कीमत का भी अनुमान लगा सकते हैं ( " ?" के साथ एक घर के लिए औसत मूल्य क्या होगा )। बिंदु का अनुमान अभी भी , लेकिन अब केवल में विचरण के लिए जिम्मेदार होना चाहिए। इसे आमतौर पर माध्य प्रतिक्रिया का पूर्वानुमान कहा जाता है।एक्स 0 y = एक्स टी 0 बीटा बीटा
ज्यादातर बार, जो हम वास्तव में चाहते हैं वह पहला मामला है। हम जानते हैं कि
यह हमारे माध्य प्रतिक्रिया (केस 2) के लिए विचरण है। लेकिन, भविष्य के अवलोकन (केस 1) की भविष्यवाणी के लिए, याद रखें कि हमें के विचरण की आवश्यकता है ; में विचरण और माना जाता है कि यह स्वतंत्र है । कुछ सरल बीजगणित का उपयोग करते हुए, यह निम्नलिखित आत्मविश्वास अंतराल में परिणाम देता है:
CI के लिए :
सीआई का मतलब प्रतिक्रिया के लिए दिया गया :
जहाँ एक t-आँकड़ा है जिसमें Alpha मात्रात्मक में स्वतंत्रता की डिग्री होती है । n - p α / 2
उम्मीद है कि यह थोड़ा स्पष्ट करता है कि भविष्यवाणी अंतराल हमेशा व्यापक क्यों है, और दो अंतरालों के बीच अंतर्निहित अंतर क्या है। यह उदाहरण आर, सेक के साथ फ़रावे, रैखिक मॉडल से अनुकूलित किया गया था। 4.1।
संक्षिप्त जवाब:
एक पूर्वानुमान अंतराल एक यादृच्छिक चर के साथ जुड़ा हुआ अंतराल है जिसे अभी तक देखा जा सकता है (पूर्वानुमान)।
एक आत्मविश्वास अंतराल एक पैरामीटर के साथ जुड़ा हुआ अंतराल है और एक निरंतर अवधारणा है।
आर में पूर्वानुमान पैकेज के निर्माता, रोब हंडमैन से यहां पूर्ण उत्तर की जांच करें ।
यह उत्तर उन पाठकों के लिए है जो पिछले उत्तरों को पूरी तरह से समझ नहीं पाए हैं। आइए एक विशिष्ट उदाहरण पर चर्चा करें। मान लीजिए कि आप लोगों के वजन का अनुमान उनकी ऊंचाई, लिंग (पुरुष, महिला) और आहार (मानक, कम कार्ब, शाकाहारी) से लगाते हैं। वर्तमान में, पृथ्वी पर 8 बिलियन से अधिक लोग हैं। बेशक, आप एक ही ऊंचाई और अन्य दो मापदंडों वाले कई हजारों लोगों को पा सकते हैं लेकिन अलग-अलग वजन। उनका वजन अलग-अलग होता है क्योंकि उनमें से कुछ में मोटापा होता है और अन्य लोग भुखमरी से पीड़ित हो सकते हैं। उन लोगों में से ज्यादातर बीच में कहीं होंगे।
एक कार्य सभी तीन व्याख्यात्मक चर के समान मूल्यों वाले सभी लोगों के औसत वजन की भविष्यवाणी करना है। यहां हम विश्वास अंतराल का उपयोग करते हैं। एक और समस्या किसी विशिष्ट व्यक्ति के वजन का पूर्वानुमान है। और हम उस व्यक्ति की जीवित परिस्थितियों को नहीं जानते हैं। यहाँ भविष्यवाणी अंतराल का उपयोग किया जाना चाहिए। यह एक ही बिंदु के आसपास केंद्रित है, लेकिन यह आत्मविश्वास अंतराल की तुलना में बहुत व्यापक होना चाहिए।