विश्वास अंतराल और भविष्यवाणी अंतराल के बीच अंतर

80

रैखिक प्रतिगमन में एक भविष्यवाणी अंतराल के लिए आप अंतराल बनाने के लिए अभी भी का उपयोग करते हैं। आप इसका उपयोग का विश्वास अंतराल उत्पन्न करने के लिए भी करते हैं । दोनों में क्या अंतर है? $\hat{E}[Y|x] = \hat{\beta_0}+\hat{\beta}_{1}x$ $E[Y|x_0]$

— सवाल
स्रोत

7

\hat{E} [Y | x] = \hat{β_{0}} + {\hat{β}}_{1} x

$\hat{E}[Y|x] = \hat{\beta_0}+\hat{\beta}_{1}x$ "अंतराल उत्पन्न नहीं करता है"।

— Glen_b

मुझे ऊपर दिए गए किसी भी उत्तर में दो तरीकों के बीच विचलन का कोई कारण नहीं दिखता है। प्रतिगमन परिणाम आम तौर पर पैरामीट्रिक छात्र के वितरण वितरण मानकों और आमतौर पर प्रतिगमन पर आधारित होते हैं, विशेष रूप से डेटा प्रतिगमन मॉडल से खराब मिलान से, अवशिष्ट का नेतृत्व करते हैं जो छात्र नहीं होते हैं, जैसे, तिरछा लेकिन विशेष रूप से भारी पूंछ के साथ आम तौर पर (हमेशा नहीं तो) बनाते हुए डेटा के फैलाव के पैमानिक माप उनके संबंधित प्रत्याशित मापित मात्राओं से बड़े होते हैं। अंगूठे का एक नियम जो मुझे उपयोगी लगा है: अगर मुझे बाहर के, लंबे पूंछ और यू के साथ अवशेष दिखाई देते हैं

— कार्ल

संबंधित: एक रेखीय मॉडल में भविष्यवाणी सीमा के लिए एक सूत्र प्राप्त करना ।

— Scortchi

75

आपका प्रश्न काफी सही नहीं है। जैसा कि आप कहते हैं एक आत्मविश्वास अंतराल लिए एक सीमा देता है । एक पूर्वानुमान अंतराल खुद लिए एक सीमा देता है। स्वाभाविक रूप से, के लिए अपना सर्वश्रेष्ठ अनुमान है अंतराल दोनों एक ही मूल्य, के आसपास केंद्रित किया जाएगा, ताकि । $\text{E}[y \mid x]$ $y$ $y$ $\text{E}[y \mid x]$ $x\hat{\beta}$

@Greg कहते हैं, मानक त्रुटियों अलग होने जा रहे हैं --- हम की उम्मीद मूल्य लगता है कि अधिक सटीक से हम अनुमान ही। अनुमान लगाने के लिए आवश्यकता होती है, जिसमें सही त्रुटि शब्द से आता है। $\text{E}[y \mid x]$ $y$ $y$

अंतर को स्पष्ट करने के लिए, कल्पना करें कि हम अपने गुणांक के सही अनुमान प्राप्त कर सकते हैं । फिर, हमारा अनुमान सही होगा। लेकिन हमें अभी भी यकीन नहीं होगा कि खुद क्या था क्योंकि एक वास्तविक त्रुटि शब्द है जिसे हमें विचार करने की आवश्यकता है। हमारा आत्मविश्वास "अंतराल" सिर्फ एक बिंदु होगा क्योंकि हम अनुमान लगाते हैं कि बिल्कुल सही है, लेकिन हमारा पूर्वानुमान अंतराल व्यापक होगा क्योंकि हम सही त्रुटि शब्द को ध्यान में रखते हैं। $\beta$ $\text{E}[y \mid x]$ $y$ $\text{E}[y \mid x]$

इसलिए, एक अनुमान अंतराल एक आत्मविश्वास अंतराल की तुलना में व्यापक होगा।

— चार्ली
स्रोत

40

एक भविष्यवाणी अंतराल और एक आत्मविश्वास अंतराल के बीच का अंतर मानक त्रुटि है।

माध्य पर एक विश्वास अंतराल के लिए मानक त्रुटि नमूने के कारण अनिश्चितता को ध्यान में रखती है। आपके नमूने से आपके द्वारा गणना की गई रेखा उस रेखा से भिन्न होगी जो गणना की गई होगी यदि आपके पास पूरी आबादी थी, तो मानक त्रुटि इस अनिश्चितता को ध्यान में रखती है।

एक व्यक्ति अवलोकन पर एक भविष्यवाणी अंतराल के लिए मानक त्रुटि ऊपर की तरह नमूना लेने के कारण अनिश्चितता को ध्यान में रखती है, लेकिन अनुमानित अर्थ के आसपास के व्यक्तियों की परिवर्तनशीलता को भी ध्यान में रखती है। भविष्यवाणी अंतराल के लिए मानक त्रुटि विश्वास अंतराल की तुलना में व्यापक होगी और इसलिए भविष्यवाणी अंतराल विश्वास अंतराल की तुलना में व्यापक होगा।

— ग्रेग हिमपात
स्रोत

39

मुझे निम्नलिखित स्पष्टीकरण मददगार लगे:

आत्मविश्वास अंतराल आपको इस बारे में बताता है कि आपने कितनी अच्छी तरह से इसका मतलब निर्धारित किया है। मान लें कि डेटा वास्तव में एक गाऊसी वितरण से यादृच्छिक रूप से नमूना है। यदि आप ऐसा कई बार करते हैं, और प्रत्येक नमूने से माध्य के एक विश्वास अंतराल की गणना करते हैं, तो आप उन अंतरालों के लगभग 95% की उम्मीद करेंगे जिसमें जनसंख्या का सही मान शामिल हो। मुख्य बिंदु यह है कि विश्वास अंतराल आपको वास्तविक जनसंख्या पैरामीटर की संभावित स्थिति के बारे में बताता है।

भविष्यवाणी अंतराल आपको बताते हैं कि आप अगले डेटा बिंदु को नमूना देखने की उम्मीद कर सकते हैं। मान लें कि डेटा वास्तव में एक गाऊसी वितरण से यादृच्छिक रूप से नमूना है। डेटा का एक नमूना लीजिए और एक भविष्यवाणी अंतराल की गणना करें। फिर जनसंख्या से एक और मूल्य का नमूना लें। यदि आप ऐसा कई बार करते हैं, तो आपसे अपेक्षा की जाएगी कि अगला मान 95% नमूनों में उस भविष्यवाणी अंतराल के भीतर है। प्रमुख बिंदु यह है कि भविष्यवाणी अंतराल आपको मूल्यों के वितरण के बारे में बताता है, न कि जनसंख्या के निर्धारण में अनिश्चितता के बारे में। मतलब है।

भविष्यवाणी का अंतराल जनसंख्या के मूल्य, प्लस डेटा बिखराव के मूल्य को जानने में अनिश्चितता दोनों के लिए होना चाहिए। इसलिए एक पूर्वानुमान अंतराल हमेशा एक आत्मविश्वास अंतराल की तुलना में व्यापक होता है।

स्रोत: http://www.graphpad.com/support/faqid/1506/

— vonjd
स्रोत

यहाँ "डेटा स्कैटर" द्वारा हेक का क्या अर्थ है?

— टेल

2

@tel: स्पष्ट रूप से विचरण

— vonjd

36

एक भविष्य अवलोकन का एक पूर्वानुमान है, और दूसरा एक अनुमानित मतलब प्रतिक्रिया है। मैं अंतर को स्पष्ट रूप से स्पष्ट करने के लिए और अधिक विस्तृत उत्तर दूंगा और यह कहां से आता है, साथ ही यह अंतर विश्वास के लिए भविष्यवाणी से व्यापक अंतराल में कैसे प्रकट होता है।

यह उदाहरण विश्वास और भविष्यवाणी अंतराल के बीच के अंतर को स्पष्ट कर सकता है: मान लें कि हमारे पास एक प्रतिगमन मॉडल है जो कि बेडरूम, आकार आदि की संख्या के आधार पर घरों की कीमत की भविष्यवाणी करता है। दो प्रकार की भविष्यवाणियां हैं जो हम किसी दिए गए लिए कर सकते हैं : $x_0$

हम एक विशिष्ट नए घर के लिए कीमत का अनुमान लगा सकते हैं जो विशेषताओं के साथ बाजार में आता है ( "इस घर के लिए अनुमानित कीमत क्या है?" )। इसकी असली कीमत । चूंकि , अनुमानित मूल्य , इस भविष्यवाणी के विचरण का आकलन करने के लिए, हमें अपनी अनिश्चितता के बारे में , साथ ही हमारी भविष्यवाणी (हमारी भविष्यवाणी की त्रुटि) के बारे में हमारी अनिश्चितता और इसलिए के विचरण (हमारी भविष्यवाणी की त्रुटि) को शामिल करना चाहिए । इसे आमतौर पर भविष्य के मूल्य की भविष्यवाणी कहा जाता है । $x_0$ $x_0$
$y = x_{0}^{T} β + ϵ$ $y = x_0^T\beta+\epsilon$ $E(\epsilon)=0$ $\hat{y} = x_{0}^{T} \hat{β}$ $\hat{y} = x_0^T\hat{\beta}$ $\hat{\beta}$ $\epsilon$
हम विशेषताओं के साथ एक घर की औसत कीमत का भी अनुमान लगा सकते हैं ( " ?" के साथ एक घर के लिए औसत मूल्य क्या होगा )। बिंदु का अनुमान अभी भी , लेकिन अब केवल में विचरण के लिए जिम्मेदार होना चाहिए। इसे आमतौर पर माध्य प्रतिक्रिया का पूर्वानुमान कहा जाता है। $x_0$ $x_0$
$\hat{y} = x_{0}^{T} \hat{β}$ $\hat{y} = x_0^T\hat{\beta}$ $\hat{\beta}$

ज्यादातर बार, जो हम वास्तव में चाहते हैं वह पहला मामला है। हम जानते हैं कि

v a r (x_{0}^{T} \hat{β}) = x_{0}^{T} (X^{T} X)^{- 1} x_{0} σ^{2}

$var(x_0^T\hat{\beta}) = x_0^T(X^TX)^{-1}x_0\sigma^2$

यह हमारे माध्य प्रतिक्रिया (केस 2) के लिए विचरण है। लेकिन, भविष्य के अवलोकन (केस 1) की भविष्यवाणी के लिए, याद रखें कि हमें के विचरण की आवश्यकता है ; में विचरण और माना जाता है कि यह स्वतंत्र है । कुछ सरल बीजगणित का उपयोग करते हुए, यह निम्नलिखित आत्मविश्वास अंतराल में परिणाम देता है: $x_0^T\hat{\beta} + \epsilon$ $\epsilon$ $\sigma^2$ $\hat{\beta}$

CI के लिए : $x_0$
${\hat{y}}_{0} \pm t_{n - p}^{(α / 2)} \hat{σ} \sqrt{x_{0}^{T} (X^{T} X)^{- 1} x_{0} + 1}$ $\hat{y}_0\pm t_{n-p}^{(\alpha/2)}\hat{\sigma}\sqrt{x_0^T(X^TX)^{-1}x_0 + 1}$
सीआई का मतलब प्रतिक्रिया के लिए दिया गया : $x_0$
${\hat{y}}_{0} \pm t_{n - p}^{(α / 2)} \hat{σ} \sqrt{x_{0}^{T} (X^{T} X)^{- 1} x_{0}}$ $\hat{y}_0\pm t_{n-p}^{(\alpha/2)}\hat{\sigma}\sqrt{x_0^T(X^TX)^{-1}x_0}$

जहाँ एक t-आँकड़ा है जिसमें Alpha मात्रात्मक में स्वतंत्रता की डिग्री होती है । $t_{n-p}^{\alpha/2}$ $n-p$ $\alpha/2$

उम्मीद है कि यह थोड़ा स्पष्ट करता है कि भविष्यवाणी अंतराल हमेशा व्यापक क्यों है, और दो अंतरालों के बीच अंतर्निहित अंतर क्या है। यह उदाहरण आर, सेक के साथ फ़रावे, रैखिक मॉडल से अनुकूलित किया गया था। 4.1।

— jpgard
स्रोत

2

एक स्पष्ट और विचारशील प्रतिक्रिया द्वारा एक पुराने धागे को काफी बेहतर देखना अच्छा है। हमारी साइट पर आपका स्वागत है!

— whuber

ऐसा नहीं होना चाहिए ... x0 + 1 / n +1 (भविष्यवाणी अंतराल (1) के लिए), और ... x0 + 1 / n (विश्वास अंतराल के लिए (2) _ www2.stat.duke.edu /~tll13/s101/slides/unit6lec3H.pdf असली- statistics.com/regression/…

— user48956

12

संक्षिप्त जवाब:

एक पूर्वानुमान अंतराल एक यादृच्छिक चर के साथ जुड़ा हुआ अंतराल है जिसे अभी तक देखा जा सकता है (पूर्वानुमान)।

एक आत्मविश्वास अंतराल एक पैरामीटर के साथ जुड़ा हुआ अंतराल है और एक निरंतर अवधारणा है।

आर में पूर्वानुमान पैकेज के निर्माता, रोब हंडमैन से यहां पूर्ण उत्तर की जांच करें ।

— pablo_sci
स्रोत

3

यह उत्तर उन पाठकों के लिए है जो पिछले उत्तरों को पूरी तरह से समझ नहीं पाए हैं। आइए एक विशिष्ट उदाहरण पर चर्चा करें। मान लीजिए कि आप लोगों के वजन का अनुमान उनकी ऊंचाई, लिंग (पुरुष, महिला) और आहार (मानक, कम कार्ब, शाकाहारी) से लगाते हैं। वर्तमान में, पृथ्वी पर 8 बिलियन से अधिक लोग हैं। बेशक, आप एक ही ऊंचाई और अन्य दो मापदंडों वाले कई हजारों लोगों को पा सकते हैं लेकिन अलग-अलग वजन। उनका वजन अलग-अलग होता है क्योंकि उनमें से कुछ में मोटापा होता है और अन्य लोग भुखमरी से पीड़ित हो सकते हैं। उन लोगों में से ज्यादातर बीच में कहीं होंगे।

एक कार्य सभी तीन व्याख्यात्मक चर के समान मूल्यों वाले सभी लोगों के औसत वजन की भविष्यवाणी करना है। यहां हम विश्वास अंतराल का उपयोग करते हैं। एक और समस्या किसी विशिष्ट व्यक्ति के वजन का पूर्वानुमान है। और हम उस व्यक्ति की जीवित परिस्थितियों को नहीं जानते हैं। यहाँ भविष्यवाणी अंतराल का उपयोग किया जाना चाहिए। यह एक ही बिंदु के आसपास केंद्रित है, लेकिन यह आत्मविश्वास अंतराल की तुलना में बहुत व्यापक होना चाहिए।

— सेरही कुशचेंको
स्रोत