विश्वास अंतराल और भविष्यवाणी अंतराल के बीच अंतर


80

रैखिक प्रतिगमन में एक भविष्यवाणी अंतराल के लिए आप अंतराल बनाने के लिए अभी भी का उपयोग करते हैं। आप इसका उपयोग का विश्वास अंतराल उत्पन्न करने के लिए भी करते हैं । दोनों में क्या अंतर है?[Y| x0]E^[Y|x]=β0^+β^1xE[Y|x0]


7
E^[Y|x]=β0^+β^1x "अंतराल उत्पन्न नहीं करता है"।
Glen_b

मुझे ऊपर दिए गए किसी भी उत्तर में दो तरीकों के बीच विचलन का कोई कारण नहीं दिखता है। प्रतिगमन परिणाम आम तौर पर पैरामीट्रिक छात्र के वितरण वितरण मानकों और आमतौर पर प्रतिगमन पर आधारित होते हैं, विशेष रूप से डेटा प्रतिगमन मॉडल से खराब मिलान से, अवशिष्ट का नेतृत्व करते हैं जो छात्र नहीं होते हैं, जैसे, तिरछा लेकिन विशेष रूप से भारी पूंछ के साथ आम तौर पर (हमेशा नहीं तो) बनाते हुए डेटा के फैलाव के पैमानिक माप उनके संबंधित प्रत्याशित मापित मात्राओं से बड़े होते हैं। अंगूठे का एक नियम जो मुझे उपयोगी लगा है: अगर मुझे बाहर के, लंबे पूंछ और यू के साथ अवशेष दिखाई देते हैं
कार्ल

जवाबों:


75

आपका प्रश्न काफी सही नहीं है। जैसा कि आप कहते हैं एक आत्मविश्वास अंतराल लिए एक सीमा देता है । एक पूर्वानुमान अंतराल खुद लिए एक सीमा देता है। स्वाभाविक रूप से, के लिए अपना सर्वश्रेष्ठ अनुमान है अंतराल दोनों एक ही मूल्य, के आसपास केंद्रित किया जाएगा, ताकि ।E[yx]y[ y | x ] एक्स βyE[yx]xβ^

@Greg कहते हैं, मानक त्रुटियों अलग होने जा रहे हैं --- हम की उम्मीद मूल्य लगता है कि अधिक सटीक से हम अनुमान ही। अनुमान लगाने के लिए आवश्यकता होती है, जिसमें सही त्रुटि शब्द से आता है।y yE[yx]yy

अंतर को स्पष्ट करने के लिए, कल्पना करें कि हम अपने गुणांक के सही अनुमान प्राप्त कर सकते हैं । फिर, हमारा अनुमान सही होगा। लेकिन हमें अभी भी यकीन नहीं होगा कि खुद क्या था क्योंकि एक वास्तविक त्रुटि शब्द है जिसे हमें विचार करने की आवश्यकता है। हमारा आत्मविश्वास "अंतराल" सिर्फ एक बिंदु होगा क्योंकि हम अनुमान लगाते हैं कि बिल्कुल सही है, लेकिन हमारा पूर्वानुमान अंतराल व्यापक होगा क्योंकि हम सही त्रुटि शब्द को ध्यान में रखते हैं।[ y | x ] y [ y | x ]βE[yx]yE[yx]

इसलिए, एक अनुमान अंतराल एक आत्मविश्वास अंतराल की तुलना में व्यापक होगा।


40

एक भविष्यवाणी अंतराल और एक आत्मविश्वास अंतराल के बीच का अंतर मानक त्रुटि है।

माध्य पर एक विश्वास अंतराल के लिए मानक त्रुटि नमूने के कारण अनिश्चितता को ध्यान में रखती है। आपके नमूने से आपके द्वारा गणना की गई रेखा उस रेखा से भिन्न होगी जो गणना की गई होगी यदि आपके पास पूरी आबादी थी, तो मानक त्रुटि इस अनिश्चितता को ध्यान में रखती है।

एक व्यक्ति अवलोकन पर एक भविष्यवाणी अंतराल के लिए मानक त्रुटि ऊपर की तरह नमूना लेने के कारण अनिश्चितता को ध्यान में रखती है, लेकिन अनुमानित अर्थ के आसपास के व्यक्तियों की परिवर्तनशीलता को भी ध्यान में रखती है। भविष्यवाणी अंतराल के लिए मानक त्रुटि विश्वास अंतराल की तुलना में व्यापक होगी और इसलिए भविष्यवाणी अंतराल विश्वास अंतराल की तुलना में व्यापक होगा।


39

मुझे निम्नलिखित स्पष्टीकरण मददगार लगे:

आत्मविश्वास अंतराल आपको इस बारे में बताता है कि आपने कितनी अच्छी तरह से इसका मतलब निर्धारित किया है। मान लें कि डेटा वास्तव में एक गाऊसी वितरण से यादृच्छिक रूप से नमूना है। यदि आप ऐसा कई बार करते हैं, और प्रत्येक नमूने से माध्य के एक विश्वास अंतराल की गणना करते हैं, तो आप उन अंतरालों के लगभग 95% की उम्मीद करेंगे जिसमें जनसंख्या का सही मान शामिल हो। मुख्य बिंदु यह है कि विश्वास अंतराल आपको वास्तविक जनसंख्या पैरामीटर की संभावित स्थिति के बारे में बताता है।

भविष्यवाणी अंतराल आपको बताते हैं कि आप अगले डेटा बिंदु को नमूना देखने की उम्मीद कर सकते हैं। मान लें कि डेटा वास्तव में एक गाऊसी वितरण से यादृच्छिक रूप से नमूना है। डेटा का एक नमूना लीजिए और एक भविष्यवाणी अंतराल की गणना करें। फिर जनसंख्या से एक और मूल्य का नमूना लें। यदि आप ऐसा कई बार करते हैं, तो आपसे अपेक्षा की जाएगी कि अगला मान 95% नमूनों में उस भविष्यवाणी अंतराल के भीतर है। प्रमुख बिंदु यह है कि भविष्यवाणी अंतराल आपको मूल्यों के वितरण के बारे में बताता है, न कि जनसंख्या के निर्धारण में अनिश्चितता के बारे में। मतलब है।

भविष्यवाणी का अंतराल जनसंख्या के मूल्य, प्लस डेटा बिखराव के मूल्य को जानने में अनिश्चितता दोनों के लिए होना चाहिए। इसलिए एक पूर्वानुमान अंतराल हमेशा एक आत्मविश्वास अंतराल की तुलना में व्यापक होता है।

स्रोत: http://www.graphpad.com/support/faqid/1506/


यहाँ "डेटा स्कैटर" द्वारा हेक का क्या अर्थ है?
टेल

2
@tel: स्पष्ट रूप से विचरण
vonjd

36

एक भविष्य अवलोकन का एक पूर्वानुमान है, और दूसरा एक अनुमानित मतलब प्रतिक्रिया है। मैं अंतर को स्पष्ट रूप से स्पष्ट करने के लिए और अधिक विस्तृत उत्तर दूंगा और यह कहां से आता है, साथ ही यह अंतर विश्वास के लिए भविष्यवाणी से व्यापक अंतराल में कैसे प्रकट होता है।

यह उदाहरण विश्वास और भविष्यवाणी अंतराल के बीच के अंतर को स्पष्ट कर सकता है: मान लें कि हमारे पास एक प्रतिगमन मॉडल है जो कि बेडरूम, आकार आदि की संख्या के आधार पर घरों की कीमत की भविष्यवाणी करता है। दो प्रकार की भविष्यवाणियां हैं जो हम किसी दिए गए लिए कर सकते हैं :x0

  1. हम एक विशिष्ट नए घर के लिए कीमत का अनुमान लगा सकते हैं जो विशेषताओं के साथ बाजार में आता है ( "इस घर के लिए अनुमानित कीमत क्या है?" )। इसकी असली कीमत । चूंकि , अनुमानित मूल्य , इस भविष्यवाणी के विचरण का आकलन करने के लिए, हमें अपनी अनिश्चितता के बारे में , साथ ही हमारी भविष्यवाणी (हमारी भविष्यवाणी की त्रुटि) के बारे में हमारी अनिश्चितता और इसलिए के विचरण (हमारी भविष्यवाणी की त्रुटि) को शामिल करना चाहिए । इसे आमतौर पर भविष्य के मूल्य की भविष्यवाणी कहा जाता है ।एक्स 0 y = एक्स टी 0 बीटा + ε ( ε ) = 0 y = एक्स टी 0 बीटा बीटा εx0x0

    y=x0Tβ+ϵ
    E(ϵ)=0
    y^=x0Tβ^
    β^ϵ
  2. हम विशेषताओं के साथ एक घर की औसत कीमत का भी अनुमान लगा सकते हैं ( " ?" के साथ एक घर के लिए औसत मूल्य क्या होगा )। बिंदु का अनुमान अभी भी , लेकिन अब केवल में विचरण के लिए जिम्मेदार होना चाहिए। इसे आमतौर पर माध्य प्रतिक्रिया का पूर्वानुमान कहा जाता है।एक्स 0 y = एक्स टी 0 बीटा बीटाx0x0

    y^=x0Tβ^
    β^

ज्यादातर बार, जो हम वास्तव में चाहते हैं वह पहला मामला है। हम जानते हैं कि

var(x0Tβ^)=x0T(XTX)1x0σ2

यह हमारे माध्य प्रतिक्रिया (केस 2) के लिए विचरण है। लेकिन, भविष्य के अवलोकन (केस 1) की भविष्यवाणी के लिए, याद रखें कि हमें के विचरण की आवश्यकता है ; में विचरण और माना जाता है कि यह स्वतंत्र है । कुछ सरल बीजगणित का उपयोग करते हुए, यह निम्नलिखित आत्मविश्वास अंतराल में परिणाम देता है:x0Tβ^+ϵϵσ2β^

  1. CI के लिए :x0

    y^0±tnp(α/2)σ^x0T(XTX)1x0+1
  2. सीआई का मतलब प्रतिक्रिया के लिए दिया गया :x0

    y^0±tnp(α/2)σ^x0T(XTX)1x0

जहाँ एक t-आँकड़ा है जिसमें Alpha मात्रात्मक में स्वतंत्रता की डिग्री होती है । n - p α / 2tnpα/2npα/2

उम्मीद है कि यह थोड़ा स्पष्ट करता है कि भविष्यवाणी अंतराल हमेशा व्यापक क्यों है, और दो अंतरालों के बीच अंतर्निहित अंतर क्या है। यह उदाहरण आर, सेक के साथ फ़रावे, रैखिक मॉडल से अनुकूलित किया गया था। 4.1।


2
एक स्पष्ट और विचारशील प्रतिक्रिया द्वारा एक पुराने धागे को काफी बेहतर देखना अच्छा है। हमारी साइट पर आपका स्वागत है!
whuber

ऐसा नहीं होना चाहिए ... x0 + 1 / n +1 (भविष्यवाणी अंतराल (1) के लिए), और ... x0 + 1 / n (विश्वास अंतराल के लिए (2) _ www2.stat.duke.edu /~tll13/s101/slides/unit6lec3H.pdf असली- statistics.com/regression/…
user48956

12

संक्षिप्त जवाब:

एक पूर्वानुमान अंतराल एक यादृच्छिक चर के साथ जुड़ा हुआ अंतराल है जिसे अभी तक देखा जा सकता है (पूर्वानुमान)।

एक आत्मविश्वास अंतराल एक पैरामीटर के साथ जुड़ा हुआ अंतराल है और एक निरंतर अवधारणा है।

आर में पूर्वानुमान पैकेज के निर्माता, रोब हंडमैन से यहां पूर्ण उत्तर की जांच करें ।


3

यह उत्तर उन पाठकों के लिए है जो पिछले उत्तरों को पूरी तरह से समझ नहीं पाए हैं। आइए एक विशिष्ट उदाहरण पर चर्चा करें। मान लीजिए कि आप लोगों के वजन का अनुमान उनकी ऊंचाई, लिंग (पुरुष, महिला) और आहार (मानक, कम कार्ब, शाकाहारी) से लगाते हैं। वर्तमान में, पृथ्वी पर 8 बिलियन से अधिक लोग हैं। बेशक, आप एक ही ऊंचाई और अन्य दो मापदंडों वाले कई हजारों लोगों को पा सकते हैं लेकिन अलग-अलग वजन। उनका वजन अलग-अलग होता है क्योंकि उनमें से कुछ में मोटापा होता है और अन्य लोग भुखमरी से पीड़ित हो सकते हैं। उन लोगों में से ज्यादातर बीच में कहीं होंगे।

एक कार्य सभी तीन व्याख्यात्मक चर के समान मूल्यों वाले सभी लोगों के औसत वजन की भविष्यवाणी करना है। यहां हम विश्वास अंतराल का उपयोग करते हैं। एक और समस्या किसी विशिष्ट व्यक्ति के वजन का पूर्वानुमान है। और हम उस व्यक्ति की जीवित परिस्थितियों को नहीं जानते हैं। यहाँ भविष्यवाणी अंतराल का उपयोग किया जाना चाहिए। यह एक ही बिंदु के आसपास केंद्रित है, लेकिन यह आत्मविश्वास अंतराल की तुलना में बहुत व्यापक होना चाहिए।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.