भविष्यवाणी और सहिष्णुता अंतराल


11

मेरे पास भविष्यवाणी और सहिष्णुता के अंतराल के लिए कुछ प्रश्न हैं।

आइए पहले सहिष्णुता अंतराल की परिभाषा पर सहमत हों: हमें एक विश्वास स्तर दिया जाता है, 90% कहते हैं, जनसंख्या का प्रतिशत कैप्चर करने के लिए, 99% और एक नमूना आकार कहते हैं, 20 कहते हैं। संभाव्यता वितरण ज्ञात है, सामान्य कहें सुविधा के लिए। अब, उपरोक्त तीन संख्याओं (90%, 99% और 20) और इस तथ्य को देखते हुए कि अंतर्निहित वितरण सामान्य है, हम सहिष्णुता संख्या गणना कर सकते हैं । एक नमूना को देखते हुए ( एक्स 1 , x 2 , ... , एक्स 20 ) के साथ मतलब ˉ एक्स और मानक विचलन रों , सहिष्णुता अंतराल है ˉ एक्स ± कश्मीर रोंk(x1,x2,,x20)x¯sx¯±ks। यदि यह सहिष्णुता अंतराल 99% आबादी को पकड़ लेता है, तो नमूना (x1,x2,,x20) को एक सफलता कहा जाता है और आवश्यकता यह है कि 90% नमूने सफल होते हैं ।

टिप्पणी: किसी नमूने के सफल होने के लिए 90% एक प्राथमिकता है। 99% सशर्त संभावना है कि भविष्य का अवलोकन सहिष्णुता अंतराल में होगा, यह देखते हुए कि नमूना एक सफलता है।

मेरे प्रश्न: क्या हम पूर्वानुमान अंतराल को सहिष्णुता अंतराल के रूप में देख सकते हैं? वेब को देखते हुए मुझे इस पर परस्पर विरोधी उत्तर मिले, यह उल्लेख नहीं करने के लिए कि किसी ने वास्तव में भविष्यवाणी अंतराल को ध्यान से परिभाषित नहीं किया है। इसलिए, यदि आपके पास भविष्यवाणी अंतराल (या एक संदर्भ) की सटीक परिभाषा है, तो मैं इसकी सराहना करूंगा।

मैंने जो समझा वह उदाहरण के लिए 99% भविष्यवाणी अंतराल है, सभी नमूनों के लिए भविष्य के सभी मूल्यों के 99% पर कब्जा नहीं करता है । यह एक सहिष्णुता अंतराल के समान होगा जो 100% संभावना के साथ 99% आबादी को पकड़ लेता है।

90% पूर्वानुमान अंतराल के लिए मुझे मिली परिभाषाओं में, 90% एक प्राथमिक संभावना है जिसे एक नमूना दिया गया है, कहते हैं (आकार तय हो गया है) और एक एकल भविष्य अवलोकन y , वह y भविष्यवाणी अंतराल में होगी। तो, ऐसा लगता है कि नमूना और भविष्य के मूल्य दोनों एक ही समय में दिए गए हैं, सहिष्णुता अंतराल के विपरीत, जहां नमूना दिया गया है और एक निश्चित संभावना के साथ यह एक सफलता है , और इस शर्त के तहत कि नमूना एक सफलता(x1,x2,,x20)yy, एक भविष्य मूल्य दिया जाता है और एक निश्चित संभावना के साथ सहिष्णुता अंतराल में गिर जाता है। मुझे यकीन नहीं है कि भविष्यवाणी अंतराल की उपरोक्त परिभाषा सही है या नहीं, लेकिन यह प्रतिवाद (कम से कम) लगता है।

कोई मदद?


4
एक सामान्य नमूने के लिए एक तरफा सहिष्णुता अंतराल इस धारणा को समझने में मदद कर सकता है। ऊपरी -टॉलरेंस बाउंड कुछ भी नहीं है लेकिन मॉडल के ग्रहण किए गए वितरण के 99 % -क्वेंटाइल के ऊपरी विश्वास सीमा है । इसलिए एक सामान्य वितरण के मामले में यह एक ऊपरी आत्मविश्वास पैरामीटर के लिए बाध्य है μ + कश्मीर σ जहां कश्मीर = z 99 % है 99 % मानक गाऊसी वितरण की। 99%99%μ+kσk=z99%99%
स्टीफन लॉरेंट

यह एक अच्छा पुनर्निर्माण, स्टीफन है, क्योंकि यह तुरंत पता चलता है वहाँ सहिष्णुता सीमा के कई प्रकार के होते हैं: एक एक के लिए पूछ सकते ऊपरी पर विश्वास सीमा एक के लिए, कम आत्मविश्वास सीमा पर μ + z 0.99 σ , या के लिए ( उस पैरामीटर का निष्पक्ष अनुमान ) । तीनों को साहित्य में "सहिष्णुता सीमा" कहा जाता है। μ+z0.99σμ+z0.99σ
whuber

मैं तुम्हें नहीं बल्कि पर एक कम आत्मविश्वास सीमा कहना चाहता लगता है ? μz0.99σ
स्टीफन लॉरेंट

2
वास्तव में, नहीं, स्टीफन (यही कारण है कि मैंने पैरामीटर के लिए सूत्र को दोहराने का ध्यान रखा)। कम सहिष्णुता सीमा के लिए भी तीन समान परिभाषाएं हैं । उदाहरण के लिए, हम करने के लिए चाहते हो सकता है के तहत जनसंख्या का प्रतिशत -estimate ऊपरी 99 है, लेकिन मूल्यवान समझना की मात्रा हम वहाँ हो (जैसे) एक 5% संभावना है कि हमारे मूल्यवान समझना अभी भी बहुत अधिक हो जाएगा जोर देते हैं नियंत्रित करने के लिए। यह हमें "95% आत्मविश्वास के साथ डेटा शो," जैसी चीजों को कहने की अनुमति देगा, कि जनसंख्या का 99 वां प्रतिशत ऐसे-और इस तरह के मूल्य से अधिक है। "
whuber

जवाबों:


14

आपकी परिभाषाएँ सही प्रतीत होती हैं।

पुस्तक इन मामलों के बारे में परामर्श करने के लिए है सांख्यिकीय अंतराल (जेराल्ड हैन और विलियम मीकर), 1991 मैं बोली:

एक एकल भविष्य अवलोकन के लिए एक भविष्यवाणी अंतराल एक अंतराल है जो एक निर्दिष्ट डिग्री के साथ होगा, जिसमें आबादी से अगले (या कुछ अन्य निर्धारित) बेतरतीब ढंग से चयनित अवलोकन शामिल हैं।

100(1α)%

x=(x1,,xn)X=(X1,,Xn)FθθFFθ|θΘX0Fθn

  1. [l(x),u(x)]

    infθ{Prθ(X0[l(X),u(X)])}=100(1α)%.

    विशेष रूप से, कानून द्वारा निर्धारित के भिन्न वितरण को संदर्भित करता है । किसी भी सशर्त संभावनाओं की अनुपस्थिति पर ध्यान दें: यह एक पूर्ण संयुक्त संभावना है। ध्यान दें, भी, एक लौकिक अनुक्रम के किसी भी संदर्भ की अनुपस्थिति: बहुत अच्छी तरह से अन्य मूल्यों से पहले समय में मनाया जा सकता है । यह मायने नहीं रखता।Prθn+1(X0,X1,,Xn)FθX0

    मुझे यकीन नहीं है कि इसका कौन सा पहलू "प्रतिवाद" हो सकता है। यदि हम डेटा एकत्र करने से पहले एक गतिविधि के रूप में एक सांख्यिकीय प्रक्रिया का चयन करने की कल्पना करते हैं, तो यह नियोजित दो-चरणीय प्रक्रिया का एक स्वाभाविक और उचित सूत्रीकरण है, क्योंकि दोनों डेटा ( ) और "भविष्य के मूल्य" को यादृच्छिक रूप में मॉडलिंग करने की आवश्यकता है।Xi,i=1,,nX0

  2. एंडपॉइंट्स द्वारा दिया गया एक सहिष्णुता अंतराल, परिभाषित करने वाली संपत्ति है(L(x),U(x)]

    infθ{Prθ(Fθ(U(X))Fθ(L(X))p)}=100(1α)%.

    किसी भी संदर्भ की अनुपस्थिति पर ध्यान दें : यह कोई भूमिका नहीं निभाता है।X0

जब सामान्य वितरण का सेट होता है, तो फॉर्म के पूर्ववर्ती अंतराल होते हैं{Fθ}

l(x)=x¯k(α,n)s,u(x)=x¯+k(α,n)s

(+ नमूना माध्य है और नमूना मानक विचलन है)। फ़ंक्शन का मान , जो Hnn और Meeker सारणीबद्ध करते हैं, डेटा पर निर्भर नहीं करते हैं । सामान्य स्थिति में भी , अन्य भविष्यवाणी अंतराल प्रक्रियाएं हैं: ये एकमात्र नहीं हैं।x¯skx

इसी तरह, प्रपत्र के सहिष्णुता अंतराल मौजूद हैं

L(x)=x¯K(α,n,p)s,U(x)=x¯+K(α,n,p)s.

अन्य सहिष्णुता अंतराल प्रक्रियाएं हैं : ये एकमात्र नहीं हैं।

सूत्रों के इन जोड़े के बीच समानता को देखते हुए, हम समीकरण को हल कर सकते हैं

k(α,n)=K(α,n,p).

यह करने के लिए एक की अनुमति देता है पुनर्व्याख्या (अलग से कई अलग अलग संभव तरीके में एक सहिष्णुता अंतराल के रूप में एक भविष्यवाणी अंतराल और ) या करने के लिए पुनर्व्याख्या एक भविष्यवाणी अंतराल के रूप में एक सहिष्णुता अंतराल (केवल अब आमतौर पर विशिष्ट से निर्धारित होता है और )। यह भ्रम का एक मूल हो सकता है।αpααp


2
इन अंतरालों के बीच भ्रम वास्तविक है। एक दशक पहले मैंने एक सरकारी सांख्यिकीविद् के साथ कई कठिन वार्तालाप किए जो अंतर से अनभिज्ञ थे और (वायरल) पहचानने में असमर्थ एक है। मार्गदर्शन बनाने, रिपोर्ट्स की समीक्षा करने, केस वर्कर्स को सलाह देने, सॉफ्टवेयर बांटने और यहां तक ​​कि सहकर्मी-समीक्षा प्रकाशन में उनकी प्रमुख भूमिका ने इन भ्रांतियों की निरंतरता को बढ़ावा दिया है। तो खबरदार!
whuber

बहुत अच्छा जवाब, धन्यवाद। मैंने कुछ सांख्यिकीविदों को यह कहते हुए हृदय से लगा लिया कि एक पूर्वानुमान अंतराल साथ एक सहिष्णुता अंतराल है । क्या इस विचार के पीछे कोई वास्तविक तथ्य है? दूसरे शब्दों में, क्या यह सच है कि , या ऐसा कुछ? p=50%k(α,n)=K(α,n,0.5)
स्टीफन लॉरेंट

3
नहीं, यह सच नहीं है @ स्टीफन। यह देखने के लिए कि क्यों नहीं, बड़े और मध्यम आत्मविश्वास के मामले पर विचार करें , 95% कहते हैं। साथ , दो तरफा सहिष्णुता अंतराल इसलिए अत्यंत वितरण के कुछ बीच 50% के करीब होना चाहिए, इसलिए परिभाषा से वहाँ केवल 50% संभावना है कि यह भीतर झूठ होगा, नहीं 95% वांछित। यह बहुत बड़ा अंतर है! वास्तव में, 95% आबादी के लिए एक सहिष्णुता अंतराल 95% विश्वास के साथ एक भविष्यवाणी अंतराल के करीब होना चाहिए, लेकिन वे अभी भी बिल्कुल सहमत नहीं हैं। np=50%X0
whuber

मैंने अभी इस बारे में सोचा है और मेरा मानना ​​है कि यह तथ्य निम्नलिखित है: जब बड़ा है। यह देखना आसान है कि कब गैर-केंद्रीय t वितरण की सहायता से दिया जाने वाला शास्त्रीय सहिष्णुता कारक है ( -क्वांटाइल गैर-केंद्रीयता पैरामीटर ) हैk(α,n)K(50%,n,1α)nK50%z1α/n
स्टीफन लॉरेंट

@whuber। जवाब के लिए धन्यवाद। इससे पहले कि मैं इसे सही करूं, मुझे इसे समझना होगा। मुझे इसे "पचाने" के लिए कुछ समय दें।
आयोनिस सोल्डैटोस

1

जैसा कि मैं चीजों को समझता हूं, सामान्य सहिष्णुता सीमा के लिए, का मूल्य एक गैर केंद्रीय टी प्रतिशतक से आता है। स्पष्ट रूप से, डब्ल्यू ह्यूबर के बिंदु पर, कुछ सांख्यिकीविद् हैं जो सहिष्णुता की सीमा बनाम भविष्यवाणी की सीमा के विचार से अपरिचित हैं; सहिष्णुता का विचार ज्यादातर इंजीनियरिंग डिजाइन और निर्माण में उठता है, जैसा कि नैदानिक ​​जैव प्रौद्योगिकी के विपरीत है। शायद सहिष्णुता अंतराल के साथ परिचित की कमी का कारण है, और भविष्यवाणी अंतराल के साथ भ्रम, वह संदर्भ है जिसमें कोई अपने सांख्यिकीय प्रशिक्षण प्राप्त करता है।K(α,p)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.