यह वह चीज़ है जिसे समझना मुश्किल हो सकता है:
- यदि सभी आत्मविश्वास अंतराल के औसतन 95% में पैरामीटर होगा
- और मेरे पास एक विशिष्ट आत्मविश्वास अंतराल है
- यह संभावना क्यों नहीं है कि इस अंतराल में पैरामीटर भी 95% है?
एक आत्मविश्वास अंतराल नमूनाकरण प्रक्रिया से संबंधित है। यदि आप कई नमूने लेते हैं और प्रत्येक नमूने के लिए 95% विश्वास अंतराल की गणना करते हैं, तो आप पाएंगे कि उन अंतरालों में से 95% में जनसंख्या का मतलब होता है।
यह उदाहरण के लिए औद्योगिक गुणवत्ता विभागों के लिए उपयोगी है। वे लोग कई नमूने लेते हैं, और अब उन्हें विश्वास है कि उनके अधिकांश अनुमान वास्तविकता के बहुत करीब होंगे। वे जानते हैं कि उनके अनुमानों का 95% बहुत अच्छा है, लेकिन वे यह नहीं कह सकते कि प्रत्येक और प्रत्येक विशिष्ट अनुमान के बारे में।
इसकी तुलना डाइसिंग रोल से करें: यदि आप 600 (फेयर) पासे को रोल करेंगे, तो आप कितने 6 फेंकेंगे? आपका सबसे अच्छा अनुमान * 600 = 100 है।16
हालांकि, यदि आपने वन डाई को फेंक दिया है, तो यह कहना बेकार है: "1/6 या 16.6% संभावना है कि मैंने अब 6 फेंक दिया है"। क्यों? क्योंकि मरना या तो एक 6, या कुछ अन्य आंकड़ा दिखाता है। आपने 6 या नहीं फेंका है। तो संभावना 1 है, या 0. संभाव्यता नहीं हो सकती है ।16
थ्रो से पहले यह पूछे जाने पर कि वन डाई के साथ 6 को फेंकने की संभावना क्या होगी, एक बायेसियन जवाब देगा " " (पूर्व जानकारी के आधार पर: हर कोई जानता है कि एक मरने के 6 पक्ष और एक समान मौका होता है दोनों में से किसी पर भी गिरना), लेकिन एक फ़्रीक्वेंटिस्ट "नो आइडिया" कहेगा, क्योंकि अक्सरवाद डेटा पर आधारित होता है, न कि पुजारियों या किसी बाहरी सूचना पर।16
इसी तरह, यदि आपके पास केवल 1 नमूना है (इस प्रकार 1 आत्मविश्वास अंतराल), तो आपके पास यह कहने का कोई तरीका नहीं है कि यह कितनी संभावना है कि जनसंख्या का मतलब उस अंतराल में है। माध्य (या कोई भी पैरामीटर) या तो इसमें है, या नहीं। संभावना या तो 1, या 0 है।
इसके अलावा, यह सही नहीं है कि कॉन्फिडेंस इंटरवल के भीतर के मूल्य उस से अधिक होने की संभावना है। मैंने एक छोटा चित्रण किया; सब कुछ ° C में मापा जाता है। याद रखें, पानी 0 ° C पर जम जाता है और 100 ° C पर उबलता है।
मामला: एक ठंडी झील में, हम बर्फ के नीचे बहने वाले पानी के तापमान का अनुमान लगाना चाहते हैं। हम 100 स्थानों में तापमान को मापते हैं। यहाँ मेरा डेटा हैं:
- 0.1 डिग्री सेल्सियस (49 स्थानों में मापा जाता है);
- 0.2 डिग्री सेल्सियस (49 स्थानों में भी);
- 0 डिग्री सेल्सियस (1 स्थान पर। यह पानी बस जमने वाला था);
- 95 डिग्री सेल्सियस (एक स्थान पर, एक कारखाना है जो झील में अवैध रूप से बहुत गर्म पानी डंप करता है)।
- औसत तापमान: 1.1 डिग्री सेल्सियस;
- मानक विचलन: 1.5 डिग्री सेल्सियस;
- 95% -CI: (-0.8 ° C ...... + 3.0 ° C)।
इस विश्वास अंतराल के भीतर तापमान निश्चित रूप से इसके बाहर के लोगों की तुलना में अधिक संभावना नहीं है। इस झील में बहने वाले पानी का औसत तापमान 0 ° C से अधिक ठंडा नहीं हो सकता, अन्यथा यह पानी नहीं बल्कि बर्फ होगा। इस विश्वास अंतराल का एक हिस्सा (अर्थात्, -0.8 से 0 तक का खंड) वास्तव में 0% की संभावना है जिसमें सच्चे पैरामीटर शामिल हैं।
निष्कर्ष में: आत्मविश्वास अंतराल एक निरंतरवादी अवधारणा है, और इसलिए दोहराया नमूनों के विचार पर आधारित हैं। यदि कई शोधकर्ता इस झील से नमूने लेते हैं, और यदि वे सभी शोधकर्ता विश्वास अंतराल की गणना करेंगे, तो उन अंतरालों में से 95% में सही पैरामीटर होगा। लेकिन एक एकल आत्मविश्वास अंतराल के लिए यह कहना असंभव है कि यह कितना संभव है कि इसमें सही पैरामीटर है।