विचरण सीखना कठिन है।
यह कई मामलों में अच्छी तरह से विचरण का अनुमान लगाने के लिए (शायद आश्चर्यजनक रूप से) बड़ी संख्या में नमूने लेता है। नीचे, मैं एक iid सामान्य नमूने के "विहित" मामले के लिए विकास दिखाऊंगा।
मान लीजिए , मैं = 1 , ... , n रहे हैं स्वतंत्र एन ( μ , σ 2 ) यादृच्छिक परिवर्तनीय। हम विचरण के लिए 100 ( 1 - α ) % विश्वास अंतराल चाहते हैं जैसे कि अंतराल की चौड़ाई ρ s 2 है , अर्थात, चौड़ाई अनुमान बिंदु का 100 ρ % है। उदाहरण के लिए, यदि ρ = 1 / 2 , तो सीआई की चौड़ाई बिंदु अनुमान के आधे मूल्य, जैसे, यदि हैYii=1,…,nN(μ,σ2)100(1−α)%ρs2100ρ%ρ=1/2 , फिर CI कुछ ऐसा होगा ( 8 ,s2=10 , चौड़ाई 5. होने के साथ ही बिंदु अनुमान के आसपास विषमता पर भी ध्यान दें। ( s 2 विचरण के लिए निष्पक्ष अनुमानक है।)(8,13)s2
"" (बजाय, "एक") के लिए विश्वास अंतराल है
( n - 1 ) रों 2s2
जहां χ 2
(n−1)s2χ2(1−α/2)(n−1)≤σ2≤(n−1)s2χ2(α/2)(n−1),
है
βसाथ ची-वर्ग वितरण के quantile
n-1स्वतंत्रता की डिग्री। (यह तथ्य यह है कि से उत्पन्न होती है
(n-1)एस2/σ2। एक गाऊसी सेटिंग में एक निर्णायक मात्रा है)
χ2β(n−1)βn−1(n−1)s2/σ2
हम चौड़ाई को कम करना चाहते हैं ताकि
तो हम के लिए हल करने के लिए छोड़ दिया जाता है n ऐसा है कि
( n - 1 ) ( 1
L(n)=(n−1)s2χ2(α/2)(n−1)−(n−1)s2χ2(1−α/2)(n−1)<ρs2,
n(n−1)⎛⎝⎜1χ2(α/2)(n−1)−1χ2(1−α/2)(n−1)⎞⎠⎟<ρ.
99% विश्वास अंतराल के मामले में, हमें ρ = 1 के लिए और ρ = 0.1 के लिए n = 5321 मिलता है । यह अंतिम मामला एक अंतराल पैदा करता है जो ( अभी भी! ) विचरण के बिंदु अनुमान के रूप में 10% बड़ा है।n=65ρ=1n=5321ρ=0.1
यदि आपका चुना हुआ आत्मविश्वास का स्तर 99% से कम है, तो कम मूल्य के लिए समान चौड़ाई का अंतराल प्राप्त होगा । लेकिन, n अभी भी बड़ा हो सकता है जितना आपने अनुमान लगाया होगा।nn
नमूना आकार बनाम आनुपातिक चौड़ाई ρ का एक प्लॉट कुछ ऐसा दिखाता है जो लॉग-लॉग स्केल पर asymptotically रैखिक दिखता है; दूसरे शब्दों में, एक शक्ति-कानून - जैसे संबंध। हम इस शक्ति-कानून संबंध (गंभीर रूप से) की शक्ति का अनुमान लगा सकते हैंnρ
α^≈log0.1−log1log5321−log65=−log10log523165≈−0.525,
जो दुर्भाग्य से, निश्चित रूप से धीमा है!
यह गणना के बारे में जाने के लिए आपको यह महसूस करने के लिए "विहित" मामले की तरह है। आपके भूखंडों के आधार पर, आपका डेटा विशेष रूप से सामान्य नहीं दिखता है; विशेष रूप से, ध्यान देने योग्य तिरछा प्रतीत होता है।
लेकिन, इससे आपको एक बॉलपार्क विचार करना चाहिए कि क्या उम्मीद की जाए। ध्यान दें कि ऊपर दिए गए आपके दूसरे प्रश्न का उत्तर देने के लिए, पहले कुछ विश्वास स्तर को ठीक करना आवश्यक है, जिसे मैंने प्रदर्शन उद्देश्यों के लिए ऊपर के विकास में 99% पर सेट किया है।