1 के नमूने के आकार से जनसंख्या के बारे में हम क्या कह सकते हैं?


43

मैं सोच रहा हूँ कि हम क्या कह सकते हैं, अगर कुछ भी हो, जनसंख्या के बारे में, जब मेरे पास एक माप है, (1 का नमूना आकार)। जाहिर है, हम और माप लेना पसंद करेंगे, लेकिन हम उन्हें प्राप्त नहीं कर सकते।μy1

मुझे ऐसा लगता है कि चूंकि नमूना का मतलब है, , तुच्छ रूप से बराबर है , तो । हालाँकि, 1 के एक नमूने के आकार के साथ, नमूना विचलन अपरिभाषित है, और इस प्रकार एक अनुमानक के रूप में का उपयोग करने में हमारा विश्वास भी अपरिभाषित है, सही है? वहाँ किसी भी तरह से हमारे अनुमान को बाधित करने के लिए कोई रास्ता नहीं होगा ? y1[ ˉ y ]=[y1]=μ ˉ y μμy¯y1E[y¯]=E[y1]=μy¯μμ


हां, कुछ मान्यताओं के तहत पर एक विश्वास अंतराल का निर्माण किया जा सकता है। यदि कोई इसे पोस्ट नहीं करता है, तो मैं इसे नीचे ट्रैक करूंगा। μ
soakley

5
एक ही प्रश्न के एक अन्य संस्करण के लिए आँकड़े .stackexchange.com/questions/1807 देखें (एक नमूने का औसत उपलब्ध है, लेकिन इसका नमूना आकार नहीं है, इसलिए प्रभावी रूप से औसत अज्ञात नमूना वितरण से एकल अवलोकन है) और आँकड़े .stackexchange .com / प्रश्न / 20300 संबंधित चर्चा के लिए।
whuber

सामान्य स्थिति में इन अनुमानकों
user795305

जवाबों:


8

यहाँ इस सवाल पर एक नया लेख है, जो पोइसन मामले के लिए एक अच्छा दृष्टिकोण है:

एंडरसन। प्रति गोस्टा (2015)। एक कक्षा एक दृष्टिकोण का उपयोग कर एक Poisson मतलब की एक अनुमानित विश्वास अंतराल के निर्माण के लिए दृष्टिकोण। द अमेरिकन स्टेटिस्टिशियन , 69 (3), 160-164, डीओआई: 10.1080 / 00031305.2015.1056830


... दुर्भाग्य से एक paywall के पीछे।
टिम

@ समय: ऐसा है। फिर, एक एएसए सदस्यता बहुत महंगा नहीं है, और आपको द अमेरिकन स्टेटिस्टिशियन , जेएएसए और काफी कुछ अन्य पत्रिकाओं के लिए बहुत ही उचित मूल्य पर एक्सेस मिलता है, जिसे मैं व्यक्तिगत रूप से बहुत खुशी से अपनी जेब से भुगतान करता हूं। मुझे सच में लगता है कि आपको अपने पैसे की कीमत मिल जाएगी। YMMV, बिल्कुल।
एस। कोलासा - मोनिका

4
+1 लेकिन पॉइसन केस सामान्य मामले से मौलिक रूप से अलग है क्योंकि विचरण का मतलब समान होना है। Poisson परिणाम बहुत सीधा है जबकिसामान्य मामले के लिए परिणाम जवाबी सहज और रहस्यमय है। x±9.68|x|
अमीबा का कहना है कि मोनिका

@amoeba: काफी सही, लेकिन ओपी ने वितरण पर कोई प्रतिबंध नहीं बताया।
एस। कोलासा - मोनिका

यह इतना संक्षिप्त है कि यह एक टिप्पणी के रूप में बेहतर होगा। लेकिन चूंकि यह स्वीकृत उत्तर है, आप शायद इसे टिप्पणी में बदलना नहीं चाहेंगे। क्या आप शायद लेख के मुख्य बिंदुओं को संक्षेप में बता सकते हैं?
रिचर्ड हार्डी

42

यदि जनसंख्या सामान्य मानी जाती है, तो एक एकल अवलोकन पर आधारित 95% विश्वास अंतराल द्वारा दिया जाता हैx

x±9.68|x|

वॉल, बोवेन, और ट्वीडेई, द अमेरिकन स्टेटिस्टिशियन , मई 2001, वॉल्यूम द्वारा लेख "एन इम्प्रेसिव कॉन्फिडेंस इंटरवल इंटरवल फॉर द मीन विद सैम्पल वन एंड टू," पर चर्चा की गई है 55, नंबर 2 । ( pdf )


5
मैं बेवकूफ ध्वनि से नफरत करता हूं लेकिन .... निश्चित रूप से नहीं। यह इकाइयों पर निर्भर करता है और ठीक से व्यवहार नहीं करता है (ठीक से मेरा मतलब स्केलर गुणा ...)
एलेक टील

8
@ एलेक सिर्फ इसलिए कि एक प्रक्रिया माप की इकाइयों पर निर्भर करती है (अर्थात, यह अपरिवर्तनीय नहीं है) इसका मतलब यह नहीं है कि यह स्वचालित रूप से अमान्य है या खराब भी है। यह एक मान्य है: लेख पढ़ें और गणित करें। कई लोग यह स्वीकार करेंगे कि यह थोड़ा परेशान करने वाला है । और भी आश्चर्यजनक रूप से, आपको यह मानने की ज़रूरत नहीं है कि अंतर्निहित वितरण सामान्य है: एक समान परिणाम किसी भी असमान वितरण के लिए होता है (लेकिन 9.68 को लगभग 19 या तो बढ़ाना पड़ता है): लिंक देखें जो मैंने इस पर टिप्पणी में प्रदान किया है सवाल।
whuber

4
पत्रिका के एक बाद के अंक में संपादक के तीन पत्र थे, जिनमें से एक में इकाइयों के बारे में एलेक टील की बात सामने आई। वॉल से उत्तर यह कहता है: "आत्मविश्वास अंतराल समान नहीं है (यानी, इसकी कवरेज संभावना के अनुपात पर निर्भर करती है _ ...)" बाद में वह "आत्मविश्वास अंतराल एक महत्वपूर्ण मात्रा पर आधारित नहीं है ..." यह एक असामान्य दृष्टिकोण और परिणाम है, इसमें कोई संदेह नहीं है! |μ|σ
भिगोएँ

5
बस थोड़ा सा काम बचाने के लिए: द अमेरिकन स्टेटिस्टिशियन , वॉल्यूम में एडिटर और रिप्लाई @soakley के नोट्स के अक्षर दिखाई दिए 56, नहीं। 1 (2002)
एस। कोलासा -

3
ऐसा लगता है कि आत्मविश्वास अंतराल को संभावना के साथ कवर किया जा रहा है जब लेकिन बहुत अधिक संभावना के साथ अन्यथा। यदि तो स्पष्ट रूप से संभावना क्योंकि आत्मविश्वास अंतराल हमेशा होते हैं । 95%σ|μ|>0μ=0100%0
हेनरी

28

ज़रूर है। बायेसियन प्रतिमान का उपयोग करें । संभावना है कि आप कम से कम कर रहे हैं कुछ क्या करने के विचार उदाहरण के लिए, कि यह शारीरिक रूप से नकारात्मक नहीं हो सकता है, या यह स्पष्ट रूप से 100 से अधिक (शायद आप अपने स्थानीय उच्च विद्यालय फुटबॉल टीम के सदस्यों की ऊंचाई माप रहे हैं नहीं किया जा सकता है कि - संभवतः हो सकता है पैरों में)। उस पर एक पूर्व रखें, इसे अपने अकेले अवलोकन के साथ अपडेट करें, और आपके पास एक शानदार पोस्टीरियर है।μ


18
(+1) एक अवलोकन पूर्व से अभिभूत होगा, इसलिए यह प्रतीत होगा कि आप जो पीछे से निकलते हैं वह आपके द्वारा पूर्व में रखे गए से अधिक नहीं होगा।
whuber

क्या होगा अगर हम इस तरह की संभावना के साथ संयुक्त है कि मनहूस द्वारा निहित की तरह? x±9.68|x|
सिमोन कुआंग

@SimonKuang: एक वैचारिक समस्या यह है कि हम केवल उपयोग कर सकते हैंअंतराल के बाद हमने को देखा है , इसलिए यह पूर्व में प्रवेश नहीं कर सकता है । x±9.68|x|x
एस। कोलासा - मोनिका

@StephanKolassa नहीं, यह अंतराल (और संबंधित वितरण) संभावना बनाता है। हमारी प्राथमिकता अलग है।
साइमन कुआंग

@SimonKuang: हाँ, आप सही हैं, मेरी गलती है। दुर्भाग्य से, मेरे पास इस समय इस समय से गुजरने का समय नहीं है, लेकिन यदि आप ऐसा करते हैं, तो कृपया जो आप पाते हैं उसे पोस्ट करें!
एस। कोलासा - मोनिका

14

यह बताने के लिए एक छोटा सिमुलेशन अभ्यास कि क्या @soakley द्वारा किया गया उत्तर काम करता है:

# Set the number of trials, M
M=10^6
# Set the true mean for each trial
mu=rep(0,M)
# Set the true standard deviation for each trial
sd=rep(1,M)
# Set counter to zero
count=0
for(i in 1:M){
 # Control the random number generation so that the experiment is replicable 
 set.seed(i)
 # Generate one draw of a normal random variable with a given mean and standard deviation
 x=rnorm(n=1,mean=mu[i],sd=sd[i])
 # Estimate the lower confidence bound for the population mean
 lower=x-9.68*abs(x)
 # Estimate the upper confidence bound for the population mean
 upper=x+9.68*abs(x)
 # If the true mean is within the confidence interval, count it in
 if( (lower<mu[i]) && (mu[i]<upper) ) count=count+1
}
# Obtain the percentage of cases when the true mean is within the confidence interval
count_pct=count/M
# Print the result
print(count_pct)
[1] 1

एक लाख यादृच्छिक परीक्षणों में से, विश्वास अंतराल में एक लाख गुना वास्तविक अर्थ शामिल है, अर्थात् , हमेशा । ऐसा तब नहीं होना चाहिए जब विश्वास अंतराल 95% विश्वास अंतराल था।

तो सूत्र काम नहीं करता है ... या क्या मैंने एक कोडिंग गलती की है?

संपादित करें: एक ही अनुभवजन्य परिणाम ; हालाँकि, यह है - इस प्रकार 95% विश्वास अंतराल के करीब।(μ,σ)=(1000,1)
0.9500970.95(μ,σ)=(1000,1000)


2
वास्तव में, 0 के बराबर नहीं है, यह उपयोगी है (और पहली जगह में कोड प्रदान करने के लिए +1!)। मेरा सिर्फ इतना मतलब था कि , यह एक पूर्वगामी निष्कर्ष है कि 0 हमेशा कैप्चर किया जाएगा। μμ=0
वोल्फगैंग

2
(@ वोल्फगैंग) यह आत्मविश्वास के अंतराल का परीक्षण करने का तरीका नहीं है। परिभाषा की आवश्यकता नहीं है कि Alpha -level CI हर मामले में का मतलब कवर करता है : इसके लिए केवल यह आवश्यक है कि (a) कम से कम हर मामले में इतना कवरेज हो और (b) यह उस कवरेज का अनुमान लगाता हो कुछ मामलों में। इस प्रकार, आपके दृष्टिकोण को मान्य और आश्वस्त करने के लिए आपको बड़ी संख्या में संभावनाओं की खोज करनी होगी। प्रयास करें1 - αα1αsim <- function(rho, n.iter=1e5, sigma=1, psi=9.68) { mu <- runif(n.iter, 0, sigma) * rho; x <- rnorm(n.iter, mu, sigma); mean(p <- abs(x - mu) <= psi * abs(x)) }; sim(1.75)
whuber

2
मैं समझता हूं कि आप जिस बिंदु को बनाने की कोशिश कर रहे हैं, लेकिन मैं इस कथन से पूरी तरह असहमत हूं कि "यह विश्वास अंतराल का परीक्षण करने का तरीका नहीं है"। CI की परिभाषा / निर्माण में, पैरामीटर एक निश्चित स्थिर है। आपके सिमुलेशन में, बदलता रहता है। फिक्स्ड , यदि विधि वास्तव में 95% सीआई देती है, तो उसे 95% मामलों में को कवर करना चाहिए । यह नहीं है इसके अलावा, यहां तक ​​कि आपके निर्माण के साथ, 1 के करीब एक कवरेज देता है (निश्चित रूप से, अब हम फिर से करीब हो रहे हैं 0 पर तय किया जा रहा है)। μ μ μμμμsim(0.1)μ
वोल्फगैंग

2
@ वोल्फगैंग ने कागज़ द्वारा इस्तेमाल की गई परिभाषा की जाँच करें, यह है: , यानी संभावना कि है अंतराल में कम से कम 0.95 है। μP(Xζ|X|μX+ζ|X|)1αμ
टिम

2
फिर से, एक स्थिर है। इसलिए, साथ अनुकरण करना पूरी तरह से ठीक है । बेशक, फिर कवरेज 1 होना चाहिए। विधि एक CI प्रदान करती है जिसमें कम से कम 95% कवरेज होता है और उदाहरण दिखाता है (चाहे सिमुलेशन द्वारा या तर्क के माध्यम से) कि कुछ स्थितियों में, कवरेज 100% तक हो सकती है। तो, यह 95% सीआई नहीं है। यह अभी भी बहुत कम जानकारी से किसी तरह का निष्कर्ष निकालने के लिए एक बहुत ही चतुर तरीका है। μ = 0μμ=0
वोल्फगैंग

0

एडेलमैन देखें, डी (1990) 'एक नमूना आकार के आधार पर एक अज्ञात अनिमॉडल वितरण के केंद्र के लिए एक आत्मविश्वास अंतराल' अमेरिकी सांख्यिकीविद्, वॉल्यूम 44, संख्या 4। अनुच्छेद सामान्य और गैरपारंपरिक मामलों को कवर करता है।


3
Stats.SE में आपका स्वागत है। क्या आप उस पुस्तक के मुख्य बिंदुओं को शामिल करने के लिए, इसका विस्तार करने के लिए उत्तर दे सकते हैं? यह मूल पोस्टर और इस साइट में खोज करने वाले अन्य लोगों के लिए अधिक उपयोगी होगा। वैसे, टूर लेने का अवसर लें , अगर आपने इसे पहले से नहीं किया है। भी कुछ युक्तियों के जवाब कैसे , पर मदद स्वरूपण और नीचे का उपयोग कर समीकरण लिखने पर लेटेक्स / MathJax
एर्टिसेम - मोनिका

हमारी साइट पर आपका स्वागत है, डेविड। उस लेख के लेखक के रूप में आपका योगदान (जो मुझे लगता है कि यहां कई सूत्र में उद्धृत किया गया है), बहुत सराहना की जाती है, इसलिए इस उत्तर में आप जो भी परिप्रेक्ष्य या टिप्पणी प्रदान कर सकते हैं, वह सबसे स्वागत योग्य है।
व्हिबर
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.