आप यह नहीं कहते कि अन्य सांख्यिकी पुस्तक क्या है, लेकिन मुझे लगता है कि यह परिमित जनसंख्या के नमूने के बारे में एक पुस्तक (या खंड) है ।
जब आप यादृच्छिक चर का नमूना लेते हैं, अर्थात जब आप एक सेट यादृच्छिक चर के पर विचार करते हैं
, तो आप जानते हैं कि यदि वे स्वतंत्र हैं, , और विशेष रूप से और में सभी , के लिए , फिर:
जहाँ दूसरा है केंद्रीय क्षण। एन च ( एक्स 1 , ... , एक्स एन ) = च ( एक्स 1 ) ⋯ च ( एक्स एन ) ई ( एक्स मैं ) = μ वार ( एक्स मैं ) = σ 2 मैं ¯ एक्स = Σ मैं एक्स मैंX1,…,Xnnf(x1,…,xn)=f(x1)⋯f(xn)E(Xi)=μVar(Xi)=σ2i σ2
X¯¯¯¯=∑iXin,E(X¯¯¯¯)=μ,Var(X¯¯¯¯)=σ2n
σ2
एक परिमित जनसंख्या का नमूना लेना कुछ अलग है। यदि जनसंख्या आकार , तो बिना प्रतिस्थापन के नमूने में संभव नमूने के आकार और वे परिवर्तनीय हैं:
उदाहरण के लिए, यदि और , तो नमूना स्थान
और नमूने हैं:
( एनN sinp(si)=1(Nn)sin N=5n=3{s1,…,s10} s 1 ={1,2,3}, s 2 ={1,2,4}, s 3 ={1,2,5}, s 4 ={1,3,4},
p(si)=1(Nn)∀i=1,…,(Nn)
N=5n=3{s1,…,s10}s1={1,2,3},s2={1,2,4},s3={1,2,5},s4={1,3,4},s5={1,3,5},s6={1,4,5},s7={2,3,4},s8={2,3,5},s9={2,4,5},s10={3,4,5}
यदि आप प्रत्येक व्यक्ति के होने की संख्या की गणना करते हैं, तो आप देख सकते हैं कि वे छह हैं, अर्थात प्रत्येक व्यक्ति के पास चुने जाने का एक समान चांस है (6/10)। तो प्रत्येक दूसरी परिभाषा के अनुसार एक यादृच्छिक नमूना है। मोटे तौर पर, यह एक बेतरतीब नमूना नहीं है क्योंकि व्यक्ति यादृच्छिक चर नहीं हैं: आप लगातार नमूने के माध्यम से अनुमान लगा सकते हैं , लेकिन कभी भी इसका सही मूल्य नहीं जान पाएंगे, लेकिन आप सटीक जनसंख्या का मतलब जान
सकते हैं यदि (let मुझे दोहराएं: लगभग।)
siE[X]n=N1
चलो कुछ polulation मतलब (माध्य ऊंचाई, मतलब आय, ...) हो। जब
आप यादृच्छिक चर नमूने की तरह अनुमान लगा सकते हैं :
लेकिन नमूना माध्य विचरण अलग है:
जहां जनसंख्या अर्ध-विचरण है:
। फैक्टर को " परिमित जनसंख्या सुधार कारक " कहा जाता है ।μn<Nμ
y¯¯¯s=∑i=1nyi,E(y¯¯¯s)=μ
Var(y¯¯¯s)=σ~2n(1−nN)
σ~2∑Ni=1(yi−y¯¯¯)2N−1(1−n/N)
यह एक त्वरित उदाहरण है कि कैसे (रैंडम वैरिएबल) iid रैंडम सैंपल और (परिमित जनसंख्या) रैंडम सैंपल अलग हो सकते हैं। सांख्यिकीय निष्कर्ष मुख्य रूप से यादृच्छिक चर नमूनाकरण के बारे में है, नमूना सिद्धांत परिमित जनसंख्या नमूनाकरण के बारे में है।
1 आप प्रकाश बल्ब का निर्माण कर रहे हैं और उनके औसत जीवन काल को जानना चाहते हैं। आपकी "जनसंख्या" सिर्फ एक सैद्धांतिक या आभासी एक है, कम से कम यदि आप प्रकाश बल्ब का निर्माण करते हैं। इसलिए आपको एक डाटा जनरेशन प्रोसेस को मॉडल करना होगाऔर एक (यादृच्छिक चर) नमूने के रूप में प्रकाश बल्ब का एक सेट intepret। अब यह कहें कि आप 1000 प्रकाश बल्बों का एक बॉक्स पाते हैं और उनके औसत जीवन काल को जानना चाहते हैं। आप प्रकाश बल्बों का एक छोटा सा सेट (एक परिमित जनसंख्या नमूना) चुन सकते हैं, लेकिन आप उन सभी का चयन कर सकते हैं। यदि आप एक छोटा सा नमूना चुनते हैं, तो यह प्रकाश बल्बों को यादृच्छिक चर में परिवर्तित नहीं करता है: यादृच्छिक चर आपके द्वारा उत्पन्न होता है, क्योंकि "ऑल" और "एक छोटा सेट" के बीच का चुनाव आप पर निर्भर है। हालांकि, जब एक परिमित आबादी बहुत बड़ी है (अपने देश की आबादी कहें), जब "सभी" चुनना व्यवहार्य नहीं है, तो दूसरी स्थिति पहले वाले के रूप में बेहतर रूप से नियंत्रित की जाती है।