मैं आँकड़ों को सीखने की कोशिश कर रहा हूँ क्योंकि मुझे लगता है कि यह इतना प्रचलित है कि यह मुझे कुछ चीजें सीखने से रोकता है अगर मैं इसे ठीक से नहीं समझता। नमूना साधनों के नमूने वितरण की इस धारणा को समझने में मुझे परेशानी हो रही है। मैं समझ नहीं पा रहा हूं कि कुछ किताबों और साइटों ने इसे कैसे समझाया है। मुझे लगता है कि मेरी समझ है लेकिन अगर सही है तो मैं अनिश्चित हूं। नीचे इसे समझने का मेरा प्रयास है।
जब हम सामान्य वितरण पर कुछ घटना के बारे में बात करते हैं, तो यह आबादी के संबंध में आम तौर पर (हमेशा नहीं) होता है।
हम कुछ आबादी के बारे में कुछ सामान की भविष्यवाणी करने के लिए हीनतापूर्ण आंकड़ों का उपयोग करना चाहते हैं, लेकिन सभी डेटा नहीं है। हम यादृच्छिक नमूने का उपयोग करते हैं और आकार n के प्रत्येक नमूने का चयन करने की संभावना के समान है।
इसलिए हम बहुत सारे नमूने लेते हैं, 100 बताते हैं और फिर उन नमूनों के साधनों का वितरण केंद्रीय सीमा प्रमेय के अनुसार लगभग सामान्य होगा। नमूना साधन का मतलब जनसंख्या का मतलब लगभग होगा।
अब जो मुझे समझ नहीं आ रहा है वह बहुत बार आप "100 लोगों का एक नमूना ..." देखते हैं, क्या हमें मतलब की आबादी का अनुमान लगाने के लिए 100 लोगों के 10 या 100 के नमूने की आवश्यकता नहीं होगी? या क्या यह मामला है कि हम एक ऐसा नमूना ले सकते हैं जो पर्याप्त बड़ा हो, 1000 कहे और फिर यह कहे कि क्या इसका मतलब आबादी का मतलब होगा? या क्या हम 1000 लोगों का एक नमूना लेते हैं और फिर उस मूल 1000 लोगों में से प्रत्येक नमूने में 100 लोगों के 100 यादृच्छिक नमूने लेते हैं और फिर हमारे सन्निकटन के रूप में उपयोग करते हैं?
क्या माध्य (लगभग) हमेशा काम करने के लिए एक बड़ा पर्याप्त नमूना लिया जाता है? क्या काम करने के लिए जनसंख्या भी सामान्य होनी चाहिए?