जनसंख्या और नमूने में क्या अंतर है?


38

जनसंख्या और नमूने में क्या अंतर है? हर एक के लिए क्या सामान्य चर और आँकड़े उपयोग किए जाते हैं, और वे एक दूसरे से कैसे संबंधित हैं?


जवाबों:


36

जनसंख्या अध्ययन के तहत संस्थाओं का समूह है। उदाहरण के लिए, पुरुषों की औसत ऊंचाई। यह एक काल्पनिक आबादी है क्योंकि इसमें सभी पुरुष शामिल हैं जो जीवित हैं, जीवित हैं और भविष्य में रहेंगे। मुझे यह उदाहरण पसंद है क्योंकि यह घर को इस बिंदु पर ले जाता है कि हम, विश्लेषकों के रूप में, उस आबादी को चुनते हैं जिसे हम अध्ययन करना चाहते हैं। आमतौर पर पूरी आबादी का सर्वेक्षण / माप करना असंभव है क्योंकि सभी सदस्य अवलोकनीय नहीं हैं (उदाहरण के लिए भविष्य में मौजूद पुरुष)। अगर पूरी आबादी को घेरना संभव है तो ऐसा करना अक्सर महंगा होता है और इसमें काफी समय लगेगा। ऊपर के उदाहरण में हमारे पास एक आबादी "पुरुष" और ब्याज का एक पैरामीटर है, उनकी ऊंचाई।

इसके बजाय, हम इस जनसंख्या का एक सबसेट ले सकते हैं जिसे एक नमूना कहा जाता है और इस नमूने का उपयोग अध्ययन के तहत आबादी के बारे में निष्कर्ष निकालने के लिए किया जाता है, कुछ शर्तों को देखते हुए। इस प्रकार हम जनसंख्या के एक नमूने में पुरुषों की औसत ऊंचाई को माप सकते हैं जिसे हम एक आंकड़ा कहते हैं और इसका उपयोग जनसंख्या में ब्याज के पैरामीटर के बारे में निष्कर्ष निकालने के लिए करते हैं। यह एक अनुमान है क्योंकि एक नमूने के आधार पर आबादी के बारे में निष्कर्ष निकालने में कुछ अनिश्चितता और अशुद्धि शामिल होगी। यह स्पष्ट होना चाहिए - हमारे नमूने में हमारी आबादी से कम सदस्य हैं इसलिए हमने कुछ जानकारी खो दी है।

एक नमूने का चयन करने के कई तरीके हैं और इस के अध्ययन को नमूना सिद्धांत कहा जाता है। आमतौर पर इस्तेमाल की जाने वाली विधि को सरल रैंडम सैंपलिंग (SRS) कहा जाता है। SRS में जनसंख्या के प्रत्येक सदस्य को नमूने में शामिल किए जाने की समान संभावना है, इसलिए "यादृच्छिक" शब्द। कई अन्य नमूने विधियां हैं जैसे स्तरीकृत नमूनाकरण, क्लस्टर नमूनाकरण, आदि, जिनके सभी फायदे और नुकसान हैं।

यह याद रखना महत्वपूर्ण है कि हम जिस नमूने को आबादी से खींचते हैं, वह बड़ी संख्या में संभावित नमूनों में से केवल एक है। यदि दस शोधकर्ता सभी एक ही आबादी का अध्ययन कर रहे थे, तो अपने स्वयं के नमूने खींच रहे थे, तो वे अलग-अलग उत्तर प्राप्त कर सकते थे। हमारे पहले के उदाहरण पर लौटते हुए, दस शोधकर्ताओं में से प्रत्येक पुरुषों की एक अलग मतलब ऊंचाई के साथ आ सकता है अर्थात प्रश्न में सांख्यिकीय (मतलब ऊंचाई) नमूना के नमूने के लिए भिन्न होता है - इसका एक वितरण होता है जिसे नमूना वितरण कहा जाता है। जनसंख्या पैरामीटर के हमारे अनुमान में अनिश्चितता को समझने के लिए हम इस वितरण का उपयोग कर सकते हैं।

नमूना माध्य का नमूना वितरण नमूना आकार द्वारा विभाजित नमूना मानक विचलन के बराबर मानक विचलन के साथ एक सामान्य वितरण के रूप में जाना जाता है। क्योंकि यह आसानी से नमूना के मानक विचलन के साथ भ्रमित हो सकता है यह नमूना वितरण मानक त्रुटि के मानक विचलन को कॉल करने के लिए अधिक सामान्य है ।


7
क्या यह जनसंख्या के रूप में "सभी पुरुषों का कभी" उपयोग नहीं है? मेरा मतलब है, यहां तक ​​कि आम सहमति नहीं है कि होमो सेपियन्स कितने पुराने हैं , या क्या होमो निएंडरथेलेंसिस एक अलग प्रजाति थी, अकेले चलो कि क्या पत्थर के उपकरण के पुरुष होमो हैबिलिस की गिनती "पुरुषों" के रूप में करते हैं। संभवतः भविष्य में भी यही समस्याएं हमारे सामने होंगी।
naught101

अंतिम पैराग्राफ में, मुझे लगता है कि हाथ का मामूली मामूली हिस्सा है, और इसे पढ़ना चाहिए ... " नमूना आकार के [वर्गमूल] द्वारा विभाजित नमूना मानक विचलन के बराबर " मानक त्रुटि के संदर्भ में ।
एंटोनी परेला

13

जनसंख्या मानों या व्यक्तियों का संपूर्ण समूह है, जिसमें आप रुचि रखते हैं। नमूना जनसंख्या का एक सबसेट है, और उन मूल्यों का समूह है जो आप वास्तव में अपने अनुमान में उपयोग करते हैं।

इसलिए, उदाहरण के लिए, यदि आप चीन के निवासियों की औसत ऊंचाई जानना चाहते हैं, तो वह है आपकी जनसंख्या, यानी चीन की जनसंख्या। बात यह है, यह एक बड़ी संख्या है, और आप वहां सभी के लिए डेटा प्राप्त नहीं कर पाएंगे। तो आप एक नमूना तैयार करते हैं, अर्थात, आप कुछ अवलोकन प्राप्त करते हैं, या चीन में कुछ लोगों की ऊंचाई (आबादी का एक नमूना, नमूना) और उसी के आधार पर अपना निष्कर्ष निकालते हैं।


अच्छा उत्तर। मुझे लगता है कि आपको "उस पर आधारित अपना अनुमान करना" से आगे बढ़ना चाहिए। यह मेरे सवाल का दूसरा हिस्सा है।
बाल्टीमार्क

mmm ... मुझे वास्तव में समझ में नहीं आया कि आपके लिए सामान्य चर और आँकड़े क्या हैं ... ओह, क्या आपका मतलब है जैसे आप z वितरण का उपयोग करते हैं यदि आपके पास जनसंख्या विचरण और टी-वितरण है यदि आपके पास केवल नमूना विचरण है। और नमूना आकार छोटा है? उन लाइनों के साथ कुछ?
विवि

मुझे जो मिल रहा था, वह मतलब था और मानक विचलन आबादी से जुड़े पैरामीटर हैं, लेकिन वे नमूना माध्य ((1 / N) * \ sum (x_i)) और नमूना मानक विचलन (1 / ( N-1)) * \ sum (x_i - x ^ बार) ^ 2)।
बाल्टीमार्क

8

अध्ययन के समूह में जनसंख्या सब कुछ है। उदाहरण के लिए, यदि आप Apple के शेयरों की कीमत का अध्ययन कर रहे हैं, तो यह ऐतिहासिक, वर्तमान और यहां तक ​​कि भविष्य के सभी शेयर की कीमतें हैं। या, यदि आप एक अंडा कारखाना चलाते हैं, तो यह कारखाने द्वारा बनाए गए सभी अंडे हैं।

आपको हमेशा सैंपल नहीं लेना है, और सांख्यिकीय परीक्षण करना है। यदि आपकी आबादी आपका तत्काल जीवित परिवार है, तो आपको नमूना लेने की आवश्यकता नहीं है, क्योंकि जनसंख्या छोटी है।

नमूनाकरण विभिन्न कारणों से लोकप्रिय है:

  • यह जनगणना की तुलना में सस्ता है (पूरी आबादी का नमूना लेना)
  • आपके पास भविष्य के डेटा तक पहुंच नहीं है, इसलिए अतीत का नमूना लेना चाहिए
  • आपको उन्हें परीक्षण करके कुछ वस्तुओं को नष्ट करना होगा, और उन सभी को नष्ट नहीं करना चाहिए (जैसे, अंडे)

2

जब हम "जनसंख्या" शब्द के बारे में सोचते हैं, तो हम आमतौर पर अपने शहर, क्षेत्र, राज्य या देश के लोगों और उनकी संबंधित विशेषताओं जैसे लिंग, आयु, वैवाहिक स्थिति, जातीय सदस्यता, धर्म और इसके आगे के बारे में सोचते हैं। आंकड़ों में "जनसंख्या" शब्द थोड़ा अलग अर्थ लेता है। आंकड़ों में "जनसंख्या" में एक परिभाषित समूह के सभी सदस्य शामिल हैं जो हम डेटा संचालित निर्णयों के लिए जानकारी का अध्ययन या संग्रह कर रहे हैं।

आबादी के एक हिस्से को एक नमूना कहा जाता है। यह आबादी का एक हिस्सा है, इसका एक टुकड़ा, इसका एक हिस्सा और इसकी सभी विशेषताएं हैं। एक नमूना एक वैज्ञानिक रूप से तैयार समूह है जो वास्तव में आबादी के समान विशेषताओं के पास है - अगर यह यादृच्छिक रूप से खींचा गया है (यह आपके लिए विश्वास करना कठिन हो सकता है, लेकिन यह सच है!)

बेतरतीब ढंग से तैयार नमूनों में दो विशेषताएं होनी चाहिए:

* प्रत्येक व्यक्ति को आपके नमूने के लिए चुने जाने का समान अवसर है; तथा,

* एक व्यक्ति का चयन दूसरे व्यक्ति के चयन से स्वतंत्र है।

यादृच्छिक नमूनों के बारे में महान बात यह है कि आप उस आबादी का सामान्यीकरण कर सकते हैं, जिसमें आप रुचि रखते हैं। इसलिए यदि आप अपने समुदाय में 500 घरों का नमूना लेते हैं, तो आप वहां रहने वाले 50,000 परिवारों को सामान्य कर सकते हैं। यदि आप 500 की 50,000 की कुछ जनसांख्यिकीय विशेषताओं से मेल खाते हैं, तो आप देखेंगे कि वे आश्चर्यजनक रूप से समान हैं।


2
यह मूल रूप से सही है, अगर ठीक से व्याख्या की गई है। मुझे चिंता है कि कुछ पाठकों को यह सोचकर गुमराह किया जा सकता है कि प्रतिस्थापन के साथ सरल यादृच्छिक नमूने (जो आपके द्वारा बताए गए यादृच्छिक नमूने के प्रकार हैं; अन्य प्रकार के हैं) जनसंख्या की सभी विशेषताओं को सही ढंग से पुन: पेश करते हैं। वास्तव में, वे शायद ही कभी करते हैं। यादृच्छिक नमूनाकरण की बात यह है कि नमूना की विशेषताओं और जनसंख्या की विशेषताओं के बीच (अपरिहार्य) अंतर को यादृच्छिक परीक्षण प्रक्रिया के लिए जिम्मेदार ठहराया जा सकता है।
whuber

0

जनसंख्या में डेटा के एक सेट से सभी तत्व शामिल हैं। एक नमूने में जनसंख्या से एक या अधिक अवलोकन होते हैं। बीओए, ए। (2012, 17)


2
जब "डेटा के सेट" के सभी तत्वों को आबादी माना जाता है, तो डेटासेट को जनसंख्या की जनगणना कहा जाता है । बहुत कम डेटासेट सेंसर हैं।
whuber
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.