जनसंख्या और नमूने में क्या अंतर है? हर एक के लिए क्या सामान्य चर और आँकड़े उपयोग किए जाते हैं, और वे एक दूसरे से कैसे संबंधित हैं?
जनसंख्या और नमूने में क्या अंतर है? हर एक के लिए क्या सामान्य चर और आँकड़े उपयोग किए जाते हैं, और वे एक दूसरे से कैसे संबंधित हैं?
जवाबों:
जनसंख्या अध्ययन के तहत संस्थाओं का समूह है। उदाहरण के लिए, पुरुषों की औसत ऊंचाई। यह एक काल्पनिक आबादी है क्योंकि इसमें सभी पुरुष शामिल हैं जो जीवित हैं, जीवित हैं और भविष्य में रहेंगे। मुझे यह उदाहरण पसंद है क्योंकि यह घर को इस बिंदु पर ले जाता है कि हम, विश्लेषकों के रूप में, उस आबादी को चुनते हैं जिसे हम अध्ययन करना चाहते हैं। आमतौर पर पूरी आबादी का सर्वेक्षण / माप करना असंभव है क्योंकि सभी सदस्य अवलोकनीय नहीं हैं (उदाहरण के लिए भविष्य में मौजूद पुरुष)। अगर पूरी आबादी को घेरना संभव है तो ऐसा करना अक्सर महंगा होता है और इसमें काफी समय लगेगा। ऊपर के उदाहरण में हमारे पास एक आबादी "पुरुष" और ब्याज का एक पैरामीटर है, उनकी ऊंचाई।
इसके बजाय, हम इस जनसंख्या का एक सबसेट ले सकते हैं जिसे एक नमूना कहा जाता है और इस नमूने का उपयोग अध्ययन के तहत आबादी के बारे में निष्कर्ष निकालने के लिए किया जाता है, कुछ शर्तों को देखते हुए। इस प्रकार हम जनसंख्या के एक नमूने में पुरुषों की औसत ऊंचाई को माप सकते हैं जिसे हम एक आंकड़ा कहते हैं और इसका उपयोग जनसंख्या में ब्याज के पैरामीटर के बारे में निष्कर्ष निकालने के लिए करते हैं। यह एक अनुमान है क्योंकि एक नमूने के आधार पर आबादी के बारे में निष्कर्ष निकालने में कुछ अनिश्चितता और अशुद्धि शामिल होगी। यह स्पष्ट होना चाहिए - हमारे नमूने में हमारी आबादी से कम सदस्य हैं इसलिए हमने कुछ जानकारी खो दी है।
एक नमूने का चयन करने के कई तरीके हैं और इस के अध्ययन को नमूना सिद्धांत कहा जाता है। आमतौर पर इस्तेमाल की जाने वाली विधि को सरल रैंडम सैंपलिंग (SRS) कहा जाता है। SRS में जनसंख्या के प्रत्येक सदस्य को नमूने में शामिल किए जाने की समान संभावना है, इसलिए "यादृच्छिक" शब्द। कई अन्य नमूने विधियां हैं जैसे स्तरीकृत नमूनाकरण, क्लस्टर नमूनाकरण, आदि, जिनके सभी फायदे और नुकसान हैं।
यह याद रखना महत्वपूर्ण है कि हम जिस नमूने को आबादी से खींचते हैं, वह बड़ी संख्या में संभावित नमूनों में से केवल एक है। यदि दस शोधकर्ता सभी एक ही आबादी का अध्ययन कर रहे थे, तो अपने स्वयं के नमूने खींच रहे थे, तो वे अलग-अलग उत्तर प्राप्त कर सकते थे। हमारे पहले के उदाहरण पर लौटते हुए, दस शोधकर्ताओं में से प्रत्येक पुरुषों की एक अलग मतलब ऊंचाई के साथ आ सकता है अर्थात प्रश्न में सांख्यिकीय (मतलब ऊंचाई) नमूना के नमूने के लिए भिन्न होता है - इसका एक वितरण होता है जिसे नमूना वितरण कहा जाता है। जनसंख्या पैरामीटर के हमारे अनुमान में अनिश्चितता को समझने के लिए हम इस वितरण का उपयोग कर सकते हैं।
नमूना माध्य का नमूना वितरण नमूना आकार द्वारा विभाजित नमूना मानक विचलन के बराबर मानक विचलन के साथ एक सामान्य वितरण के रूप में जाना जाता है। क्योंकि यह आसानी से नमूना के मानक विचलन के साथ भ्रमित हो सकता है यह नमूना वितरण मानक त्रुटि के मानक विचलन को कॉल करने के लिए अधिक सामान्य है ।
जनसंख्या मानों या व्यक्तियों का संपूर्ण समूह है, जिसमें आप रुचि रखते हैं। नमूना जनसंख्या का एक सबसेट है, और उन मूल्यों का समूह है जो आप वास्तव में अपने अनुमान में उपयोग करते हैं।
इसलिए, उदाहरण के लिए, यदि आप चीन के निवासियों की औसत ऊंचाई जानना चाहते हैं, तो वह है आपकी जनसंख्या, यानी चीन की जनसंख्या। बात यह है, यह एक बड़ी संख्या है, और आप वहां सभी के लिए डेटा प्राप्त नहीं कर पाएंगे। तो आप एक नमूना तैयार करते हैं, अर्थात, आप कुछ अवलोकन प्राप्त करते हैं, या चीन में कुछ लोगों की ऊंचाई (आबादी का एक नमूना, नमूना) और उसी के आधार पर अपना निष्कर्ष निकालते हैं।
अध्ययन के समूह में जनसंख्या सब कुछ है। उदाहरण के लिए, यदि आप Apple के शेयरों की कीमत का अध्ययन कर रहे हैं, तो यह ऐतिहासिक, वर्तमान और यहां तक कि भविष्य के सभी शेयर की कीमतें हैं। या, यदि आप एक अंडा कारखाना चलाते हैं, तो यह कारखाने द्वारा बनाए गए सभी अंडे हैं।
आपको हमेशा सैंपल नहीं लेना है, और सांख्यिकीय परीक्षण करना है। यदि आपकी आबादी आपका तत्काल जीवित परिवार है, तो आपको नमूना लेने की आवश्यकता नहीं है, क्योंकि जनसंख्या छोटी है।
नमूनाकरण विभिन्न कारणों से लोकप्रिय है:
जब हम "जनसंख्या" शब्द के बारे में सोचते हैं, तो हम आमतौर पर अपने शहर, क्षेत्र, राज्य या देश के लोगों और उनकी संबंधित विशेषताओं जैसे लिंग, आयु, वैवाहिक स्थिति, जातीय सदस्यता, धर्म और इसके आगे के बारे में सोचते हैं। आंकड़ों में "जनसंख्या" शब्द थोड़ा अलग अर्थ लेता है। आंकड़ों में "जनसंख्या" में एक परिभाषित समूह के सभी सदस्य शामिल हैं जो हम डेटा संचालित निर्णयों के लिए जानकारी का अध्ययन या संग्रह कर रहे हैं।
आबादी के एक हिस्से को एक नमूना कहा जाता है। यह आबादी का एक हिस्सा है, इसका एक टुकड़ा, इसका एक हिस्सा और इसकी सभी विशेषताएं हैं। एक नमूना एक वैज्ञानिक रूप से तैयार समूह है जो वास्तव में आबादी के समान विशेषताओं के पास है - अगर यह यादृच्छिक रूप से खींचा गया है (यह आपके लिए विश्वास करना कठिन हो सकता है, लेकिन यह सच है!)
बेतरतीब ढंग से तैयार नमूनों में दो विशेषताएं होनी चाहिए:
* प्रत्येक व्यक्ति को आपके नमूने के लिए चुने जाने का समान अवसर है; तथा,
* एक व्यक्ति का चयन दूसरे व्यक्ति के चयन से स्वतंत्र है।
यादृच्छिक नमूनों के बारे में महान बात यह है कि आप उस आबादी का सामान्यीकरण कर सकते हैं, जिसमें आप रुचि रखते हैं। इसलिए यदि आप अपने समुदाय में 500 घरों का नमूना लेते हैं, तो आप वहां रहने वाले 50,000 परिवारों को सामान्य कर सकते हैं। यदि आप 500 की 50,000 की कुछ जनसांख्यिकीय विशेषताओं से मेल खाते हैं, तो आप देखेंगे कि वे आश्चर्यजनक रूप से समान हैं।