मुझे लगता है कि वे कुंजी पीटर एलिस के उत्तर में हैं: "प्रयास किया गया"। जब आप सही तरीके से सैंपलिंग करते हैं, तो आप गैर-प्रतिक्रिया के विवरण को पसीना करते हैं, स्ट्रैट का पता लगाते हैं और उन्हें खोजते हैं, आदि। जब आप एक जनगणना करने का निर्णय लेते हैं, तो उन मुद्दों को अनदेखा करना आसान होता है, क्योंकि आप "हर कोई" प्राप्त कर रहे हैं। समस्या यह है कि, आप शायद हर किसी से नहीं मिल रहे हैं, लेकिन आप इस बारे में नहीं सोच रहे हैं कि आप वास्तव में कौन नहीं हैं।
अत्यंत बड़े नमूनों के साथ सांख्यिकीय मुद्दे भी हैं (नमूना जनसंख्या का अनुपात)। मैं उन्हें समझने के लिए पर्याप्त परिष्कृत नहीं हूं, लेकिन कम से कम आपको विचरण गणना के साथ समस्याएं हैं। ( survey
एक सर्वेक्षण के बड़े उप-योगों में ऐसी चीजों के लिए आर के क्षतिपूर्ति जैसे पैकेज , और यही वह जगह है जिसके बारे में मैंने पहली बार सीखा था।)
एक माध्यमिक मुद्दे के रूप में, यदि गैर-नमूना त्रुटि में प्रक्रिया में विभिन्न चरणों में गुणवत्ता नियंत्रण के कारण मुद्दे शामिल हैं, तो अधिक डेटा (जनगणना) होने से गुणवत्ता नियंत्रण का स्तर जो आपके पास होगा उसी के साथ होना बहुत कठिन होगा। संसाधन) डेटा के एक छोटे सेट पर (नमूना)।
कल्पना कीजिए कि आपके पास वे संसाधन (वित्तीय और कार्मिक) थे जो अमेरिकी जनगणना ब्यूरो ने एक जनगणना के लिए उपयोग किए थे, लेकिन आप केवल 1,000 यादृच्छिक वयस्कों का सर्वेक्षण कर रहे थे। मुझे लगता है कि आपके पास बेहतर गुणवत्ता नियंत्रण और इसमें शामिल समस्याओं और डेटा का बेहतर विश्लेषण होगा।