यह क्यों दावा किया जाता है कि एक नमूना अक्सर एक जनगणना की तुलना में अधिक सटीक होता है?


13

नमूना लेने के दौरान, मैं निम्नलिखित दो कथनों को पूरा करता हूं:

1) नमूनाकरण त्रुटि ज्यादातर परिवर्तनशीलता की ओर ले जाती है, nonsampling त्रुटियां पूर्वाग्रह की ओर ले जाती हैं।

2) nonsampling त्रुटि के कारण, एक नमूना अक्सर CENSUS की तुलना में अधिक सटीक होता है।

मैं नहीं जानता कि इन दोनों कथनों को कैसे समझा जाए। इन दोनों कथनों को प्राप्त करने के लिए अंतर्निहित तर्क क्या है?


5
एक सच्ची जनगणना या एक प्रयास ?
कार्डिनल

जवाबों:


16

एक नमूना एक (प्रयास) जनगणना की तुलना में अधिक सटीक हो सकता है यदि व्यायाम की जनगणना होने का तथ्य गैर-नमूना त्रुटि से पूर्वाग्रह को बढ़ाता है। उदाहरण के लिए, यदि जनगणना गैर-प्रतिक्रिया (एक नमूना होने की संभावना कुछ कम) की वकालत करने वाला एक प्रतिकूल राजनीतिक अभियान उत्पन्न करता है, तो इसके बारे में आ सकता है। जब तक ऐसा नहीं होता है, मैं यह नहीं देख सकता कि एक जनगणना की तुलना में एक नमूना से कम बकवास त्रुटि की उम्मीद क्यों की जाएगी; और परिभाषा के अनुसार इसमें अधिक नमूना त्रुटि होगी। इसलिए काफी असामान्य परिस्थितियों के अलावा मैं कहूंगा कि एक जनगणना एक नमूने की तुलना में अधिक सटीक है।

Nonsampling त्रुटि के एक सामान्य स्रोत पर विचार करें - किसी विशेष सामाजिक जनसांख्यिकीय समूह द्वारा व्यवस्थित गैर-प्रतिक्रिया। यदि समूह X के लोग जनगणना से इंकार करने की संभावना रखते हैं, तो वे नमूने को अस्वीकार करने की संभावना रखते हैं। यहां तक ​​कि समूह एक्स के उन लोगों की प्रतिक्रियाओं को वजन करने के लिए पोस्टस्ट्रेटिफिकेशन के नमूने के साथ जो आप अपने सवालों के जवाब देने के लिए मना करते हैं , फिर भी आपको एक समस्या है क्योंकि वे एक्स के बहुत सेगमेंट हो सकते हैं जो प्रो-सर्वे हैं। इस समस्या के आसपास कोई वास्तविक तरीका नहीं है इसके अलावा आपके उपकरण और वितरण पद्धति के डिजाइन के साथ जितना संभव हो उतना सावधान रहें।

पारित होने में, यह एक संभव मुद्दे पर ध्यान आकर्षित करता है जो एक नमूना की तुलना में कम जनगणना का प्रयास कर सकता है। नमूने नियमित रूप से जनसंख्या को भारोत्तोलन करते हैं, जो उपरोक्त पैरा जैसे मुद्दों से पूर्वाग्रह की समस्याओं को कम करता है। एक जनगणना का प्रयास जो 100% रिटर्न नहीं देता है वह सिर्फ एक बड़ा नमूना है, और सिद्धांत रूप में उसी प्रसंस्करण के अधीन होना चाहिए; लेकिन क्योंकि इसे एक "जनगणना" के रूप में देखा जाता है (बजाय एक जनगणना के प्रयास के ) इसे उपेक्षित किया जा सकता है। ताकि उचित भारित नमूने की तुलना में जनगणना कम सटीक हो सके। लेकिन इस मामले में समस्या विश्लेषणात्मक प्रसंस्करण तकनीक (या चूक) है, न कि इसके लिए जनगणना का प्रयास किया जा रहा है।

कुशल एक और मामला है - जैसा कि मिशेल कहते हैं, एक अच्छी तरह से आयोजित नमूना एक जनगणना की तुलना में अधिक कुशल होगा, और इसमें व्यावहारिक उद्देश्यों के लिए पर्याप्त सटीकता हो सकती है।


1
+1 यह प्रश्न को समझने और इसे प्रेरित करने के लिए एक विचारशील और सूचनात्मक प्रयास को दर्शाता है।
whuber

मुझे लगता है कि एक नमूना और प्रतिक्रियाओं के बीच अंतर एक नमूने में प्रतिक्रियाओं को भार करने के लिए बस एक उच्च प्रवृत्ति से अधिक है। आखिरकार, वजन के आंकड़े कहीं से आने हैं - एक जनगणना, या उच्च-गुणवत्ता का नमूना।
जोनाथन

मैं वास्तव में एक नमूने में गैर-पक्षपात पूर्वाग्रह को कम करने की क्षमता पर जोर दूंगा। बहुत कम सेंसरस गैर-पक्षपाती पूर्वाग्रह के बाद प्रभावी ढंग से जाने की क्षमता रखते हैं - यहां तक ​​कि अमेरिकी जनगणना संघर्ष भी। शायद केवल वही जो इसे अच्छी तरह से कर सकते हैं वे कर्मचारी संतुष्टि सर्वेक्षण हैं। सैंपल किए गए सर्वेक्षण में गैर-जिम्मेदाराना के बाद जाना अधिक लागत प्रभावी है।
जोनाथन

एक जनगणना में, यह हो सकता है (होगा) प्रत्येक साक्षात्कार को गुणवत्ता नियंत्रण के लिए महंगा / ...! इसलिए, अक्सर जनगणना की तुलना में नमूने में डेटा की गुणवत्ता बेहतर होगी।
kjetil b halvorsen

5

मुझे लगता है कि व्यावहारिक परिस्थितियां हैं जहां एक नमूना अधिक सटीक हो सकता है। उदाहरण के लिए, हमने एक विकासशील देश के एक शहर में एक अध्ययन किया जिसमें बहुत से लोग अपंजीकृत स्थानों पर रहते हैं और लोग लगातार आते-जाते रहते हैं और जवाब देने में शर्माते हैं। वास्तव में जनगणना करने की कोशिश के लिए हरक्यूलिस प्रयास की आवश्यकता होती है, और हमारे संसाधनों को देखते हुए इसे कुछ महीनों के दौरान किया जाना चाहिए, जब लोग आते और जाते रहेंगे। एक नमूने के साथ, हम यह सुनिश्चित करने में अधिक समय बिता सकते हैं कि हम यथासंभव पूर्ण प्रतिक्रिया के करीब पहुंच गए - क्योंकि हम बता सकते हैं कि हम क्या कर रहे थे - और हम इसे बहुत कम समय सीमा पर कर सकते थे जिससे समस्या से छुटकारा मिल जाता। शहर में प्रवेश करने और छोड़ने के लोग।

इसलिए मुझे लगता है कि उत्तर इस बात पर निर्भर करता है कि आप क्या कर रहे हैं, और गैर-नमूना त्रुटि के विभिन्न स्रोतों के रसद पर।

वास्तव में, एक अन्य स्रोत यह था कि हमारा सर्वेक्षण जटिल था और हमें साक्षात्कारकर्ताओं को प्रशिक्षित करना था, और उस देश में पर्याप्त प्रशिक्षु साक्षात्कारकर्ताओं को ढूंढना और उनका वित्तपोषण करना बहुत कठिन होगा।


5

जब सर्वेक्षण के लिए मनुष्यों का नमूना लेते हैं, तो नमूने अक्सर दोनों नमूना त्रुटि (हम केवल अनुमान प्राप्त कर रहे हैं) और nonsampling त्रुटि से ग्रस्त होते हैं (जैसे कि लोग किसी के सर्वेक्षण का जवाब देने से इनकार कर रहे हैं, नमूना फ्रेम के लिए नमूना लेने की आवश्यकता नहीं है, क्योंकि व्यावहारिक विचार जैसे लागत, या नमूना आकर्षित करने के लिए जनसंख्या की सही पहचान करने में असमर्थता)। सही ढंग से किया गया, उच्च प्रतिक्रिया दरों के साथ, एक नमूना एक जनगणना की तुलना में अधिक कुशल है। लेकिन यह मान लेना गलत है कि किसी भी नमूने में निरर्थक त्रुटि नहीं है।


+1। आपके उत्तर के लिए धन्यवाद, मिशेल, और हमारे समुदाय में आपका स्वागत है!
whuber

1
हाय whuber, यह यहाँ होना अच्छा है। स्वागत के लिए धन्यवाद। :)
मिशेल

1
@ मिचेल थोड़ा सुधार करें। नमूनाकरण त्रुटि वह त्रुटि है जो संपूर्ण जनसंख्या का चयन नहीं करने के परिणामस्वरूप होती है - अर्थात, जनसंख्या विशेषताओं के नमूने का उपयोग करने के कारण त्रुटि। नॉन-सैंपलिंग एरर बाकी सब कुछ है, जिसमें नॉन-रेस्पॉन्स, पर्याप्त सैंपलिंग फ्रेम बनाने में विफलता, माप त्रुटियां, आदि शामिल हैं
ब्रेट

3

मुझे लगता है कि वे कुंजी पीटर एलिस के उत्तर में हैं: "प्रयास किया गया"। जब आप सही तरीके से सैंपलिंग करते हैं, तो आप गैर-प्रतिक्रिया के विवरण को पसीना करते हैं, स्ट्रैट का पता लगाते हैं और उन्हें खोजते हैं, आदि। जब आप एक जनगणना करने का निर्णय लेते हैं, तो उन मुद्दों को अनदेखा करना आसान होता है, क्योंकि आप "हर कोई" प्राप्त कर रहे हैं। समस्या यह है कि, आप शायद हर किसी से नहीं मिल रहे हैं, लेकिन आप इस बारे में नहीं सोच रहे हैं कि आप वास्तव में कौन नहीं हैं।

अत्यंत बड़े नमूनों के साथ सांख्यिकीय मुद्दे भी हैं (नमूना जनसंख्या का अनुपात)। मैं उन्हें समझने के लिए पर्याप्त परिष्कृत नहीं हूं, लेकिन कम से कम आपको विचरण गणना के साथ समस्याएं हैं। ( surveyएक सर्वेक्षण के बड़े उप-योगों में ऐसी चीजों के लिए आर के क्षतिपूर्ति जैसे पैकेज , और यही वह जगह है जिसके बारे में मैंने पहली बार सीखा था।)

एक माध्यमिक मुद्दे के रूप में, यदि गैर-नमूना त्रुटि में प्रक्रिया में विभिन्न चरणों में गुणवत्ता नियंत्रण के कारण मुद्दे शामिल हैं, तो अधिक डेटा (जनगणना) होने से गुणवत्ता नियंत्रण का स्तर जो आपके पास होगा उसी के साथ होना बहुत कठिन होगा। संसाधन) डेटा के एक छोटे सेट पर (नमूना)।

कल्पना कीजिए कि आपके पास वे संसाधन (वित्तीय और कार्मिक) थे जो अमेरिकी जनगणना ब्यूरो ने एक जनगणना के लिए उपयोग किए थे, लेकिन आप केवल 1,000 यादृच्छिक वयस्कों का सर्वेक्षण कर रहे थे। मुझे लगता है कि आपके पास बेहतर गुणवत्ता नियंत्रण और इसमें शामिल समस्याओं और डेटा का बेहतर विश्लेषण होगा।


2

मैंने सोचा था कि जनगणना की तुलना में सैंपलिंग (नहीं) अधिक सटीक हो सकती है क्योंकि वास्तव में एक घटक था जो एक नमूना बनाम एक जनगणना की प्रकृति के लिए जिम्मेदार है, और जिसे जनगणना के कारण के रूप में जिम्मेदार ठहराया जा सकता है जो संभवतः अधिक पूर्वाग्रह है (जाहिर है गैर-नमूनाकरण, परिभाषा के अनुसार): एक जनगणना में, जनसंख्या संख्या आम तौर पर अज्ञात है। गैर-प्रतिक्रिया पूर्वाग्रह के लिए कम करना या नियंत्रित करना ज्ञात आकार के नमूने के साथ ऐसा करने से अधिक कठिन है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.