बड़ी आबादी को मतदान करते समय आप नमूना आकार कैसे तय करते हैं?


15

ऑस्ट्रेलिया में वर्तमान में एक चुनाव हो रहा है और समझ में आता है कि मीडिया रोजाना नए राजनीतिक चुनाव परिणामों की रिपोर्ट करता है। 22 मिलियन के देश में जनसंख्या के कितने प्रतिशत के लिए सांख्यिकीय रूप से वैध परिणाम प्राप्त करने के लिए नमूना लेने की आवश्यकता होगी?

क्या यह संभव है कि बहुत बड़े नमूने का उपयोग करने से परिणाम प्रभावित हो सकते हैं, या सांख्यिकीय वैधता नमूना आकार के साथ एकरूपता बढ़ जाती है?

जवाबों:


13

नमूना आकार जनसंख्या के आकार पर बहुत निर्भर नहीं करता है, जो कई लोगों के लिए प्रति-सहज है।

अधिकांश पोलिंग कंपनियां अपने नमूनों में 400 या 1000 लोगों का उपयोग करती हैं।

इस के लिए एक कारण है:

४०० का एक नमूना आकार आपको २० (९ ५%) में से १ ९ +१-५% १ ९ बार विश्वास अंतराल देगा।

1000 का एक नमूना आकार आपको 20 में से +/- 3% 19 बार (95%) का आत्मविश्वास अंतराल देगा।

जब आप 50% वैसे भी एक अनुपात को माप रहे हैं।

यह कैलकुलेटर खराब नहीं है:

http://www.raosoft.com/samplesize.html


6
लेकिन ध्यान दें कि यह सब एक समरूप आबादी से नमूना लेने पर आधारित है। यदि आपके पास एक विषम आबादी है (उदाहरण के लिए अलग-अलग उप-समूहों के लिए अलग-अलग अनुपात, आबादी के दुर्लभ भागों का नमूना लेना), तो उस विचरण का अनुमान इतना विश्वसनीय नहीं है। जिन अनुमानों की आप वास्तव में यहाँ गणना कर रहे हैं, वह (मुझे लगता है) एक आबादी के लिए है जो आपके नमूने का प्रतिनिधित्व करता है। सवाल यह है: क्या यह आबादी वह है जिसमें आप वास्तव में रुचि रखते हैं?
प्रोबेबिलिसलॉजिक

9

ππएनNp

pNπ

CI=[pksd(p),  p+ksd(p)]
k

मो=*रों(पी)

रों(पी)पी=Σएक्समैं/एनएक्समैं=1मैं0

चूंकि, हमने मतदाताओं को यादृच्छिक रूप से सैंपल किया, इसलिए हम ऐसा मान सकते हैं एक्समैं

वीआर(पी)=वी(Σएक्समैंएन)=Σवी(एक्समैं)एन2=एनπ(1-π)एन2=π(1-π)एन
रों(पी)=π*(1-π)एन
πरों(पी)π=0.5
रों(पी)=0.5*0.5/एन=0.5/एन
एनएन

k=1.96N=1000

[p1.960.51000,  p+1.960.51000]=[p0.03,  p+0.03]
NNπ=50%

2

किसी भी सामान्यीकरण के रूप में, जब भी आप किसी आबादी में लोगों के कुछ अंशों का नमूना लेते हैं, तो आप एक अलग उत्तर प्राप्त करने जा रहे हैं यदि आप उसी संख्या को फिर से नमूना करते हैं (लेकिन संभवतः अलग-अलग लोग)।

इसलिए अगर आप यह जानना चाहते हैं कि ऑस्ट्रेलिया में कितने लोग हैं> = 30 साल पुराने हैं, और अगर सही अंश (भगवान ने हमें बताया) तो ठीक 0.4 हो गया, और अगर हम 100 लोगों से पूछें, तो औसत संख्या की हम उम्मीद कर सकते हैं वे कहते हैं कि> = 30 100 x 0.4 = 40 हैं, और उस संख्या का मानक विचलन +/- sqrt (100 * 0.4 * 0.6) = sqrt (24) ~ 4.9 या 4.9% (द्विपद वितरण) है।

चूंकि उस वर्गमूल में है, जब नमूना आकार 100 गुना बढ़ जाता है, मानक विचलन 10 गुना कम हो जाता है। तो सामान्य तौर पर, 10 के कारक द्वारा इस तरह की माप की अनिश्चितता को कम करने के लिए, आपको कई लोगों के रूप में 100 बार नमूना लेने की आवश्यकता होती है। इसलिए यदि आप 100 x 100 = 10000 लोगों से पूछते हैं, तो मानक विचलन एक प्रतिशत के रूप में 49 या, 0.49% तक नीचे चला जाएगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.