ऐसा लगता है कि आप एक बहुत ही सरल नमूने के मॉडल की कल्पना कर रहे हैं।
नमूने के लिए सबसे सरल मॉडल को उपयुक्त सरल यादृच्छिक नमूनाकरण कहा जाता है । आप जनसंख्या का एक सबसेट (जैसे यादृच्छिक पर फोन नंबर डायल करके) का चयन करें और जो भी वे मतदान कर रहे हैं के बारे में जवाब पूछें। यदि 487 क्लिंटन कहते हैं, 463 ट्रम्प कहते हैं, और शेष आपको कुछ निराला जवाब देते हैं, तो मतदान फर्म रिपोर्ट करेगी कि 49% मतदाता क्लिंटन पसंद करते हैं, जबकि 46% ट्रम्प पसंद करते हैं। हालाँकि, पोलिंग फर्म इससे कहीं अधिक काम करती हैं। एक साधारण यादृच्छिक नमूना प्रत्येक डेटा बिंदु को समान वजन देता है। हालांकि, मान लीजिए कि आपके नमूने में - संयोग से - 600 पुरुष और 400 महिलाएं हैं, जो स्पष्ट रूप से समग्र रूप से जनसंख्या का प्रतिनिधि नहीं है। यदि एक समूह के रूप में पुरुष एक तरह से दुबले होते हैं, जबकि महिलाएं दूसरे को झुकाती हैं, तो यह आपके परिणाम को पूर्वाग्रहित करेगा। हालांकि, चूंकि हमारे पास बहुत अच्छे जनसांख्यिकीय आँकड़े हैं, आप वजन कर सकते हैं *महिलाओं की प्रतिक्रियाओं को थोड़ा अधिक और पुरुषों को थोड़ा कम करके प्रतिक्रियाएं, ताकि भारित प्रतिक्रिया जनसंख्या का बेहतर प्रतिनिधित्व करती है। पोलिंग संगठनों में अधिक जटिल वजन वाले मॉडल होते हैं जो एक गैर-प्रतिनिधि नमूना बना सकते हैं जो एक अधिक प्रतिनिधि के समान होता है।
सैंपल रिस्पॉन्स को वेट करने का आइडिया बहुत फर्म स्टैटिस्टिकल ग्राउंड पर है, लेकिन वेट को बढ़ाने में कौन-कौन से फैक्टर्स हैं, इसे चुनने में थोड़ी सहूलियत है। अधिकांश प्रदूषक लिंग, आयु और नस्ल जैसे जनसांख्यिकीय कारकों के आधार पर वजन घटाते हैं। इसे देखते हुए, आप सोच सकते हैं कि पार्टी की पहचान (डेमोक्रेटिक, रिपब्लिकन, आदि) को भी शामिल किया जाना चाहिए, लेकिन यह पता चला है कि अधिकांश मतदान फर्म अपने भार में इसका उपयोग नहीं करते हैं: पार्टी (स्व)-पहचान में मतदाता की पसंद के साथ छेड़छाड़ की जाती है। एक तरह से जो इसे कम उपयोगी बनाता है।
कई मतदान संगठनों ने भी "संभावित मतदाताओं" के बीच अपने परिणामों की रिपोर्ट की। इनमें, उत्तरदाताओं को या तो चयनित किया जाता है या संभावना के आधार पर भारित किया जाता है कि वे वास्तव में चुनावों में बदल जाएंगे। यह मॉडल निस्संदेह डेटा-संचालित है, लेकिन कुछ लचीलेपन के लिए कारकों की सटीक पसंद अनुमति देता है। उदाहरण के लिए, उम्मीदवार और मतदाता की दौड़ (या लिंग) के बीच बातचीत भी 2008 या 2016 तक समझदार नहीं थी, लेकिन मुझे संदेह है कि उनके पास अब कुछ पूर्वानुमानित शक्ति है।
सिद्धांत रूप में, आप सभी प्रकार की चीजों को शामिल कर सकते हैं जैसे कि भार कारक: संगीतमय वरीयता, आंखों का रंग, आदि। हालांकि, जनसांख्यिकीय कारक वजन घटाने के कारकों के लिए लोकप्रिय विकल्प हैं:
- जाहिर है, वे मतदाता व्यवहार के साथ अच्छी तरह से संबंध रखते हैं। जाहिर है, कोई ऐसा लोहा-कानून नहीं है जो 'गोरे' लोगों को दुबले-पतले रिपब्लिकन बनने के लिए मजबूर करता हो, लेकिन पिछले पचास सालों में वे इसके लिए झुक गए हैं।
- जनसंख्या मूल्य अच्छी तरह से ज्ञात हैं (जैसे, जनगणना या महत्वपूर्ण रिकॉर्ड से)
हालांकि, प्रदूषक भी वही खबर देखते हैं जो हर कोई करता है, और यदि आवश्यक हो तो वज़निंग चर को समायोजित कर सकते हैं।
कुछ "ठगने वाले कारक" भी हैं जो कभी-कभी चुनाव परिणामों को समझाने के लिए लगाए जाते हैं। उदाहरण के लिए, उत्तरदाता कभी-कभी "सामाजिक रूप से अवांछनीय" उत्तर देने के लिए अनिच्छुक होते हैं। ब्राडली प्रभाव मानती है कि सफेद मतदाताओं कभी कभी एक अल्पसंख्यक के खिलाफ चल सफेद उम्मीदवारों के लिए उनके समर्थन downplay जातिवाद प्रकट होने से बचना। इसका नाम एक अफ्रीकी-अमेरिकी जुबेरेटोरियल उम्मीदवार टॉम ब्रैडली के नाम पर रखा गया है, जो चुनावों में आराम से नेतृत्व करने के बावजूद चुनाव हार गए।
अंत में, आप पूरी तरह से सही हैं कि किसी की राय पूछने का बहुत कार्य इसे बदल सकता है। मतदान फर्म अपने प्रश्नों को तटस्थ तरीके से लिखने का प्रयास करती हैं। संभावित प्रतिक्रियाओं के क्रम के मुद्दों से बचने के लिए, उम्मीदवारों के नाम यादृच्छिक क्रम में सूचीबद्ध किए जा सकते हैं। एक प्रश्न के कई संस्करणों को कभी-कभी एक-दूसरे के खिलाफ भी परीक्षण किया जाता है। इस प्रभाव का इस्तेमाल एक धक्का चुनाव में नापाक अंत के लिए भी किया जा सकता है , जहां साक्षात्कारकर्ता वास्तव में प्रतिक्रियाएं इकट्ठा करने में दिलचस्पी नहीं रखते हैं, लेकिन उन्हें प्रभावित करने में। उदाहरण के लिए, एक पुश पोल पूछ सकता है कि "क्या आप [कैंडिडेट ए] को वोट देंगे, भले ही यह सूचित किया गया हो कि वह बाल मोलेस्टर था?"।
* आप अपने नमूने के लिए स्पष्ट लक्ष्य भी निर्धारित कर सकते हैं, जैसे ५०० पुरुष और ५०० महिलाएँ। इसे
स्तरीकृत नमूनाकरण कहा जाता
है - जनसंख्या को अलग-अलग समूहों में विभाजित किया जाता है, और प्रत्येक समूह को फिर यादृच्छिक रूप से नमूना किया जाता है। व्यवहार में, यह चुनावों के लिए बहुत बार नहीं किया जाता है, क्योंकि आपको बहुत सारे संपूर्ण समूहों (जैसे कि शहरी टेक्सास में 18-24 के बीच कॉलेज-शिक्षित पुरुष) में स्तरीकरण करना होगा।