एक चुनाव में, हम यह कैसे निश्चित कर सकते हैं कि एक उम्मीदवार विजेता होगा?


14

एक आम चुनाव था जहां मैं कल रहता हूं और टेलीविजन नेटवर्क ने सभी मतपत्रों को खोलने से बहुत पहले विजेताओं को कॉल करना शुरू कर दिया।

वे सभी खातों पर सही निकले, और मुझे वास्तव में आश्चर्य नहीं हुआ कि उन्होंने क्या किया। मुझे पता है कि आंकड़े बिल्कुल व्यवहार्य हैं। फिर भी, मैं उत्सुक हूं। मान लिया जाये कि:

  • हमने मतपत्रों से खोला है ;ij
  • हमारे पास उम्मीदवारों जिसका वर्तमान अंक हैं c_1, c_2, c_3, ... c_n ;1 , सी 2 , सी 3 , सी एनnc1,c2,c3,...cn

हम उस निश्चितता की गणना कैसे कर सकते हैं जिसके साथ अग्रणी उम्मीदवार विजेता है?


1
ध्यान रखें कि उनके पास आमतौर पर व्यापक एग्जिट पोल डेटा, और अन्य डेटा तक पहुंच होती है जिसका उपयोग वे परिणाम की भविष्यवाणी करने के लिए कर सकते हैं। उन्हें केवल यह सुनिश्चित करने के लिए आने वाली गिनती से पर्याप्त पुष्टि की आवश्यकता है कि वे नमूना त्रुटि के कारण निशान से दूर नहीं हैं। इसमें निश्चित रूप से जटिलताएं शामिल हैं और आने वाली गिनती आम तौर पर एक पक्षपाती नमूना है, लेकिन एग्जिट पोल उन मुद्दों में से कुछ को संबोधित करने में मदद करने की दिशा में एक लंबा रास्ता तय करते हैं।
गुंग - को पुनः स्थापित मोनिका

1
यदि "निश्चितता के साथ" का अर्थ शाब्दिक रूप से लिया जाना है, तो आँकड़े (लगभग?) कभी भी "निश्चितता के साथ" प्रश्न का उत्तर नहीं दे सकते हैं। लेकिन हम उच्च स्तर के विश्वास के साथ उत्तर दे सकते हैं कि उत्तर सही होगा। (दूसरे शब्दों में, यदि हम अपना डेटा प्राप्त करते हैं और अपना विश्लेषण सही ढंग से करते हैं, तो हम ऐसी बातें कह सकते हैं, जैसे "मेरा उत्तर केवल x% समय के बारे में गलत होगा।")
एमिल फ्रीडमैन

जवाबों:


14

व्यवहार में मुख्य कठिनाई सांख्यिकीय अनिश्चितता नहीं है कि भाग्य की एक लकीर ने एक उम्मीदवार को अधिक वोट दिए होंगे। परिमाण या अधिक के क्रम से, मुख्य कठिनाई यह है कि जिन मतपत्रों को खोला गया है, वे लगभग कभी डाले गए वोटों का निष्पक्ष नमूना नहीं हैं। यदि आप इस प्रभाव को नजरअंदाज करते हैं, तो आपको एक प्रसिद्ध त्रुटि "डेवी डिफ़ाइट्स ट्रूमैन" मिलती है , जो एक बड़े पक्षपाती नमूने के साथ हुई।

व्यवहार में, मतदाता जो एक उम्मीदवार को दूसरे के पक्ष में रखते हैं, वे क्षेत्र द्वारा समान रूप से वितरित नहीं किए जाते हैं, चाहे वे दिन के दौरान काम करते हों, या चाहे वे विदेशों में तैनात किए जाएं इसलिए अनुपस्थित मतपत्रों द्वारा मतदान करेंगे। ये छोटे अंतर नहीं हैं।

मुझे लगता है कि अब समाचार संगठन समूहों में जनसंख्या को तोड़ने और प्रत्येक समूह को मतदान करने के लिए परिणामों का उपयोग करने के लिए करते हैं (मतदान सहित)। ये पिछले चुनावों के आधार पर मॉडल और पूर्व धारणाओं पर आधारित हो सकते हैं, न कि केवल इस चुनाव के आंकड़ों से। ये पाम बीच के तितली मतपत्र जैसी विषमताओं को ध्यान में नहीं रखते हैं


3
लगभग 10-15 साल पहले तक ऑस्ट्रेलिया में, रूढ़िवादी दलों ने आमतौर पर शुरुआती गिनती में मजबूत शुरुआत की, प्रगतिशील दलों ने देर से वापसी की। टीवी नेटवर्क शायद जानते थे कि क्या चल रहा है, लेकिन परिवर्तनशीलता संभवतः अधिक नाटक के लिए बनाई गई है। यह सब तब बदल गया जब एक विश्लेषक का नाम एंटनी ग्रीन ने बूथ परिणामों के आधार पर बूथ का उपयोग इस तथ्य के लिए शुरू किया कि ग्रामीण क्षेत्रों में छोटे बूथों को अपनी गणना करने और जल्दी परिणाम प्राप्त करने की प्रवृत्ति है, और वे अधिक रूढ़िवादी रूप से मतदान करते हैं। एंटनी ने इसे इस्तेमाल करने से पहले किसी और से चुनाव परिणाम को घंटों पहले ही सही कहा।
बोगदानोविस्ट

1
पिछले वर्षों के बूथ परिणामों से बूथ का उपयोग कुल परिणाम के अनुमानों को ठीक से जांचने के लिए किया जा सकता है।
पीटर एलिस

@DouglasZare मुझे लगता है कि आपका मतलब है कि वर्तमान में खोले गए मतपत्र एक यादृच्छिक नमूना नहीं है।
माइकल आर। चेरिक

1
@ मिचेल चेरिक: एक गैर-आयामी नमूना और एक पक्षपाती नमूने के बीच अंतर क्या है? en.wikipedia.org/wiki/Sampling_bias उन्हें समानार्थी शब्द के रूप में उपयोग करने लगता है।
डगलस ज़ारे

1
@DouglasZare मैं आपके लिंक से देखता हूं कि विकिपीडिया गैर-यादृच्छिक के लिए एक पर्याय के रूप में पक्षपाती नमूने का उपयोग करता है। मुझे लगता है कि यह एक गरीब विकल्प है। बायस सामान्य एक अनुमानक की अपेक्षा को संदर्भित करता है जो पैरामीटर के सही मूल्य के बराबर नहीं है। एक गैर-यादृच्छिक नमूने के नमूने के संदर्भ में एक विशेष अनुमान के लिए पूर्वाग्रह नहीं है। इससे पक्षपात हो सकता है या नहीं भी हो सकता है।
माइकल आर। चेरिक

0

सर्वेक्षण में नमूने के अनुपात के मानक त्रुटि के नमूने की आवश्यकता है। यह j की तुलना में i पर अधिक निर्भर करता है। इसके अलावा यह आवश्यक है कि मैं खोले गए मतपत्रों को यादृच्छिक पर चुना गया था। यदि p उम्मीदवार A के लिए सही अंतिम अनुपात है, तो अनुमान का विचरण है

(1-मैंजे)पी(1-पी)मैं

मात्रा (1-मैंजे)को परिमित जनसंख्या सुधार कारक कहा जाता है। इस विचरण का अनुमान लगाने के लिए सूत्र में p के लिए सामान्य अनुमान को प्रतिस्थापित किया गया है। वर्गमूल लेने से मानक त्रुटि हो जाती है। एक विजेता की भविष्यवाणी में पोलिस्टर अनुमान प्लस या माइनस 3 मानक त्रुटियों का उपयोग कर सकता है। यदि अंतराल में 0.5 निहित नहीं है, तो उम्मीदवार ए को विजेता घोषित किया जाता है यदि 0.5 निचली सीमा से नीचे है, या उसके प्रतिद्वंद्वी को विजेता घोषित किया जाता है यदि 0.5 ऊपरी सीमा से ऊपर है। बेशक यह केवल बहुत ही उच्च विश्वास के साथ कहता है कि विजेता इस घटना में होगा कि 0.5 अंतराल के बाहर है। विश्वास स्तर 0.99 है यदि तीन मानक त्रुटियां हैं जो आप उपयोग करते हैं (द्विपद के सामान्य सन्निकटन के आधार पर)। यदि अंतराल के अंदर 0.5 है, तो किसी को विजेता घोषित नहीं किया जाता है और अधिक डेटा एकत्र करने के लिए पोलस्टर प्रतीक्षा करता है।

एक प्रक्षेपण बनाने में पोल्स्टर्स संचित पूर्वाग्रह से बचने के लिए संचित वोटों से एक स्तरीकृत यादृच्छिक नमूना का चयन कर सकते हैं जो कि एमएमए में होता है यदि कोई सभी गिने हुए मतपत्रों को देखता है। सभी संचित वोटों को देखने के साथ समस्या यह है कि कुछ विशिष्ट प्रवृत्ति दूसरों पर भरोसा करते हैं और वे जनसंख्या के प्रतिनिधि नहीं हो सकते हैं।

लेख यहाँ समस्या और कई संदर्भ का अच्छा कवरेज प्रदान करता है।

यह बताया गया है कि संचित वोट अनुपातों के पक्षपाती अनुमान प्रदान कर सकते हैं क्योंकि या तो रिपोर्ट करने के लिए अभी तक आने वाले उपसर्ग हैं, जो प्रत्याशी के साथ पार्टी का पक्ष लेने की प्रवृत्ति रखते हैं या अनुपस्थित मतपत्रों के कारण उम्मीदवार के पक्ष में होने की संभावना है और उन मतों को अंतिम रूप से गिना जाता है। हैरिस और गैलप जैसे परिष्कृत प्रदूषक ऐसे जाल में नहीं पड़ते। संचित वोटों के आधार पर आत्मविश्वास अंतराल के निर्माण का सरल विश्लेषण केवल एक कारक है जिसका उपयोग किया जाता है। इन प्रदूषकों के पास अपने निपटान में अधिक जानकारी है। उनके पास चुनाव से कुछ समय पहले हुए मतदान हैं और उनके पास पिछले कुछ वर्षों में चुनावों में लिए गए सभी पूर्वाग्रहों और अनुपस्थित वोटों के वोटिंग पैटर्न हैं।

इसलिए अगर ऐसे स्पष्ट पक्षपात हैं जो विपरीत दिशा में एक करीबी चुनाव को स्विंग कर सकते हैं, तो प्रदूषणकर्ता इसे पहचान लेंगे और विजेता को प्रोजेक्ट करने से रोकेंगे।

अमेरिकी अनुपस्थित मतपत्रों में मुख्य रूप से सैन्य विदेशी और कॉलेज के छात्र आते हैं जो घर से दूर स्कूल में हैं। जबकि सैन्य रिपब्लिकन को वोट करने के लिए अधिक रूढ़िवादी और संभावना रखते हैं, वहीं सहयोगी छात्र अधिक उदार होते हैं और डेमोक्रेटिक वोट करने की संभावना रखते हैं। इन सभी बातों पर ध्यान दिया जाता है।

आधुनिक मतदान की देखभाल और परिष्कार यही कारण है कि 1936 के साहित्यिक डाइजेस्ट सर्वेक्षण या शिकागो अखबार के 1948 के चुनाव से लेकर डेवी तक की स्थूल त्रुटियां तब से नहीं हुई हैं।


2
हालांकि सर्वेक्षण के नमूने के साथ निहित सादृश्यता उपयुक्त नहीं है, लेकिन क्या यह सवाल जटिल कारकों को नहीं जोड़ता है? पहले दो से अधिक उम्मीदवारों की संभावना है। दूसरा यह है कि यह एक अनुक्रमिक निर्णय समस्या है: पोलस्टर के विपरीत, जो आम तौर पर एक पोल का आकार निर्दिष्ट करता है और नमूने के आधार पर एक निर्णय करता है, प्रत्येक पल में नेटवर्क का एक बढ़ता नमूना होता है और यह तय करना चाहिए कि चुनाव को कॉल करना है या इंतजार करना है अधिक जानकारी। आपके द्वारा यहां सर्वेक्षण किए गए एप्लिकेशन इस गतिशील स्थिति पर लागू नहीं होते हैं। और नेटवर्क 3 SE का उपयोग क्यों करेगा? (इसकी प्रतिष्ठा दांव पर है।)
whuber

1
@ जब मैं सहमत हूं कि ऐसी जटिलताएँ हैं जो शायद व्यवहार में नहीं मानी जाती हैं। मैंने सादगी के लिए एक दो उम्मीदवार का मामला चुना जहां बहुमत एक जीत है। मुझे लगता है कि यह वह स्थिति है जो ओपी के दिमाग में थी। तीन या अधिक उम्मीदवारों के साथ बहुलता से जीतने से यह प्रदर्शित होता है कि "जीतने वाले उम्मीदवार का अपने विरोधियों की तुलना में अधिक अनुपात होता है। निश्चित रूप से अगर आप एक बार से अधिक चुनाव करते हैं तो नमूने की क्रमिक प्रकृति को ध्यान में रखा जाना चाहिए। मुझे यकीन नहीं है। यह है।
बजे माइकल आर। चेरिक

1
3 एसई की मेरी पसंद थी क्योंकि मुझे लगता है कि प्रदूषक "बहुत सुनिश्चित" होना चाहते हैं कि वे विजेता घोषित करने से पहले सही हैं। इसलिए मुझे लगता है कि 3 का उपयोग किया जाएगा। 2. यदि आप त्रुटि का एक भी छोटा जोखिम चाहते हैं तो आप 3 से अधिक हो सकते हैं। मैंने ओपी को यह अंदाजा देने के लिए मानक त्रुटि के लिए सूत्र का उपयोग किया कि कैसे निश्चितता का स्तर i पर निर्भर करता है। जे एक सरल तरीके से। स्थिति को जटिल बनाने के लिए परिणाम अधिक जटिल होगा और मैं और जे पर निर्भरता स्पष्ट रूप से नहीं देखी जाएगी।
माइकल आर। चेरिक

2
n2

3
चूंकि मुझे कई डाउनवोट मिल रहे हैं, क्या कोई इसके लिए औचित्य की व्याख्या करेगा?
माइकल आर। चेरिक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.