अमेरिकी चुनाव परिणाम 2016: भविष्यवाणी मॉडल में क्या गलत हुआ?


108

पहले यह ब्रेक्सिट था , अब अमेरिकी चुनाव है। कई मॉडल भविष्यवाणियों को एक विस्तृत मार्जिन से बंद कर दिया गया था, और क्या यहां सीखने के लिए सबक हैं? कल देर शाम 4 बजे पीएसटी के रूप में, सट्टेबाजी बाजार अभी भी हिलेरी 4 से 1 के पक्ष में थे।

मुझे लगता है कि सट्टेबाजी के बाजार, लाइन पर असली पैसे के साथ, सभी उपलब्ध भविष्यवाणी मॉडल के कलाकारों की टुकड़ी के रूप में कार्य करना चाहिए। इसलिए यह कहना कि इन मॉडलों ने बहुत अच्छा काम नहीं किया है।

मैंने देखा कि एक स्पष्टीकरण था मतदाता खुद को ट्रम्प समर्थकों के रूप में पहचानने के लिए तैयार नहीं थे। एक मॉडल उस तरह के प्रभावों को कैसे शामिल कर सकता है?

एक मैक्रो स्पष्टीकरण जो मैंने पढ़ा है वह लोकलुभावनवाद का उदय है । फिर सवाल यह है कि एक सांख्यिकीय मॉडल उस तरह की मैक्रो प्रवृत्ति को कैसे पकड़ सकता है?

क्या ये भविष्यवाणी मॉडल चुनावों और भावनाओं के आंकड़ों पर बहुत अधिक भार डाल रहे हैं, न कि जहां से देश 100 मिलियन के दृष्टिकोण में खड़ा है? मैं एक मित्र की टिप्पणियों को उद्धृत कर रहा हूं।


9
"ट्रम्प समर्थक के रूप में खुद को पहचानने की अनिच्छा" का अनुमान कैसे लगाया जाए। प्रभाव: शायद समूहों पर ध्यान केंद्रित करें? यह एक सामाजिक विज्ञान का प्रश्न है, जो प्रति से अधिक आँकड़े है।
kjetil b halvorsen

100
मॉडलों को गलत क्यों होना चाहिए क्योंकि उन्होंने एक परिणाम की भविष्यवाणी की थी जो नहीं हुआ? मेरे पास एक मॉडल है जो कहता है कि एक मरने वाला शायद एक छक्का दिखाने वाला नहीं है, लेकिन कभी-कभी यह छह रास्ते दिखाता है।
dsaxton

4
मुझे यकीन नहीं है कि अगर मॉडल वास्तव में गलत पक्ष पर भारी पड़े। क्या हम मॉडल का आउटपुट सही तरीके से पढ़ रहे थे? मैं dsaxton की टिप्पणी से भी सहमत हूँ।
रिचर्ड हार्डी

7
एंड्रयू जेलमैन के ब्लॉग पर कुछ अच्छे विचार यहाँ
रिचर्ड हार्डी

22
यदि अंतर 4: 1 था, तो कम आम परिणाम अभी भी अक्सर होना चाहिए। यही कारण है कि सट्टेबाजी के बाजार सही हो सकते थे।
गंग

जवाबों:


57

संक्षेप में, मतदान हमेशा आसान नहीं होता है। यह चुनाव शायद सबसे कठिन रहा।

किसी भी समय हम सांख्यिकीय निष्कर्ष निकालने की कोशिश कर रहे हैं, एक बुनियादी सवाल यह है कि क्या हमारा नमूना ब्याज की आबादी का अच्छा प्रतिनिधित्व है। एक विशिष्ट धारणा जो कई प्रकार के सांख्यिकीय निष्कर्षों के लिए आवश्यक है, वह यह है कि हमारा नमूना ब्याज की आबादी से पूरी तरह यादृच्छिक नमूना है (और अक्सर, हमें स्वतंत्र होने के लिए नमूनों की भी आवश्यकता होती है)। अगर ये धारणा सही है, तो हमारे पास आमतौर पर सांख्यिकीय सिद्धांत के आधार पर हमारी अनिश्चितता के अच्छे उपाय हैं।

लेकिन हम निश्चित रूप से इन मान्यताओं को चुनाव के साथ सही नहीं मानते हैं! हमारे पास हमारी रुचि की आबादी के ठीक 0 नमूने हैं: चुनाव के दिन वास्तविक वोट। इस मामले में, हम डेटा के बारे में और अधिक मान्य मान्यताओं के बिना किसी भी प्रकार की वैध निष्कर्ष नहीं बना सकते हैं । या कम से कम, चुनाव के दिन के बाद तक अप्राप्य।

क्या हम पूरी तरह से हार मान लेते हैं और कहते हैं "50% -50%!" आमतौर पर, नहीं। हम यह सुनिश्चित करने की कोशिश कर सकते हैं कि जो हम मानते हैं कि वोट कैसे डाले जाएंगे, इस बारे में उचित धारणाएं हैं। उदाहरण के लिए, शायद हम यह विश्वास करना चाहते हैं कि चुनाव के दिन के चुनावों के लिए निष्पक्ष अनुमान हैं, साथ ही कुछ निश्चित अस्थायी शोर (यानी, समय बीतने के साथ सार्वजनिक राय विकसित करना)। मैं मतदान के तरीकों का विशेषज्ञ नहीं हूं, लेकिन मेरा मानना ​​है कि यह 538 मॉडल का प्रकार है। और 2012 में, इसने बहुत अच्छा काम किया। तो उन मान्यताओं शायद बहुत उचित थे। दुर्भाग्य से, उन मान्यताओं के मूल्यांकन का कोई वास्तविक तरीका नहीं है, कड़ाई से गुणात्मक तर्क के बाहर। एक समान विषय पर अधिक चर्चा के लिए, नॉन-इग्नेशियल गुम होने का विषय देखें।

2016 में चुनावों ने इतना खराब प्रदर्शन क्यों किया: मेरा मतदाता मतदाता दिवस के व्यवहार के निष्पक्ष अनुमान नहीं थे । यही है, मुझे लगता है कि ट्रम्प समर्थकों (और संभवतः ब्रेक्सिट समर्थकों के रूप में) प्रदूषकों के बारे में बहुत अधिक अविश्वास थे। याद रखें कि श्री ट्रम्प ने सक्रिय रूप से चुनावों की निंदा की। इस तरह, मुझे लगता है कि ट्रम्प समर्थकों को उनके विरोधियों के समर्थकों की तुलना में उनके मतदाताओं के इरादे की रिपोर्ट करने की संभावना कम थी। मैं अनुमान लगाता हूं कि इससे चुनावों में एक अप्रत्याशित भारी पूर्वाग्रह पैदा हुआ।

पोल डेटा का उपयोग करते समय विश्लेषकों ने इसका क्या हिसाब रखा होगा? केवल पोल डेटा के आधार पर, मात्रात्मक तरीके से ऐसा करने का कोई वास्तविक तरीका नहीं है। पोल डेटा आपको उन लोगों के बारे में कुछ नहीं बताता है जिन्होंने भाग नहीं लिया था। हालांकि, कोई व्यक्ति डेटा और चुनाव के दिन के व्यवहार के बीच के संबंध के बारे में अधिक उचित (लेकिन अस्थिर) धारणाओं को चुनकर गुणात्मक तरीके से चुनावों को बेहतर बनाने में सक्षम हो सकता है। यह गैर-तुच्छ है और एक अच्छा प्रदूषक होने का वास्तव में कठिन हिस्सा है (नोट: मैं एक प्रदूषक नहीं हूं)। यह भी ध्यान दें कि परिणाम पंडितों के लिए बहुत ही आश्चर्यजनक थे, इसलिए ऐसा नहीं है कि इस समय स्पष्ट संकेत थे कि धारणाएं बेतहाशा बंद थीं।

मतदान कठिन हो सकता है।


1
@horaceT: उन्हें कैसे पता चलेगा कि जब तक उनके पास ब्याज की आबादी के नमूने नहीं थे, तब तक वे पक्षपाती थे? यहां की झुर्रियों में से एक ऐतिहासिक रूप से है, मुझे लगता है कि यह मुद्दा पूर्वाग्रह के बजाय शोर में से एक है । यदि दोनों पक्षों में गैर-प्रतिक्रिया के समान स्तर हैं, तो आपके अनुमान निष्पक्ष होंगे, बस थोड़ा अधिक शोर होगा। लेकिन चूंकि श्री ट्रम्प ने मीडिया कवरेज और चुनावों के भारी नकारात्मक विचारों के साथ एक अभियान चलाया, इसलिए किसी भी पिछले चुनाव की तुलना में, गैर-प्रतिक्रिया आसानी से ट्रम्प वोटों का प्रतिनिधित्व करने की दिशा में बहुत अधिक हो सकती थी। यह एक प्रभाव प्रदूषक होगा ...
क्लिफ एबी

38
इसके लायक क्या है, मुझे अभी भी नहीं लगता कि 538 वास्तव में विफल रहे। इसने ट्रम्प को जीतने के लिए एक ~ 30% मौका (?) दिया, जो बहुत अच्छा है - इसका मतलब है कि हर 2-3 बार के लिए यह सही होने की उम्मीद है, यह 1 बार गलत होने की उम्मीद है। यह अनिश्चितता की एक बड़ी मात्रा है, अन्य चुनावों की तुलना में कहीं अधिक के लिए स्वीकार करने के लिए तैयार लग रहे थे।
मेहरदाद

3
यह प्रभाव सर्वविदित है: इसे यूएस में ब्रैडली प्रभाव और यूके में शर्मीली टोरी प्रभाव कहा जाता है।
एमिलियो पिसेन्टी

15
538 (और सैम वैंग के पीईसी जैसी अन्य चीजें) चुनाव नहीं हैं। वे चुनाव परिणामों से निर्मित मॉडल हैं। ये सभी मॉडल मूल रूप से एक ही डेटा के साथ शुरू हुए थे, लेकिन 538 ने परिणामों में बहुत अधिक अनिश्चितता की भविष्यवाणी की थी कि जिन कारणों से नैट सिल्वर ने चुनाव पूर्व बड़े पैमाने पर चर्चा की थी। इसका मतलब यह था कि हिलेरी की जीत का 538 मौका बहुत कम था, हालांकि उन्होंने समान चुनावों का इस्तेमाल किया। मैं मानता हूं कि 538 विफल नहीं हुए - इसके इनपुट को देखते हुए, बहुत अनिश्चितता के साथ एक हिलेरी की जीत, हंसी में भी सबसे अच्छी भविष्यवाणी की तरह लगती है।
KAI

6
मैंने पहली बार चुनाव के बाद सुबह 538 की भविष्यवाणी पढ़ी , और इसमें नैट सिल्वर ने स्पष्ट रूप से कहा कि त्रुटि का 3% मार्जिन सामान्य सीमा में अच्छी तरह से होगा - और यदि आप त्रुटि के 3% मार्जिन के चार्ट को देखते हैं। ट्रम्प के पक्ष में, यह वास्तव में क्या हुआ के साथ बहुत अच्छी तरह से ऊपर उठाता है।
21ion में Xiong Chiamiov

35

मतदान त्रुटि के कई स्रोत हैं:

  • आपको कुछ लोगों तक पहुंचने में मुश्किल होती है

    इसे जनसांख्यिकीय विश्लेषण करके ठीक किया जाता है, फिर आपके नमूने के पूर्वाग्रह के लिए सही किया जाता है। यदि आपका जनसांख्यिकीय विश्लेषण उन चीजों को प्रतिबिंबित नहीं करता है जो लोगों तक पहुंचने में कठिन बनाते हैं, तो यह सुधार क्षति की मरम्मत नहीं करता है।

  • लोग झूठ बोलते हैं

    आप उन ऐतिहासिक दरों का उपयोग कर सकते हैं, जिन पर लोग आपके मॉडल को प्रभावित करने के लिए प्रदूषकों से झूठ बोलते हैं। एक उदाहरण के रूप में, ऐतिहासिक रूप से लोग कहते हैं कि वे 3 पार्टी को वोट देने जा रहे हैं, जितना वे वास्तव में चुनाव के दिन करते हैं। आपके सुधार यहां गलत हो सकते हैं।

    ये झूठ आपके अन्य सुधारों को भी गड़बड़ कर सकते हैं; यदि वे पिछले चुनाव में मतदान के बारे में झूठ बोलते हैं, तो उन्हें एक संभावित मतदाता के रूप में गिना जा सकता है, भले ही वे उदाहरण के लिए न हों।

  • केवल वोट देने वाले लोग ही गिनती खत्म करते हैं

    किसी के पास बहुत समर्थन हो सकता है, लेकिन अगर उनके समर्थक चुनाव के दिन दिखाई नहीं देते हैं, तो यह मायने नहीं रखता है। यही कारण है कि हमने मतदाता, संभावित मतदाता आदि मॉडल पंजीकृत किए हैं। यदि ये मॉडल गलत हैं, तो चीजें काम नहीं करती हैं।

  • मतदान में पैसा खर्च होता है

    चुनाव करना महंगा है, और यदि आप उम्मीद नहीं करते (कहते हैं) मिशिगन फ्लिप करने के लिए आप इसे बहुत बार नहीं कर सकते हैं। इससे आश्चर्य हो सकता है कि चुनाव के 3 सप्ताह पहले आपने जिस राज्य में मतदान किया था, चुनाव के दिन ऐसा कुछ नहीं दिखता है।

  • लोग अपना विचार बदलते हैं

    मिनट, घंटे, दिन, सप्ताह या महीने, लोग अपना दिमाग बदलते हैं। "अब आप क्या करेंगे" के बारे में मतदान करने से बहुत मदद नहीं मिलती अगर वे अपने दिमाग को बदलते इससे पहले कि यह मायने रखता है। ऐसे मॉडल हैं जो मोटे तौर पर उस दर का अनुमान लगाते हैं जिस पर लोग ऐतिहासिक चुनावों के आधार पर अपना विचार बदलते हैं।

  • चरवाहा

    यदि हर कोई कहता है कि हिलेरी +3 है और आपको हिलेरी +11 या डोनाल्ड +1 दिखाते हुए एक पोल मिलता है, तो आप इस पर सवाल उठा सकते हैं। आप एक और पास कर सकते हैं और देखें कि क्या कोई विश्लेषण विफलता है। आप इसे फेंक भी सकते हैं और दूसरा चुनाव भी कर सकते हैं। जब आपको हिलेरी +2 या +4 पोल मिलते हैं, तो आप ऐसा नहीं कर सकते। बड़े पैमाने पर आउटलेर्स, भले ही सांख्यिकीय मॉडल कहता है कि यह कभी-कभी होता है, आपको "खराब दिख सकता है"।

    इसका एक विशेष रूप से भद्दा रूप चुनाव के दिन हुआ, जहां हर कोई जिसने जादुई रूप से जारी किया, उसी मूल्य में परिवर्तित हो गया; संभवतया वे बाहरी चुनाव करते हैं, लेकिन कोई भी ऐसा नहीं होना चाहता जिसने इस चुनाव से एक दिन पहले कहा हो (कहते हैं) हिलेरी +11। झुंड में गलत होने से आपको कम दर्द होता है।

  • अपेक्षित नमूनाकरण त्रुटि

    यदि आपके पास 1 मिलियन लोग हैं और आप 100 पूरी तरह से यादृच्छिक लोगों से पूछते हैं और आधे लोग "Apple" कहते हैं और आधे "ऑरेंज" कहते हैं, तो नमूना से प्राप्त होने वाली अपेक्षित त्रुटि +/- 10 या तो, भले ही उपरोक्त समस्याओं में से कोई भी हो। पाए जाते हैं। यह अंतिम बिट है जो चुनावों को उनकी त्रुटि के मार्जिन के रूप में वर्णित करता है । पोल शायद ही कभी वर्णन करते हैं कि उपरोक्त सुधार कारक त्रुटि के रूप में क्या पेश कर सकते हैं।


538 पर नैट सिल्वर उन कुछ पोलिंग एग्रीगेटर्स में से एक था, जो उपरोक्त प्रकार की त्रुटियों की संभावना को संभालने के लिए रूढ़िवादी (सतर्क) का उपयोग करते थे। उन्होंने मतदान मॉडल में प्रणालीगत सहसंबद्ध त्रुटियों की संभावना में तथ्य किया।

जबकि अन्य एग्रीगेटर 90% + मौका का अनुमान लगा रहे थे कि एचसी चुने गए थे, नैट सिल्वर 70% बता रहा था, क्योंकि चुनाव एक डोनाल्ड जीत की "सामान्य मतदान त्रुटि" के भीतर थे।

यह मॉडल त्रुटि का एक ऐतिहासिक माप था , जैसा कि कच्ची सांख्यिकीय नमूनाकरण त्रुटि के विपरीत था; क्या होगा अगर मॉडल और मॉडल के सुधार गलत थे?


लोग अभी भी संख्या में कमी कर रहे हैं। लेकिन, प्रारंभिक परिणाम से पता चलता है कि इसका एक बड़ा हिस्सा मॉडल था। डोनल्ड समर्थकों ने बड़ी संख्या में चुनावों को दिखाया, और हिलेरी समर्थकों को कम संख्या में, मतदान मॉडल (और एक्जिट पोल!) से संकेत दिया।

उम्मीद से ज्यादा डोनल्ड के लिए लेटिनो ने वोट दिया। अश्वेतों ने उम्मीद से अधिक डोनाल्ड के लिए मतदान किया। (दोनों में से अधिकांश ने हिलेरी को वोट दिया)। श्वेत महिलाओं ने उम्मीद से ज्यादा डोनाल्ड को वोट दिया (उनमें से ज्यादा ने हिलेरी की तुलना में डोनाल्ड को वोट दिया, जिसकी उम्मीद नहीं थी)।

मतदाता मतदान सामान्य रूप से कम था। उच्च मतदाता होने पर डेमोक्रेट्स की जीत होती है और कम होने पर रिपब्लिकन।


1
एक दिलचस्प मतदान समस्या यह है कि मतदान स्वयं मतदान को प्रभावित करता है। क्या इसके लिए कोई टर्नआउट मॉडल है? एक फ़ंक्शन होना संभव है जो सर्वेक्षण के पूर्वानुमानित सर्वेक्षण को लेता है, और उम्मीदवार दृष्टिकोण के अनुसार इसे दोनों पक्षों के लिए संशोधित करता है। बहुत पीछे रहने वाले उम्मीदवार को अतिरिक्त मतदाता नहीं मिल सकते हैं, जो मतदान देखने के बाद अधिक चिंतित हैं, क्योंकि वे अपने उम्मीदवार की संभावनाओं को गंभीर बताते हैं, लेकिन यदि आपका उम्मीदवार आगे है, तो आप वोट देने के लिए उतनी मेहनत नहीं कर सकते ... यह स्पष्ट रूप से नहीं है रैखिक कार्य, लेकिन यह औसत दर्जे का होना चाहिए।
बेनपेन

2
मुझे सिर्फ हेरिंग का उल्लेख करने और इसे अच्छी तरह से समझाने के लिए। जैसा कि मैंने अपने जवाब में कहा था, मुझे बहुत संदेह था कि 538 के ग्राफ के आधार पर 5 या उसके आसपास (चुनाव से 3 दिन पहले) हेरिंग हो सकती है। मुझे लगता है कि हम आगामी दिनों में त्रुटियों के बारे में अधिक जानकारी प्राप्त करेंगे। (आप जानते हैं कि आप एक बेवकूफ हैं जब आप एक वेब पेज को अस्पष्ट रूप से ताज़ा कर रहे हैं, ताकि एक ग्राफ वक्र के दूसरे व्युत्पन्न पर विचार किया जा सके)।
TED

मुझे नहीं पता कि आप इसके लिए कैसे जिम्मेदार हैं, लेकिन मुझे लगता है कि ट्रम्प से जुड़ा एक कलंक है जो उनके वास्तविक समर्थन को ठीक से निर्धारित करना मुश्किल बना देगा और केवल वास्तविक चुनाव परिणामों में दिखाई देगा। मैं इसे बम्पर स्टिकर कोरोलरी के रूप में सोचना पसंद करता हूं: जॉर्ज डब्ल्यू बुश और ओबामा दोनों 2 राष्ट्रपति थे, लेकिन जब ओबामा बम्पर स्टिकर बड़े पैमाने पर होते हैं और गर्व के साथ कारों पर सुशोभित होते हैं, एक बुश बम्पर स्टिकर 4 पत्ती तिपतिया घास की तरह था। ऐसे कुछ उम्मीदवार हैं जहां खुले समर्थन में विपक्ष की ओर से बहुत अधिक गर्मी और विट्रियल है और समर्थन बहुत कम है।
कोबर्न

3
@coburne प्राइमरी में इसका कोई सबूत नहीं था; ट्रम्प समर्थक जहां इसके बारे में नहीं शर्माते हैं। बुश बम्पर स्टिकर जहां ओबामा बम्पर स्टिकर की तुलना में विभिन्न क्षेत्रों में लोकप्रिय हैं।
Yakk

@ कॉबर्न - आप जिस बारे में बात कर रहे हैं उसे द ब्रैडली इफेक्ट कहा जाता है । इस बात पर भारी बहस है कि क्या यह मौजूद है। एक अध्ययन था, हालांकि माना जाता है कि अभियान में नस्लीय रूप से चार्ज किए गए बयानों के लिए इसकी शक्ति लगभग आनुपातिक थी। मुझे नहीं लगता कि इस बारे में बहुत बहस हुई है कि इसमें बहुत कुछ इस्तेमाल किया गया था।
TED

31

इसका उल्लेख स्वीकार किए गए उत्तर ( मेहरदाद के लिए टोपी-टिप ) पर टिप्पणियों में किया गया था , लेकिन मुझे लगता है कि इस पर जोर दिया जाना चाहिए। 538 वास्तव में बहुत अच्छी तरह से इस चक्र ऐसा किया *

538 एक पोलिंग एग्रीगेटर है जो विजेता की भविष्यवाणी करने की कोशिश करने के लिए प्रत्येक राज्य के खिलाफ मॉडल चलाता है। उनके अंतिम रन ने ट्रम्प को जीतने का लगभग 30% मौका दिया। इसका मतलब है कि यदि आप इस तरह डेटा के साथ तीन चुनावों में भाग लेते हैं, तो आप टीम रेड से उनमें से एक जीतने की उम्मीद करेंगे। यह वास्तव में एक मौका का छोटा नहीं है। यह निश्चित रूप से एक बड़ा पर्याप्त है जिसे मैंने सावधानी बरती (उदाहरण: शुक्रवार से पहले मैंने बुधवार को काम पर 9 वीं छुट्टी मांगी थी, इसकी संभावना को देखते हुए कि यह देर रात होने के लिए पर्याप्त है)।

एक बात 538 आपको बताएगी कि क्या आप हैंग आउट करते हैं, अगर चुनाव बंद हो जाते हैं, तो एक अच्छा मौका है कि वे सभी एक ही दिशा में रवाना होंगे। यह कुछ कारणों से है।

  • संभावित मतदाता मॉडल। मतदाताओं को उन प्रकार के मतदाताओं के लिए समायोजित करना होगा जो वास्तव में चुनाव के दिन दिखाई देंगे। हमारे पास ऐतिहासिक मॉडल हैं, लेकिन यह स्पष्ट रूप से आपके उम्मीदवारों की विशिष्ट जोड़ी नहीं थी, इसलिए अतीत के आंकड़ों के आधार पर भविष्यवाणी करना हमेशा ही एक उत्साह का विषय था।
  • देर से चुनाव हेरिंग । कोई भी ऐसा चुनाव नहीं होना चाहता जिसने चुनाव को सबसे खराब किया हो। इसलिए जब वे अभियान के बीच में बाहरी होने का बुरा नहीं मानते हैं, तो अंत में सभी चुनावों में खुद को ऐसा करने की प्रवृत्ति होती है कि वे एक ही बात कहते हैं। यह उन चीजों में से एक है, जो 2014 में एरिक कैंटर के आश्चर्यजनक नुकसान में चुनावों के लिए दोषी ठहराया गया था , और 2014 के वर्जीनिया सीनेट दौड़ के आश्चर्यजनक परिणाम के लिए भी।

* - 538 ने अब अपना विश्लेषण पोस्ट किया है । यह ज्यादातर ऊपर बताई गई बातों के साथ होता है, लेकिन यदि आप अधिक विवरण चाहते हैं तो यह पढ़ने योग्य है।


अब थोड़ी व्यक्तिगत अटकलें। मैं वास्तव में इसके अंतिम 3 दिनों के लिए 538 के अंतिम% अवसरों पर संदेह कर रहा था। कारण उस दूसरी गोली के ऊपर जाता है। आइए इस चुनाव के लिए उनके मॉडल के इतिहास पर नज़र डालें (उनकी वेबसाइट से)

यहाँ छवि विवरण दर्ज करें

(अफसोस की बात है, लेबल इसे अस्पष्ट करते हैं, लेकिन इसके बाद पिछले तीन दिनों के लिए फिर से घटता है, क्लिंटन के लिए 70% से अधिक मौका है)

जिस पैटर्न को हम यहां देख रहे हैं वह बार-बार विचलन है और इसके बाद ट्रम्प लीड की ओर क्षय होता है। क्लिंटन के बुलबुले सभी घटनाओं के कारण थे। पहला सम्मेलन था (आम तौर पर मतदान में प्रदर्शन शुरू करने के लिए एक घटना के बाद कुछ दिनों के अंतराल के बाद)। ऐसा लगता है कि पहली बहस ने टीएमजेड टेप की मदद से पहली बहस को लात मार दी थी। फिर तीसरा विभक्ति बिंदु है जिसे मैंने चित्र में चिह्नित किया है।

यह चुनाव से 3 दिन पहले 5 नवंबर को हुआ। किस घटना के कारण हुआ? कुछ दिन पहले एक और ईमेल-फ़ेयरअप था, लेकिन क्लिंटन के पक्ष में काम नहीं करना चाहिए था।

सबसे अच्छा स्पष्टीकरण मैं उस समय के साथ आ सकता था जब पोल हेरिंग था। चुनाव होने तक केवल 3 दिन थे, अंतिम मतदान से 2 दिन पहले, और मतदाता अपने अंतिम परिणामों के बारे में चिंता करना शुरू कर देंगे। "पारंपरिक ज्ञान" इस पूरे चुनाव (जैसा कि सट्टेबाजी के मॉडल द्वारा दर्शाया गया) एक आसान क्लिंटन जीत थी। तो यह एक अलग संभावना थी कि यह बिल्कुल भी सही जानकारी नहीं थी। अगर ऐसा होता, तो 5 नवंबर से सही वक्र अभिसरण की ओर इस एक की निरंतरता की संभावना थी।

इस बेहतर अंतिम विभक्ति बिंदु के बिना वक्र को आगे अनुमान लगाने के लिए मुझे एक बेहतर गणितज्ञ लगेगा, लेकिन मुझे लगता है कि मुझे लगता है कि 8 नवंबर को क्रॉसओवर बिंदु के पास होगा । सामने या पीछे इस बात पर निर्भर करता है कि वास्तव में वह वक्र कितना वास्तविक था।

अब मैं निश्चित रूप से नहीं कह सकता कि यह क्या हुआ है। अन्य बहुत प्रशंसनीय व्याख्याएं हैं (उदाहरण के लिए: ट्रम्प ने अपने मतदाताओं को किसी भी संभावित सर्वेक्षण की तुलना में कहीं बेहतर पाया) लेकिन यह उस समय जो चल रहा था, उसके लिए मेरा सिद्धांत था, और यह निश्चित रूप से भविष्य कहनेवाला साबित हुआ।


1
मुझे लगता है कि पिछले कुछ दिनों में इस अजीब चुनाव विभक्ति का बेहतर विश्लेषण हुआ होगा, लेकिन क्लिंटन समर्थकों ने देखा कि वे क्या देखना चाहते हैं, और ट्रम्प समर्थकों ने चुनावों को रोकने के लिए लंबे समय बाद किया था। उम्मीद है कि अब कोई ऐसा करेगा।
TED

मैंने सोचा कि पिछले दिनों कॉमी के बयान के कारण थोड़ा सामान्य हो गया था कि नए ईमेल ने नए सिरे से आपराधिक जांच का कारण नहीं बनाया।
कोनराड रुडोल्फ

@KonradRudolph - यह वह व्याख्या थी जो मैंने उस समय उस विभक्ति के लिए दी थी। समस्या यह है कि प्रश्न में कथन 6 नवंबर तक नहीं निकला था, और एक दिन पहले संदिग्ध मतदान उल्लंघन बिंदु हुआ (ऊपर चित्र में मार्कर देखें)। इसके अलावा, ड्रॉप को कॉमी द्वारा पूरी तरह से समझाए जाने के लिए समय गलत है, इसलिए कोई तार्किक कारण नहीं है कि उसका "कभी नहीं" कथन ने इसे रोक दिया (बहुत कम इसे चारों ओर बदल दिया गया)।
TED

2
538 के साथ समस्या उनके मॉडल की नहीं है क्योंकि मतदान के आंकड़ों की गुणवत्ता इसमें चली गई थी। डेटा स्पष्ट करते हैं कि यह नमूना त्रुटि का मामला नहीं था (जो कि औसतन बहुत छोटा होता है जब आप सर्वेक्षण करते हैं कि प्रत्येक में अच्छे नमूना आकार हैं)। washparkprophet.blogspot.com/2016/11/what-polls-got-wrong.html इसके बजाय, समस्या या तो चुनावों के शेर के हिस्से में पक्षपाती नमूनाकरण की है, या प्रदूषकों (ट्रम्प के सामाजिक अस्वीकृति के कारण) से प्रणालीगत असत्यता या दोनों। लेकिन, 538 को अपने मॉडल में यह पहचानने के लिए कुदोस मिलता है कि विभिन्न राज्यों में चुनाव स्वतंत्र नहीं हैं।
ओहविलेके 1

@ मोहल्लेके - अधिकार। जैसा कि अन्य जवाबों में से एक ने कहा, जी.जी.ओ. यही कारण है कि मुझे लगा कि अजीब अस्पष्टीकृत विभक्ति बिंदु के साथ होने की संभावना थी। प्रश्न इनपुट पोल में "कचरा" का स्रोत है।
TED

17

पहले यह ब्रेक्सिट था, अब अमेरिकी चुनाव है

वास्तव में पहला नहीं है, उदाहरण के लिए फ्रांसीसी राष्ट्रपति चुनाव, 2002 "मतदान तकनीकों के बारे में गंभीर चर्चा का नेतृत्व किया"।

इसलिए यह कहना कि इन मॉडलों ने बहुत अच्छा काम नहीं किया है।

कचरा अंदर कचरा बाहर।

मैंने देखा कि एक स्पष्टीकरण था कि मतदाता खुद को ट्रम्प समर्थक के रूप में पहचानने के लिए तैयार नहीं थे। एक मॉडल उस तरह के प्रभावों को कैसे शामिल कर सकता है?

प्रतिक्रिया पूर्वाग्रह देखें , और विशेष रूप से सामाजिक वांछनीयता पूर्वाग्रह में । अन्य दिलचस्प पढ़ते हैं: मूक बहुमत और ब्रैडली प्रभाव


2
ज़रूर, कचरा बाहर कचरा। लेकिन भविष्यवाणियों को कोई कैसे पहचानता है कि वे कचरा थे, और उनकी सवारी करने के लिए "चर चयन" करें?
रात्रि

6
@horaceT जैसा कि आप देख सकते हैं, यह बहुत कठिन है और कभी-कभी असंभव हो सकता है। FiveThirtyEight.com में बहुत ही सभ्य कार्यप्रणाली और उच्च-गुणवत्ता वाला मॉडल था, जिसमें विविध डेटा का उपयोग और कई पूर्वाग्रह के लिए सही था। चुनाव से एक दिन पहले इसने 71.4% संभावना दी कि हिलेरी क्लिंटन जीतेगी ...
टिम

1
@horaceT मैं डेटा संग्रह पर ध्यान केंद्रित करूंगा, क्योंकि यह मुद्दा लगता है। सामाजिक वांछनीयता पूर्वाग्रह पृष्ठ में इसे सुधारने के लिए कुछ विचार हैं।
फ्रेंक डेर्नोनकोर्ट

1
@horaceT इसके अलावा, अगर लगभग हर पूल ने कहा कि क्लिंटन केवल एक पागल व्यक्ति का तर्क होगा कि वे सभी गलत हैं ... ऐसे मॉडल को सही ठहराना बहुत कठिन होगा।
टिम

1
मुझे यह जानने की उत्सुकता होगी कि मतदाता मतदान (जैसे जनसांख्यिकी पर आधारित) के लिए चुनावों की भविष्यवाणियां कितनी सटीक थीं। मैं सोच सकता था कि यदि कई चुनाव "महत्वपूर्ण लीड" की भविष्यवाणी करते हैं, तो मतदान को दबाया जा सकता है (उदाहरण के लिए एक प्रेक्षक प्रभाव के समान )?
GeoMatt22

12

यूएससी / एलए टाइम्स पोल में कुछ सटीक संख्याएं हैं। उन्होंने ट्रम्प के नेतृत्व में होने की भविष्यवाणी की। यूएससी / ला टाइम्स पोल देखें कि अन्य सर्वेक्षणों में क्या याद किया गया: ट्रम्प समर्थन की लहर

http://www.latimes.com/politics/la-na-pol-usc-latimes-poll-20161108-story.html

यहाँ छवि विवरण दर्ज करें

उनके पास 2012 के लिए भी सटीक संख्या थी।

आप समीक्षा करना चाहते हैं: http://graphics.latimes.com/usc-presidential-poll-dashboard/

और NY टाइम्स ने उनके वजन के बारे में शिकायत की: http://www.nytimes.com/2016/10/13/upshot/how-one-19-year-old-illipedia-man-is-distorting-national-polling-aactions। एचटीएमएल

ला टाइम्स की प्रतिक्रिया: http://www.latimes.com/politics/la-na-pol-daybreak-poll-questions-20161013-snap-story.html


26
इस पोल में ट्रम्प को लोकप्रिय वोट 3.2% से जीतना था, लेकिन लगता है कि क्लिंटन .1% से जीत गए हैं। इसलिए मैं नहीं देखता कि आप कैसे कह सकते हैं कि उनके पास सटीक संख्याएँ हैं।
विंस्टन एवर्ट

3
बस एक मामूली नोट - क्या आप वास्तव में किसी भी त्रुटिवादी को एक त्रुटि विंडो के 3.2% से कम होने की उम्मीद करेंगे ?
एनओई

9
एक उदाहरण के रूप में इस सर्वेक्षण के साथ समस्याएं 1) गलत चीज का मतदान। लोकप्रिय वोट प्रेसीडेंसी जीतने के साथ संबंधित है, लेकिन यह नहीं है कि इसका फैसला कैसे किया गया। 2) यह टॉपलाइन गलत हुई । क्लिंटन ने जीता कि यह क्या माप रहा है, ट्रम्प नहीं। 3) यह एक ही 3ish अंक से दूर था अन्य अधिकांश सर्वेक्षणों में, बस एक अलग दिशा में थे।
TED

5
... वास्तव में, ऐसा लगता है कि क्लिंटन लोकप्रिय वोट में ट्रम्प के आगे एक पूर्ण बिंदु के बारे में समाप्त कर सकते हैं, जिसका अर्थ है कि यह मतदान 4 से नहीं, 3 से बंद था। इसलिए सिद्धांत रूप में एक समान सर्वेक्षण जिसमें उसे 3 अंकों से जीत मिली होगी इस के रूप में दो बार के रूप में सटीक एक (4 के बजाय केवल 2 अंक से दूर) किया गया है।
TED

8
ला टाइम्स पोल दुर्घटना के हिसाब से सही था : 19 साल के अधिक भार वाले ने कम वजन वाले सफेद ग्रामीण वोटों का प्रतिकार किया।
मार्क

11

यहां किसी भी ऊंचे मैदान का दावा नहीं किया गया। मैं एक क्षेत्र (निगरानी और मूल्यांकन) में काम करता हूं जो छद्म विज्ञान के साथ व्याप्त है जैसा कि आप किसी भी अन्य सामाजिक विज्ञान के साथ कर सकते हैं।

लेकिन यहां सौदा, मतदान उद्योग आज 'संकट' में है क्योंकि इसे अमेरिकी चुनाव की भविष्यवाणियां इतनी गलत लगीं, सामान्य रूप से सामाजिक विज्ञान में एक प्रतिकारक 'संकट' है और 2000 के दशक के अंत में हमारे पास एक विश्व वित्तीय 'संकट' था। कुछ चिकित्सकों का मानना ​​था कि उप-प्राइम मॉर्गेज डेरिवेटिव वित्तीय डेटा का एक वैध रूप था (यदि हम उन्हें संदेह का लाभ देते हैं ...)।

और हम सभी की परवाह किए बिना सिर्फ दोष देते हैं। हर दिन मैं डेटा संग्रह दृष्टिकोण के रूप में उपयोग किए जाने वाले शोधकर्ता निर्माणों का सबसे अधिक संदिग्ध देखता हूं, और इसलिए अंततः डेटा के रूप में उपयोग किया जाता है (अर्ध-क्रमिक तराजू से सब कुछ निश्चित रूप से अग्रणी प्रतिक्रिया श्रेणियों के लिए)। बहुत कम शोधकर्ता भी महसूस करते हैं कि उन्हें अपने परिणामों को समझने की आशा करने से पहले इस तरह के निर्माणों के लिए एक वैचारिक ढांचे की आवश्यकता है। यह ऐसा है जैसे हमने बाजार के 'अनुसंधान' दृष्टिकोणों को देखा है और पक्ष में थोड़ी सी संख्या के जोड़ के साथ, केवल उनकी सबसे खराब गलतियों को अपनाने का फैसला किया है।

हम 'वैज्ञानिक' माने जाना चाहते हैं, लेकिन कठोरता से परेशान होना थोड़ा कठिन है, इसलिए हम बकवास डेटा इकट्ठा करते हैं और जीजीओ एक्सियल को जादुई रूप से अधिक सवारी करने के लिए आंकड़ों के देवता की तरह प्रार्थना करते हैं।

लेकिन जैसा कि श्री फेनमैन ने कहा है कि:

“इससे कोई फर्क नहीं पड़ता कि आपका सिद्धांत कितना सुंदर है, इससे कोई फर्क नहीं पड़ता कि आप कितने स्मार्ट हैं। यदि यह प्रयोग से सहमत नहीं है, तो यह गलत है ”।

गुणात्मक डेटा को संभालने के लिए बेहतर तरीके हैं जो हम अक्सर फंस जाते हैं, लेकिन वे थोड़ा अधिक काम लेते हैं और उन अच्छे शोधकर्ता निर्माणों को अक्सर एसपीएसएस में फीड करना आसान होता है। सुविधा विज्ञान को हर बार ट्रम्प लगता है (कोई भी उद्देश्य नहीं)।

संक्षेप में, अगर हम कच्चे डेटा की गुणवत्ता के बारे में गंभीर होना शुरू नहीं करते हैं, तो मुझे लगता है कि हम अपने स्वयं के सहित हर किसी के समय और धन को बर्बाद कर रहे हैं। तो क्या कोई सामाजिक विज्ञान के तरीकों के संबंध में एक 'डेटा गुणवत्ता पहल' पर सहयोग करना चाहता है (हाँ, ऐसी चीजों के बारे में पाठ्य पुस्तकों में बहुत कुछ है, लेकिन कोई भी उनकी परीक्षा के बाद उस स्रोत पर ध्यान नहीं देता है)।

जिस किसी के पास सबसे अधिक अकादमिक ग्रेविटास होता है, वह प्रमुख होता है! (यह मुझे नहीं होगा)

यहाँ मेरे उत्तर के बारे में स्पष्ट होने के लिए: मैं गंभीर मूलभूत मुद्दों को 'अक्सर' कच्चे डेटा प्रकारों के साथ देखता हूं, जो कि मैं शुरुआत में शुरू करने की आवश्यकता का सुझाव देना चाहूंगा। इसलिए, इससे पहले कि हम नमूने के बारे में चिंता करते हैं या जो डेटा पर चलने के लिए परीक्षण करते हैं, हमें उन मॉडलों के संबंध में डेटा प्रकारों की वैधता / सीमाओं को देखने की जरूरत है जिन्हें हम प्रस्तावित कर रहे हैं। अन्यथा समग्र पूर्वानुमान मॉडल को अपूर्ण रूप से परिभाषित किया गया है।


2
जब तक मुझे यकीन नहीं हो जाता, तब तक आप संदिग्ध शोधकर्ता निर्माणों का उदाहरण दे सकते हैं।
हॉरेसिट

4
मैं जरूरी नहीं कि आपके बहुत सारे बिंदुओं से असहमत हूं। लेकिन मैं सिर्फ यह बताना चाहता हूं कि मतदान के मामले में, मुझे लगता है कि हर पोलस्टर डेटा की गुणवत्ता के कारण सीमाओं के बारे में बेहद जागरूक है, लेकिन वास्तव में इसे सुधारने के लिए कोई विकल्प नहीं है (मेरा उत्तर देखें)। आपके उत्तर से लगता है कि प्रदूषक किसी भी उत्तर को बाहर निकालना चाहते हैं , डेटा गुणवत्ता के बारे में बिल्कुल भी परवाह नहीं करते। मुझे लगता है कि डेटा की गुणवत्ता के बारे में पोलिस्टर बहुत परवाह करते हैं, लेकिन यह भी महसूस करते हैं कि सबसे अच्छा उन्हें गंभीर संभावित खामियां मिल सकती हैं। आप ( "50% -50%!") छोड़ देना है या कुछ है कि बनाने की कोशिश कर सकते हैं उचित हो सकता है?
क्लिफ एबी एबी

टिप्पणियों के लिए मेरी प्रतिक्रिया आवश्यक रूप से थोड़ी लंबी थी, इसलिए इसे एक नए उत्तर के रूप में जोड़ा गया
कॉलिन

9

पोल में 5% का त्रुटि मार्जिन होता है, जिससे आप वास्तव में छुटकारा नहीं पा सकते हैं, क्योंकि यह एक यादृच्छिक त्रुटि नहीं है, बल्कि एक पूर्वाग्रह है। यहां तक ​​कि अगर आप कई चुनावों में औसत करते हैं, तो यह बहुत बेहतर नहीं है। यह गलत मतदाता समूहों, जुटाए जाने की कमी, एक कार्यदिवस में वोट देने में असमर्थता, जवाब देने की अनिच्छा , सही जवाब देने की अनिच्छा , सहज अंतिम मिनट के फैसलों के साथ करना है, ... क्योंकि यह पूर्वाग्रह "सहसंबद्ध" होने का है। चुनावों के दौरान, आप अधिक चुनावों से छुटकारा नहीं पा सकते हैं; आप बड़े नमूना आकारों के साथ भी इससे छुटकारा नहीं पा सकते हैं; और आप इस पूर्वाग्रह की भविष्यवाणी करने में सक्षम नहीं दिखाई देते हैं, क्योंकि यह बहुत तेजी से बदलता है (और हम राष्ट्रपति शायद ही कभी चुनते हैं)।

बेवकूफ के कारण विजेता-ले जाता है-सभी अभी भी सिद्धांत वर्तमान लगभग सभी राज्यों में, 5% की एक त्रुटि कर सकते हैं बहुत अलग परिणाम प्राप्त हो: चुनाव मान लें हमेशा 49-51 की भविष्यवाणी की, लेकिन असली परिणाम 51-49 इसलिए की एक त्रुटि थी ( सिर्फ 2%), परिणाम 100% बंद है; विजेता-ले-इट-ऑल के कारण।

यदि आप अलग-अलग राज्यों को देखते हैं, तो अधिकांश परिणाम अनुमानित त्रुटि मार्जिन के भीतर हैं!

संभवतः आप जो सबसे अच्छा कर सकते हैं वह इस पूर्वाग्रह (+ -5%) का नमूना है, विजेता-ले-सभी चरम पर लागू करें, फिर परिणामों को एकत्र करें। यह संभवतः 538 के समान है; और 30% नमूनों में डोनाल्ड ट्रम्प ने जीता ...


9
मैं इसे मतदान का "भयावह फ्रिंज सिद्धांत" कहता हूं: किसी भी सर्वेक्षण प्रश्न में, सभी उत्तरदाताओं का 5% एक पागल उत्तर देगा। किसी भी अनुभवजन्य सिद्धांत की तरह इसमें अपवाद हैं, लेकिन यह चुनाव परिणामों की समझ बनाने में मदद करने के लिए दशकों से अच्छी तरह से खड़ा है।
whuber

1
यदि यह केवल थे सिर्फ एक "पागल" जवाब। समस्या यह है कि यह व्यवस्थित है "यादृच्छिक पागल" नहीं। आप चुनाव को एक बाइनरी पोल मान सकते हैं, और बाइनरी में आप "पागल जवाब" क्या उम्मीद कर सकते हैं? लेकिन जाहिर है, बहुत से लोग जानबूझकर (?) गलत जवाब देते हैं, या बूथ में वास्तव में अलग होने का फैसला करते हैं, या फिर चुनावों में नहीं जाते हैं, ...
Anony-Mousse

3
@ एनी-मूस कोई फर्क नहीं पड़ता कि यह कितना सही है या नहीं हो सकता है, मैं यह देखने में विफल हूं कि किशोर का नाम-कॉल सांख्यिकीय विश्लेषण के लिए कैसे प्रासंगिक है।
जैरेड स्मिथ

ओह, यह एक अनमोल कहानी है। कुछ दिनों में, आपको चिंता करने के बजाय हंसना होगा कि भविष्यवाणी के परिणाम गलत क्यों हैं।
6:59 बजे एनोनी-मूस

टिप्पणियाँ विस्तारित चर्चा के लिए नहीं हैं; इस वार्तालाप को बातचीत में स्थानांतरित कर दिया गया है ।
गुंग

7

400,000

अंत में, इसने विषय वस्तु के ज्ञान की कमी के लिए संख्यात्मक विश्लेषण की एक बड़ी विफलता को उजागर किया। स्पष्ट कारणों से जीतने वाले उम्मीदवार को स्पष्ट रूप से गले लगाने के लिए लोगों को खुद पर शर्म आ रही थी।

सबसे खराब कंप्यूटर मॉडल परिणाम के करीब हो सकता है अगर किसी ने दरवाजे पर दस्तक देने के लिए प्रारंभिक पोल का सामना करने के लिए परेशान किया था। यहाँ एक उदाहरण है: ट्राफलगर समूह (कोई सम्बद्धता या ज्ञान जो इस प्रकार है) के अलावा पीए, एफएल, एमआई, जीए, यूटी और एनवी में ट्रम्प अग्रणी था (यह बाद की स्थिति अंततः चुनाव से पहले नीला हो गया)। क्या जादू था?

एक मानक बैलट टेस्ट और बैलट टेस्ट दोनों के लिए सर्वेक्षण उत्तरदाताओं का संयोजन [एसआईसी] जहां प्रतिवादी के पड़ोसी खड़े होते हैं। यह पारंपरिक मतदान के अंतर्निहित पूर्वाग्रह को संबोधित करता है, जिसमें उत्तरदाता अत्यधिक विवादास्पद उम्मीदवारों के बारे में अपनी स्थिति के बारे में पूरी तरह से सत्य नहीं हैं।

सुंदर कम तकनीक, वर्तनी-जांच की कमी सहित, मानव स्वभाव के बारे में बहुत कुछ दिखाती है। यहाँ PA में विसंगति है :

यहाँ छवि विवरण दर्ज करें

ऐतिहासिक पेंसिल्वेनिया - 9 नवंबर, 2016 को सुबह 1:40 बजे इस समापन अहसास से कुछ घंटे पहले डेमोक्रेटिक हार में अंतिम भूसे के रूप में माना जा रहा है:

यहाँ छवि विवरण दर्ज करें


2
पड़ोसियों के मतदान के इरादे के बारे में पूछना शानदार है - यह मेरे लिए उन चतुर चालों में से एक है जो कभी-कभी सांख्यिकी में उपयोग किए जाते हैं, जो एक उचित निराशाजनक पूर्वाग्रह के लिए सही (एक डिग्री, कम से कम) की अनुमति देते हैं। उस बारे में लिखने के लिए धन्यवाद, बहुत दिलचस्प!
डेल्टा 18

5

अमेरिकी चुनाव में जनमत सर्वेक्षण के कारणों में से एक, इसके अलावा कुछ लोगों के लिए जो भी कारण कहता है कि सच्चाई यह है कि "विजेता यह सब लेता है" प्रभाव भविष्यवाणियों को और भी कम आसान बना देता है। एक राज्य में 1% का अंतर एक राज्य की पूरी पारी को जन्म दे सकता है और पूरे परिणाम को बहुत अधिक प्रभावित कर सकता है। हिलेरी में अल गोर बनाम बुश की तरह ही अधिक मतदाता थे।

ब्रेक्सिट जनमत संग्रह एक सामान्य चुनाव नहीं था और इसलिए यह भविष्यवाणी करना भी कठिन था (कोई अच्छा ऐतिहासिक डेटा और हर कोई इस मामले पर पहली बार मतदाता जैसा था)। एक ही पार्टी के लिए दशकों तक वोट देने वाले लोग भविष्यवाणियों को स्थिर करते हैं।


2
बहुत अच्छा अवलोकन। प्रत्येक पक्ष और स्विंग राज्यों के लिए स्पष्ट राज्य थे। जबकि उनकी संख्या कम थी, वहां एक छोटे से परिवर्तन का प्रभाव वोटों की संख्या में बड़ा है। यह अमेरिका में एक बहुत ही जटिल, ऐतिहासिक रूप से विकसित मतदान योजना है।
ट्रिलियनियन

4

(बस इस उत्तर का उत्तर देते हुए, जैसा कि अन्य उत्तर सब कुछ कवर करते हैं।)

कल देर शाम 4 बजे पीएसटी के रूप में, सट्टेबाजी के बाजार अभी भी हिलेरी के 4 से 1 के पक्ष में थे। मुझे लगता है कि सट्टेबाजी के बाजार, लाइन पर असली पैसे के साथ, सभी उपलब्ध भविष्यवाणी मॉडल के कलाकारों की टुकड़ी के रूप में कार्य करना चाहिए।

नहीं ... लेकिन अप्रत्यक्ष रूप से हाँ।

सट्टे बाज़ारों को डिज़ाइन किया जाता है इसलिए बुकी जो भी होता है उससे लाभ कमाते हैं। उदाहरण के लिए, मौजूदा बाधाओं हिलेरी पर 1-4 और ट्रम्प पर 3-1 थे। अगर अगले दस लोग सभी हिलेरी पर $ 10 का दांव लगाते हैं , तो $ 100 लिया जाता है, अगर उन्हें हिलेरी जीत जाती है, तो उन्हें $ 25 खर्च करने होंगे । इसलिए उन्होंने हिलेरी को 1-5 से पीछे कर दिया, और ट्रम्प को 4-1 से बढ़ा दिया। अब अधिक लोग ट्रम्प पर दांव लगाते हैं, और संतुलन बहाल हो जाता है। यानी यह विशुद्ध रूप से इस बात पर आधारित है कि लोग कैसे पंडितों या भविष्यवाणी मॉडल पर दांव लगाते हैं।

लेकिन, ज़ाहिर है, सटोरियों के ग्राहक उन चुनावों को देख रहे हैं, और उन पंडितों को सुन रहे हैं। वे सुनते हैं कि हिलेरी 3% आगे है, जीतने के लिए एक मृत प्रमाण पत्र, और $ 10 बनाने के लिए एक त्वरित तरीका तय करना है कि उसके ऊपर $ 40 का दांव लगाया जाए ।

अप्रत्यक्ष रूप से पंडित और मतदान बाधाओं को आगे बढ़ा रहे हैं।

(कुछ लोग नोटिस करते हैं कि उनके सभी दोस्त काम पर ट्रम्प को वोट करने जा रहे हैं, इसलिए उन पर एक दांव लगाएं; अन्य लोग नोटिस करते हैं कि उनके सभी फेसबुक फ्रेंड के पोस्ट प्रो-हिलेरी हैं, इसलिए उन पर एक दांव लगाएं, इसलिए वास्तविकता का एक सा प्रभाव है उन्हें, इस तरह से।)


2

यह आश्चर्य की बात नहीं है कि ये प्रयास विफल हो गए, जब आप इस बात पर असमानता जताते हैं कि किन सूचनाओं के लिए मॉडल की पहुंच है और कौन सी जानकारी मतदान केंद्र पर व्यवहार को बढ़ाती है। मैं अटकलें लगा रहा हूं, लेकिन मॉडल शायद ध्यान में रखते हैं:

  • चुनाव पूर्व चुनाव परिणामों की एक किस्म
  • ऐतिहासिक स्थिति झुकाव (नीला / लाल)
  • वर्तमान राज्य झुकाव / अनुमानों के साथ पूर्व चुनावों के ऐतिहासिक परिणाम

लेकिन, चुनाव पूर्व चुनाव अविश्वसनीय होते हैं (हमने अतीत में लगातार विफलताओं को देखा है), राज्य फ्लिप कर सकते हैं, और हमारे इतिहास में पर्याप्त चुनावी चक्र नहीं हो सकते हैं, जो परिस्थितियों की भीड़, और क्या कर सकते हैं, के लिए जिम्मेदार हैं। ।

एक और जटिलता चुनावी कॉलेज के साथ लोकप्रिय वोट का संगम है। जैसा कि हमने इस चुनाव में देखा, एक राज्य के भीतर लोकप्रिय वोट बेहद करीबी हो सकता है, लेकिन एक बार राज्य जीतने के बाद, सभी वोट एक उम्मीदवार के पास जाते हैं, यही वजह है कि नक्शा इतना लाल हो गया है।


1

मतदान के मॉडल ने यह नहीं माना कि वास्तविक मतदान के दौरान जॉनसन से ट्रम्प तक कितने लिबर्टेरियन स्विच कर सकते हैं । जिन राज्यों को मामूली अंतर से जीत मिली थी, वे जॉनसन को मिले वोट के प्रतिशत के आधार पर जीते गए थे। पीए (जिसने चुनाव की रात ट्रम्प को पिछले 270 पर धकेल दिया) ने जॉनसन को केवल 2% दिया। NH (जो क्लिंटन के पास गया) ने जॉनसन को 4% + दिया। चुनाव से एक दिन पहले जॉनसन 4% -5% मतदान कर रहे थे और चुनाव के दिन उन्हें लगभग 3% मिला।

तो लिबर्टेरियन, चुनाव के दिन अचानक क्यों बदल गए? लिबर्टेरियन मतदाताओं के लिए केंद्रीय मुद्दा क्या था, इस पर किसी ने विचार नहीं किया। वे संविधान की शाब्दिक व्याख्या को कैनन के रूप में देखते हैं। क्लिंटन को वोट देने वाले अधिकांश लोगों ने यह नहीं सोचा था कि कानून की उसकी बर्खास्तगी विचार करने के लिए पर्याप्त उच्च प्राथमिकता थी। निश्चित रूप से, ट्रम्प के बारे में जो कुछ भी उन्हें पसंद नहीं था, उससे अधिक नहीं।

भले ही उसकी कानूनी मुसीबतें दूसरों के लिए महत्वपूर्ण हों या न हों, वे लिबर्टेरियन के लिए महत्वपूर्ण होंगे। वे किसी ऐसे व्यक्ति को कार्यालय से बाहर रखने पर बहुत अधिक प्राथमिकता देंगे जो कानूनी अनुपालन को वैकल्पिक रूप से देखता हो। इसलिए, उनमें से एक बड़ी संख्या के लिए, क्लिंटन को कार्यालय से बाहर रखना एक बयान बनाने की तुलना में एक उच्च प्राथमिकता बन जाएगा कि लिबर्टेरियन दर्शन एक व्यवहार्य राजनीतिक दर्शन है।

उनमें से बहुत से लोग शायद ट्रम्प को पसंद भी नहीं करते होंगे, लेकिन अगर उन्हें लगता है कि वह क्लिंटन की तुलना में कानून के शासन का अधिक सम्मान करेंगे, तो व्यावहारिकता ने उनमें से बहुतों के लिए सिद्धांतों पर जीत हासिल की होगी और इसके कारण उन्हें अपना वोट स्विच करना पड़ेगा। वोट देने का समय आ गया।


एनएच के पास वहां रहने वाले मुफ्त राज्य परियोजना से सभी लोग हैं। उदारवादी पार्टी और सक्रिय समर्थकों का समर्थन।
जॉन

@ जॉन, एनएच लिबर्टेरियन जॉनसन (4%) के साथ फंस गए। ट्रम्प ने राज्य को 1% से खो दिया।
दिमित्री रुबनोविच

मैं समझता हूँ कि। मैं यह समझाने की कोशिश कर रहा था कि स्वतंत्र पार्टी एनएच में मजबूत है।
जॉन

@ जॉन, लेकिन यह सिर्फ एनएच नहीं है। मिनेसोटा: जॉनसन 4%, ट्रम्प 2% से हार गए; एनवी (बनाने के लिए एक कठिन तर्क, लेकिन अभी भी प्रवृत्ति है): जॉनसन 3.5%, ट्रम्प 2% से हार गए; मेन: जॉनसन 5%, ट्रम्प 3% से हार गए; कोलोराडो जॉनसन 5%, ट्रम्प 3% से हार गए।
दिमित्री रूबनोविच

अफाक, चुनाव संभावित वोट-स्विचिंग के बारे में पूछते हैं और पूर्वानुमान इसे ध्यान में रखते हैं। क्या आपके पास कोई ऐसी जानकारी है जो यह बताती है कि चुनाव से पहले ऐसी कोई जानकारी थी जिसे किसी भी पूर्वानुमान पर ध्यान नहीं दिया गया था या यह एक शुद्ध अटकल है?
टिम

1

पोल ऐतिहासिक रुझान नहीं हैं। एक बायेसियन ऐतिहासिक रुझानों के रूप में पूछताछ करेगा। अब्राहम लिंकन के बाद से, एक रिपब्लिकन पार्टी और एक डेमोक्रेटिक पार्टी राष्ट्रपति पद पर रही है। तब से 16 बार पार्टी बदलने का चलन है, विकिपीडिया से निम्न संचयी सामूहिक कार्य है

यहाँ छवि विवरण दर्ज करें

x

पत्रकारों, डेमोक्रेटिक पार्टी, और प्रदूषक लोगों को लगता है कि बाधाओं को जीतने वाले उदारवादियों के पक्ष में थे। व्यवहार, सीमा के भीतर, पूर्वानुमान योग्य हो सकता है, लेकिन इस मामले में डेमोक्रेट्स यह चाह रहे थे कि लोग बदलाव के लिए मतदान न करें, और एक ऐतिहासिक दृष्टिकोण से, ऐसा लगता है कि संभावना है कि एक से अधिक नहीं होंगे।


0

मुझे लगता है कि मतदाताओं की जनसांख्यिकी को मानने की हद तक जनमत सर्वेक्षणों को एक्स्ट्रापोर्टल किया गया था, जो मतदाता के जनसांख्यिकी के समान होगा और पूरी आबादी का अच्छा प्रतिनिधित्व होगा। उदाहरण के लिए, यदि 10 में से 7 अल्पसंख्यकों ने चुनावों में हिलेरी का समर्थन किया, और यदि वह अल्पसंख्यक अमेरिकी आबादी के 30% का प्रतिनिधित्व करता है, तो चुनाव में बहुमत के 30% मतदाताओं को उस अल्पसंख्यक द्वारा प्रतिनिधित्व किया जाएगा और उस 21% लाभ का अनुवाद किया जाएगा। हिलेरी। वास्तविकता में मतदाताओं के बीच सफेद, मध्यम से उच्च वर्ग के पुरुषों का बेहतर प्रतिनिधित्व था। 50% से कम पात्र लोगों ने मतदान किया और यह सभी लिंग, दौड़, आदि से 50% में परिवर्तित नहीं हुआ।

या, चुनावों ने पूर्ण यादृच्छिकरण मान लिया और उस पर अपने मॉडल आधारित थे लेकिन वास्तव में मतदाता डेटा पुराने मध्यम से उच्च वर्ग के पुरुषों की ओर पक्षपाती था।

या, चुनावों ने बिल्कुल सही रैंडमाइजेशन नहीं किया, लेकिन उनके एक्सट्रपलेशन मापदंडों ने मतदाता भौगोलिक की विषमता को कम करके आंका।

ईटीए: पिछले दो चुनावों के मतदान ने बेहतर प्रदर्शन किया क्योंकि उन समूहों द्वारा मतदान पर ध्यान दिया गया जो आमतौर पर अच्छी तरह से प्रतिनिधित्व नहीं करते हैं।


जहाँ तक मुझे पता है, सभी चुनाव 'संभावित मतदाताओं' पर अपनी भविष्यवाणियों को आधार बनाते हैं। मैं चुनावों की कल्पना नहीं कर सकता कि मान लें कि 20 वर्ष की उम्र के लिए 70 वर्ष के रूप में मतदान करने का मौका है। अधिक केंद्रीय समस्या लगती है: किसी को वोट देने की कितनी संभावना है?
१६

जनसांख्यिकी के लिए लेखांकन सबसे आसान हिस्सा है। आप वास्तविक जनसंख्या के लिए अपनी नमूना जनसंख्या को पुनः लोड करते हैं। मतदाता टर्न-आउट और अन्य उत्तरों में उल्लिखित पक्षपात के लिए लेखांकन बहुत कठिन है, हालांकि।
ग्रिफ़ेर

इन मुद्दों को प्रदूषक कैसे संबोधित करते हैं, इस बारे में विविधता है। पार्टी की संबद्धता के आधार पर कुछ जनसांख्यिकी असंतुलन या असंतुलन, दूसरों को नहीं। लेकिन, चूंकि मॉडल में मतदान औसत का उपयोग करने पर भिन्नता है, इसलिए अंतिम परिणाम ऐसा करने की एक विधि के लिए विशेष रूप से समस्याओं के लिए मजबूत होना चाहिए जो अन्य चुनावों द्वारा साझा नहीं किया जाता है, विशेष रूप से विशेष रूप से ऐतिहासिक पक्षपातपूर्ण गैसों (यानी घर के प्रभाव) के लिए नियंत्रित करने के बाद मतदान संचालन। औसत मतदान परिणामों में समस्याओं को साझा तरीकों या प्रभावों से आना पड़ता है, न कि प्रत्येक मतदान के तरीकों पर।
ओह्वीलके

0

होरेस और क्लिफ़ैब (टिप्पणियों के लिए बहुत लंबा खेद) मुझे डर है कि मेरे पास जीवन भर के उदाहरण हैं, जिन्होंने मुझे यह भी सिखाया है कि मुझे उनके स्पष्टीकरण से बहुत सावधान रहने की आवश्यकता है, अगर मैं अपमानजनक लोगों से बचना चाहता हूं। इसलिए जब मैं आपका भोग नहीं चाहता, मैं आपके धैर्य की माँग करता हूँ। यहाँ जाता हैं:

एक चरम उदाहरण के साथ शुरू करने के लिए, मैंने एक बार एक प्रस्तावित सर्वेक्षण प्रश्न देखा, जिसमें अनपढ़ ग्रामीण किसानों (दक्षिण पूर्व एशिया) से पूछा गया था, ताकि उनकी 'आर्थिक वापसी की दर' का अनुमान लगाया जा सके। प्रतिक्रिया विकल्पों को अभी के लिए छोड़कर, हम उम्मीद कर सकते हैं कि सभी यह देख सकते हैं कि यह बेवकूफी है, लेकिन लगातार यह बताते हुए कि यह बेवकूफ क्यों है, इतना आसान नहीं है। हां, हम बस यह कह सकते हैं कि यह मूर्खतापूर्ण है क्योंकि प्रतिवादी प्रश्न को नहीं समझेगा और इसे केवल एक शब्दार्थ के रूप में खारिज कर देगा। लेकिन यह वास्तव में एक शोध के संदर्भ में काफी अच्छा नहीं है। यह तथ्य कि इस सवाल का कभी सुझाव दिया गया था कि शोधकर्ताओं ने 'मूर्खता' पर विचार करने पर अंतर्निहित परिवर्तनशीलता है। इसे और अधिक उद्देश्यपूर्ण तरीके से संबोधित करने के लिए, हमें इस तरह की चीजों के बारे में निर्णय लेने के लिए एक प्रासंगिक ढांचे की घोषणा करनी चाहिए। ऐसे कई विकल्प हैं,

तो, चलिए पारदर्शी रूप से मान लेते हैं कि हमारे पास दो बुनियादी जानकारी प्रकार हैं जिन्हें हम विश्लेषण में उपयोग कर सकते हैं: गुणात्मक और मात्रात्मक। और यह कि दोनों एक परिवर्तनकारी प्रक्रिया से संबंधित हैं, जैसे कि सभी मात्रात्मक जानकारी गुणात्मक जानकारी के रूप में शुरू हुई लेकिन निम्नलिखित (ओवरसिम्प्लीफाइड) चरणों से गुजरी:

  1. कन्वेंशन सेटिंग (जैसे कि हम सभी ने फैसला किया कि [हम इसे व्यक्तिगत रूप से कैसे समझते हैं] इसकी परवाह किए बिना, कि हम सभी एक दिन के खुले आकाश के रंग को "नीला" कहेंगे।)
  2. वर्गीकरण (जैसे हम इस सम्मेलन द्वारा एक कमरे में सब कुछ का आकलन करते हैं और सभी वस्तुओं को 'ब्लू' या 'ब्लू नहीं' श्रेणियों में अलग करते हैं)
  3. गणना करें (हम कमरे में नीली चीजों की 'मात्रा' की गणना / पता लगाते हैं)

ध्यान दें कि चरण 1 के बिना (इस मॉडल के तहत), गुणवत्ता जैसी कोई चीज नहीं है और यदि आप चरण 1 से शुरू नहीं करते हैं, तो आप कभी भी सार्थक मात्रा उत्पन्न नहीं कर सकते हैं।

एक बार कहा गया है, यह सब बहुत स्पष्ट दिखता है, लेकिन यह पहले सिद्धांतों का ऐसा सेट है जो (मुझे लगता है) सबसे अधिक अनदेखी है और इसलिए परिणाम 'कचरा-इन' है।

इसलिए उपरोक्त उदाहरण में 'मूर्खता' शोधकर्ता और उत्तरदाताओं के बीच एक आम सम्मेलन को स्थापित करने में विफलता के रूप में बहुत स्पष्ट रूप से निश्चित है। बेशक यह एक चरम उदाहरण है, लेकिन बहुत अधिक सूक्ष्म गलतियां समान रूप से कचरा पैदा कर सकती हैं। एक अन्य उदाहरण मैंने देखा है कि ग्रामीण सोमालिया में किसानों का एक सर्वेक्षण है, जिसमें पूछा गया है कि "जलवायु परिवर्तन ने आपकी आजीविका को कैसे प्रभावित किया है?" संयुक्त राज्य अमेरिका शोधकर्ता और प्रतिवादी (यानी जैसा कि 'जलवायु परिवर्तन' के रूप में मापा जा रहा है) के बीच एक आम सम्मेलन का उपयोग करने के लिए एक गंभीर विफलता का गठन करेगा।

अब हम प्रतिक्रिया विकल्पों पर चलते हैं। कई विकल्प विकल्पों या इसी तरह के निर्माण के एक सेट से स्वयं-कोड प्रतिक्रियाओं के लिए उत्तरदाताओं को अनुमति देकर आप इस 'सम्मेलन' मुद्दे को पूछताछ के इस पहलू में भी धकेल रहे हैं। यह ठीक हो सकता है यदि हम सभी प्रतिक्रिया श्रेणियों में प्रभावी रूप से 'सार्वभौमिक' सम्मेलनों से चिपके रहते हैं (जैसे सवाल: आप किस शहर में रहते हैं? प्रतिक्रिया श्रेणियां: अनुसंधान क्षेत्र के सभी शहरों की सूची [प्लस 'इस क्षेत्र में नहीं है]]। हालांकि, कई शोधकर्ता वास्तव में अपनी आवश्यकताओं को पूरा करने के लिए अपने सवालों और प्रतिक्रिया श्रेणियों की सूक्ष्म बारीकियों पर गर्व करने लगते हैं। उसी सर्वेक्षण में, जो 'आर्थिक प्रतिफल की दर' प्रश्न प्रकट हुआ, शोधकर्ता ने उत्तरदाताओं (गरीब ग्रामीणों) से यह भी पूछा कि वे किस आर्थिक क्षेत्र में योगदान देते हैं: 'उत्पादन', 'सेवा' की प्रतिक्रिया श्रेणियों के साथ, 'विनिर्माण' और 'विपणन'। फिर से एक गुणात्मक सम्मेलन का मुद्दा स्पष्ट रूप से यहां उठता है। हालाँकि, क्योंकि उन्होंने प्रतिक्रियाओं को पारस्परिक रूप से अनन्य बना दिया, जैसे कि उत्तरदाता केवल एक विकल्प चुन सकते थे (क्योंकि "एसपीएसएस में फीड करना आसान है"), और गाँव के किसान नियमित रूप से फसल पैदा करते हैं, अपना श्रम बेचते हैं, हस्तशिल्प का निर्माण करते हैं और सब कुछ लेते हैं। स्थानीय बाजारों में, इस विशेष शोधकर्ता के पास केवल अपने उत्तरदाताओं के साथ एक सम्मेलन का मुद्दा नहीं था, वह वास्तविकता के साथ एक था।

यही कारण है कि अपने आप जैसे पुराने बोर हमेशा डेटा पोस्ट-कलेक्शन के लिए कोडिंग लागू करने के अधिक कार्य गहन दृष्टिकोण की सिफारिश करेंगे - जैसा कि कम से कम आप शोधकर्ता-आयोजित सम्मेलनों में कोडर्स को पर्याप्त रूप से प्रशिक्षित कर सकते हैं (और ध्यान दें कि उत्तरदाताओं के लिए इस तरह के सम्मेलनों को लागू करने की कोशिश की जा रही है) सर्वेक्षण निर्देश 'एक मग का खेल है-अब इस पर मेरा विश्वास करो)। यह भी ध्यान दें कि यदि आप उपरोक्त 'सूचना मॉडल' को स्वीकार करते हैं (जो कि, फिर से, मैं दावा नहीं कर रहा हूं कि आपके पास है), तो यह भी पता चलता है कि क्यों अर्ध-सहायक प्रतिक्रिया तराजू की प्रतिष्ठा खराब है। यह स्टीवन के अधिवेशन के तहत सिर्फ मूल गणित के मुद्दे नहीं हैं (यानी आपको अध्यादेशों के लिए भी एक सार्थक मूल को परिभाषित करने की आवश्यकता है, आप उन्हें जोड़ नहीं सकते हैं और औसत कर सकते हैं, आदि)। यह भी है कि वे अक्सर किसी भी पारदर्शी रूप से घोषित और तार्किक रूप से सुसंगत परिवर्तनकारी प्रक्रिया के माध्यम से कभी नहीं होते हैं, जो कि 'परिमाणीकरण' के बराबर होता है (अर्थात ऊपर उपयोग किए गए मॉडल का एक विस्तारित संस्करण भी 'क्रमिक मात्रा' की पीढ़ी को घेरता है] [लेकिन यह कठिन नहीं है। करने के लिए])। वैसे भी, अगर यह या तो गुणात्मक या मात्रात्मक जानकारी होने की आवश्यकताओं को पूरा नहीं करता है, तो शोधकर्ता वास्तव में ढांचे के बाहर एक नई प्रकार की जानकारी की खोज करने का दावा कर रहा है, और इसलिए उन पर इसका मौलिक वैचारिक आधार पूरी तरह से समझाने के लिए है ( अर्थात पारदर्शी रूप से एक नई रूपरेखा को परिभाषित करना)।

अंत में आइए नमूने के मुद्दों को देखें (और मुझे लगता है कि यह पहले से ही यहां दिए गए कुछ अन्य उत्तरों के साथ संरेखित है)। उदाहरण के लिए, यदि कोई शोधकर्ता एक ऐसा सम्मेलन लागू करना चाहता है जो 'उदार' मतदाता का गठन करता है, तो उन्हें यह सुनिश्चित करने की आवश्यकता है कि वे अपने नमूनाकरण शासन को चुनने के लिए जिस जनसांख्यिकीय जानकारी का उपयोग करते हैं वह इस सम्मेलन के अनुरूप है। यह स्तर आमतौर पर पहचानने और निपटने के लिए सबसे आसान है क्योंकि यह काफी हद तक शोधकर्ता नियंत्रण के भीतर है और सबसे अधिक बार ऐसा माना जाता है कि यह गुणात्मक सम्मेलन है जिसे पारदर्शी रूप से अनुसंधान में घोषित किया गया है। यह इसलिए भी है क्योंकि यह आम तौर पर चर्चित या आलोचनात्मक स्तर है, जबकि अधिक मौलिक मुद्दे असंसदीय हैं।

इसलिए जब मतदाता do आप इस समय के लिए वोट करने की योजना किससे? ’जैसे सवालों से चिपके रहते हैं, तो हम शायद अभी भी ठीक हैं, लेकिन उनमें से बहुत से इस से अधिक ci कट्टर’ प्राप्त करना चाहते हैं…

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.