नैट सिल्वर की पुस्तक द सिग्नल एंड द नॉइज़ में वे निम्नलिखित लिखते हैं, जो आपके प्रश्न के लिए कुछ अंतर्दृष्टि प्रदान कर सकते हैं:
पूर्वानुमान के सबसे महत्वपूर्ण परीक्षणों में से एक - मेरा तर्क है कि यह एकल सबसे महत्वपूर्ण है - अंशांकन कहा जाता है। हर समय आपने कहा कि बारिश की 40% संभावना थी, वास्तव में बारिश कितनी बार हुई? यदि, लंबे समय तक, यह वास्तव में बारिश का लगभग 40% था, इसका मतलब है कि आपके पूर्वानुमान अच्छी तरह से कैलिब्रेट किए गए थे। यदि इसके बजाय यह केवल 20 प्रतिशत समय या 60 प्रतिशत समय तक बारिश हो रही है, तो वे नहीं थे।
तो यह कुछ बिंदुओं को उठाता है। सबसे पहले, जैसा कि आप सही ढंग से इंगित करते हैं, आप वास्तव में किसी भी पूर्वानुमान की गुणवत्ता के बारे में कोई अनुमान नहीं लगा सकते हैं जो कि आप पूर्वानुमान लगा रहे हैं। सबसे अच्छा आप यह देख सकते हैं कि आपका मॉडल कई भविष्यवाणियों के दौरान कैसा प्रदर्शन करता है।
एक और बात जो सोचना महत्वपूर्ण है, वह यह है कि नैट सिल्वर प्रदान करने वाली भविष्यवाणियां स्वयं एक घटना नहीं हैं, लेकिन घटना की संभावना वितरण। इसलिए राष्ट्रपति पद की दौड़ में, वह क्लिंटन, ट्रम्प या जॉनसन के दौड़ जीतने की संभावना वितरण का अनुमान लगा रहे हैं। तो इस मामले में वह एक बहुराष्ट्रीय वितरण का अनुमान लगा रहा है।
लेकिन वह वास्तव में अधिक दानेदार स्तर पर दौड़ की भविष्यवाणी कर रहा है। उनकी भविष्यवाणियां अनुमान लगाती हैं कि प्रत्येक राज्य में प्रत्येक उम्मीदवार के मतों के प्रतिशत की संभाव्यता वितरण होगा। इसलिए यदि हम 3 उम्मीदवारों पर विचार करते हैं, तो इसकी लंबाई 51 * 3 के यादृच्छिक वेक्टर की विशेषता हो सकती है और अंतराल [0, 1] में मान ले सकते हैं, जो एक राज्य के अनुपात में 1 के अनुपात के लिए बाधा के अधीन है। संख्या ५१ इसलिए है क्योंकि अन्य ५० राज्यों + डीसी हैं (और वास्तव में मुझे लगता है कि यह वास्तव में कुछ और है क्योंकि कुछ राज्य अपने चुनावी कॉलेज वोटों को विभाजित कर सकते हैं), और संख्या ३ उम्मीदवारों की संख्या के कारण है।
अब आपके पास अपनी भविष्यवाणियों का मूल्यांकन करने के लिए बहुत अधिक डेटा नहीं है - वह केवल पिछले 3 चुनावों के लिए भविष्यवाणियां प्रदान करता है, जिनके बारे में मुझे पता है (क्या वहां अधिक था?)। इसलिए मुझे नहीं लगता कि उसके मॉडल का निष्पक्ष मूल्यांकन करने का कोई तरीका है, जब तक कि वास्तव में आपके पास मॉडल नहीं था और नकली डेटा का उपयोग करके इसका मूल्यांकन कर सकता था। लेकिन अभी भी कुछ दिलचस्प चीजें हैं जिन्हें आप देख सकते हैं। उदाहरण के लिए, मुझे लगता है कि यह देखना दिलचस्प होगा कि उन्होंने एक विशेष समय बिंदु पर राज्य-दर-राज्य मतदान अनुपात का सटीक अनुमान लगाया, उदाहरण के लिए चुनाव से एक सप्ताह पहले। यदि आप इसे कई समय बिंदुओं के लिए दोहराते हैं, जैसे एक सप्ताह बाहर, एक महीना बाहर, 6 महीने और एक साल बाहर, तो आप उसकी भविष्यवाणियों के लिए कुछ बहुत ही रोचक प्रदर्शनी दे सकते हैं। एक महत्वपूर्ण चेतावनी: चुनाव के दौरान राज्यों में परिणाम बहुत अधिक सहसंबद्ध होते हैं, इसलिए आप वास्तव में यह नहीं कह सकते हैं कि आपके पास 51 राज्य * 3 चुनाव स्वतंत्र भविष्यवाणी उदाहरण हैं (अर्थात यदि मॉडल एक राज्य में उम्मीदवारों के प्रदर्शन को कम आंकता है, तो यह अन्य राज्यों में भी कम हो जाएगा) । लेकिन शायद मैं इसे इस तरह से भी सोचूंगा, ताकि आपके पास कुछ भी सार्थक करने के लिए पर्याप्त डेटा हो।