मुझे लगता है कि आपको उनसे पूछना शुरू करना चाहिए कि उन्हें क्या लगता है कि वास्तव में किसी व्यक्ति के बारे में कहने का मतलब है कि वह कोका-कोला और पेप्सी के बीच का अंतर बताने में सक्षम है। ऐसा व्यक्ति क्या कर सकता है जो दूसरे नहीं कर सकते?
उनमें से अधिकांश के पास ऐसी कोई परिभाषा नहीं होगी, और यदि पूछा जाए तो वे एक उत्पादन नहीं कर पाएंगे। हालांकि, उस वाक्यांश का एक अर्थ वह है जो आंकड़े हमें देते हैं, और वह वह है जो आप अपने "सांख्यिकी के लिए एक स्वाद" वर्ग के साथ ला सकते हैं।
आंकड़ों के बिंदुओं में से एक प्रश्न का सटीक उत्तर देना है: "किसी के कहने का क्या मतलब है कि वह कोका-कोला और पेप्सी के बीच अंतर बताने में सक्षम है"
जवाब है: वह या वह अंदाजा लगाने की मशीन से बेहतर है कि वह एक अंधे परीक्षण में कपों को वर्गीकृत करे। अनुमान लगाने वाली मशीन अंतर नहीं बता सकती है, यह बस हर समय अनुमान लगाती है। अनुमान लगाने की मशीन हमारे लिए एक उपयोगी आविष्कार है क्योंकि हम जानते हैं कि यह करता है क्षमता नहीं है। अनुमान लगाने की मशीन के परिणाम उपयोगी होते हैं क्योंकि वे दिखाते हैं कि हमें किसी ऐसे व्यक्ति से उम्मीद करनी चाहिए जिसके पास उस क्षमता की कमी है जिसके लिए हम परीक्षण करते हैं।
यह जांचने के लिए कि क्या कोई व्यक्ति कोका-कोला और पेप्सी के बीच का अंतर बताने में सक्षम है, किसी को अपने अंडकोष के कपों के वर्गीकरण में तुलना करनी चाहिए जो वर्गीकरण का अनुमान लगाता है। केवल अगर वह अनुमान लगाने की मशीन से बेहतर है, तो वह अंतर बताने में सक्षम है।
फिर, आप यह कैसे निर्धारित करते हैं कि एक परिणाम दूसरे परिणाम से बेहतर है? यदि वे लगभग समान हैं तो क्या होगा ?
यदि दो व्यक्ति कम संख्या में कपों का वर्गीकरण करते हैं, तो यह कहना वास्तव में उचित नहीं है कि यदि परिणाम लगभग समान हैं तो एक दूसरे से बेहतर है । शायद विजेता आज भाग्यशाली हुआ, और अगर कल प्रतियोगिता दोहराई जाती तो परिणाम उलट होते?
यदि हमारे पास भरोसेमंद परिणाम होना है, तो यह बहुत सारे वर्गीकरण पर आधारित नहीं हो सकता है, क्योंकि तब मौका परिणाम को तय कर सकता है। याद रखें, आपके पास क्षमता होने के लिए सही नहीं है, आपको सिर्फ अनुमान लगाने की मशीन से बेहतर होना चाहिए। वास्तव में, यदि वर्गीकरण की संख्या बहुत कम है, तो एक व्यक्ति भी नहीं जो हमेशा कोका-कोला की सही पहचान करता है, वह दिखाएगा कि वह अनुमान लगाने की मशीन से बेहतर है। उदाहरण के लिए, यदि वर्गीकरण करने के लिए केवल एक कप है, तो भी अनुमान लगाने की मशीन में पूरी तरह से सही वर्गीकरण के लिए 50 प्रतिशत मौका होगा। यह अच्छा नहीं है, क्योंकि इसका मतलब है कि 50 प्रतिशत परीक्षणों में, हम गलत तरीके से निष्कर्ष निकालेंगे कि एक अच्छा कोका-कोला पहचानकर्ता अनुमान लगाने वाली मशीन से बेहतर नहीं है। बहुत अनुचित है।
अधिक कप वर्गीकृत करने के लिए हैं, अनुमान लगाने की मशीन की अक्षमता के लिए अधिक अवसर और अच्छा कोका-कोला पहचानकर्ता के लिए अधिक अवसर दिखावा करने के लिए।
10 कप शुरू करने के लिए एक अच्छी जगह हो सकती है। एक मानव को कितने सही जवाब देने होंगे, फिर यह दिखाना होगा कि वह मशीन से बेहतर है या नहीं?
उनसे पूछें कि वे क्या अनुमान लगाएंगे।
फिर उन्हें मशीन का उपयोग करने दें और पता करें कि यह कितना अच्छा है, अर्थात सभी विद्यार्थियों को दस अनुमानों की एक श्रृंखला उत्पन्न करने दें, जैसे। स्मार्टफोन पर पासा या यादृच्छिक जनरेटर का उपयोग करना। शैक्षणिक होने के लिए, आपको दस सही उत्तरों की एक श्रृंखला तैयार करनी चाहिए, जिनके बारे में अनुमान लगाया जाना है।
बोर्ड पर सभी परिणामों को रिकॉर्ड करें। बोर्ड पर हल किए गए परिणामों को प्रिंट करें। बता दें कि एक सांख्यिकीविद को कोका-कोला और पेप्सी के बीच अंतर बताने की उनकी क्षमता को स्वीकार करने से पहले मानव को उन परिणामों में से 95 प्रतिशत से बेहतर होना होगा। शीर्ष 5% परिणामों से 95% सबसे खराब परिणामों को अलग करने वाली रेखा खींचें।
फिर, कुछ विद्यार्थियों को 10 कपों को वर्गीकृत करने का प्रयास करने दें। अब तक विद्यार्थियों को पता होना चाहिए कि उन्हें यह साबित करने के लिए कितने अधिकार की आवश्यकता है कि वे अंतर बता सकते हैं।
यह सब वास्तव में 10 मिनट में संभव नहीं है।