अन्य उत्तरों के विपरीत, मेरा तर्क है कि आप उपलब्ध आंकड़ों के अनुसार बोल्ट क्षमताओं के बारे में कुछ कह सकते हैं। सबसे पहले, आइए अपने प्रश्न को छोटा करें। आप सबसे तेजी से मानव के बारे में पूछ रहे हैं, लेकिन चूंकि पुरुषों और महिलाओं के लिए दौड़ने की गति के वितरण में अंतर है, जहां सबसे अच्छी महिला धावक महिला थोड़ी धीमी लगती है तो सबसे अच्छा पुरुष धावक, हमें पुरुष धावक पर ध्यान देना चाहिए। कुछ डेटा प्राप्त करने के लिए, हम पिछले 45 वर्षों से 100 रन पर सर्वश्रेष्ठ वर्ष के प्रदर्शन को देख सकते हैं । इस डेटा के बारे में कई बातें हैं:
- वे सबसे अच्छे चलने वाले समय हैं, इसलिए वे हमें सभी मनुष्यों की क्षमताओं के बारे में नहीं बताते हैं, लेकिन न्यूनतम प्राप्त गति के बारे में बताते हैं ।
- हम मानते हैं कि यह डेटा दुनिया के सर्वश्रेष्ठ धावकों के नमूने को दर्शाता है। हालांकि ऐसा हो सकता है कि बेहतर धावक भी थे जो चैंपियनशिप में भाग नहीं लेते थे, यह धारणा काफी हद तक उचित प्रतीत होती है।
पहले, आइए चर्चा करें कि इस डेटा का विश्लेषण कैसे नहीं किया जाए। आप देख सकते हैं कि यदि हम समय के खिलाफ चलने की साजिश करते हैं, तो हम एक मजबूत रैखिक संबंध का निरीक्षण करेंगे।
यह आपको पूर्वानुमान लगाने के लिए रैखिक प्रतिगमन का उपयोग करने के लिए प्रेरित कर सकता है कि हम अगले वर्षों में कितना बेहतर धावक देख सकते हैं। लेकिन यह एक बहुत बुरा विचार होगा, जो आपको यह निष्कर्ष निकालने के लिए मजबूर कर देगा कि लगभग दो हजार वर्षों में मनुष्य शून्य सेकंड में 100 मीटर दौड़ने में सक्षम होंगे, और इसके बाद वे नकारात्मक समय को प्राप्त करना शुरू कर देंगे! यह स्पष्ट रूप से बेतुका है, क्योंकि हम कल्पना कर सकते हैं कि हमारी क्षमताओं की कुछ प्रकार की जैविक और भौतिक सीमा है, जो हमारे लिए अज्ञात है।
X 1 , X 2 , … , X n Y i Z 1 , Z 2 , … , Z k - Z iY= अधिकतम ( एक्स)1, एक्स2, ... , एक्सn)एक्स1, एक्स2, ... , एक्सnYमैंजेड1, जेड2, ... , जेडक- जेडमैंन्यूनतम के लिए एक GEV वितरण का पालन करें। इसलिए हम GEV वितरण को रनिंग स्पीड डेटा में फिट कर सकते हैं, जो बहुत अच्छा फिट होता है (नीचे देखें)।
यदि आप मॉडल द्वारा सुझाए गए संचयी वितरण को देखते हैं, तो आप देखेंगे कि उसैन बोल्ट द्वारा सबसे अच्छा चलने का समय सबसे कम1 %वितरण की पूंछ। इसलिए यदि हम इस डेटा, और इस खिलौना-उदाहरण विश्लेषण से चिपके रहते हैं, तो हम यह निष्कर्ष निकालेंगे कि बहुत कम चलने वाले समय की संभावना नहीं है (लेकिन जाहिर है, संभव है)। इस विश्लेषण के साथ स्पष्ट समस्या यह है कि इस तथ्य को नजरअंदाज कर दिया जाए कि हमने साल-दर-साल के सुधारों को सबसे अच्छे तरीके से देखा है। यह हमें उत्तर के पहले भाग में वर्णित समस्या पर वापस लाता है, अर्थात यहाँ प्रतिगमन मॉडल को जोखिम भरा मानना। एक और चीज़ जो बेहतर हो सकती है वह यह है कि हम बायेसियन दृष्टिकोण का उपयोग कर सकते हैं और पहले से सूचनात्मक मान सकते हैं जो कि भौतिक रूप से संभव चल रहे समय के बारे में कुछ डेटा-आउट ज्ञान के लिए जिम्मेदार होगा, जिसे अभी तक नहीं देखा जा सकता है (लेकिन, जहां तक मुझे पता है, यह वर्तमान समय में अज्ञात है)। अंत में, इसी तरह के चरम मूल्य सिद्धांत का उपयोग पहले से ही खेल अनुसंधान में किया गया था, उदाहरण के लिए आइंमहल और मैग्नस (2008) द्वाराएक्सट्रीम-वैल्यू थ्योरी पेपर के माध्यम से एथलेटिक्स में रिकॉर्ड ।
आप विरोध कर सकते हैं कि आप तेजी से चलने वाले समय की संभावना के बारे में नहीं पूछते हैं, लेकिन तेज धावक के अवलोकन की संभावना के बारे में। दुर्भाग्य से, यहाँ हम बहुत कुछ नहीं कर सकते क्योंकि हम नहीं जानते कि क्या संभावना है कि एक धावक एक पेशेवर एथलीट बन जाएगा और रिकॉर्ड किया गया रनिंग समय उसके लिए उपलब्ध होगा। यह यादृच्छिक रूप से नहीं होता है और इस तथ्य में योगदान करने वाले बहुत सारे कारक हैं कि कुछ धावक पेशेवर एथलीट बन जाते हैं और कुछ नहीं (या यहां तक कि किसी को दौड़ना पसंद है और सभी को चलाता है)। इसके लिए, हमें धावकों पर एक विस्तृत जनसंख्या-विस्तृत डेटा रखना होगा, इसके अलावा जब आप वितरण के चरम सीमाओं के बारे में पूछेंगे, तो डेटा बहुत बड़ा होगा। तो इस पर, मैं अन्य उत्तरों से सहमत हूं।