क्या आज उसैन बोल्ट से तेज कोई मौजूद है?

संपादित करें: मैं एक नमूना आबादी को दिए गए जनसंख्या में "सही" अधिकतम की संभावना को निर्धारित करने के तकनीकी मुद्दों और कार्यप्रणाली में अधिक रुचि रखता हूं। रिकॉर्ड-सेटिंग डैश समय से श्री बोल्ट की तुलना में तेज धावक की संभावना का अनुमान लगाने में समस्याएं हैं जो स्पष्ट और सूक्ष्म दोनों हैं। यह मामला नहीं होने की कल्पना करके मुझे हास्य।

उसैन बोल्ट 100 मीटर डैश के लिए सबसे तेज़ मानव मापा गया है। हालांकि, एथलीटों की कम संख्या को देखते हुए, यह संभावना प्रतीत होती है कि "सच्चा" सबसे तेज मानव जीवित कहीं सोफे पर बैठा है और उसने कभी भी प्रतिस्पर्धी दौड़ने का प्रयास नहीं किया है।

मैं इस तथ्य का उपयोग करने की कोशिश कर रहा हूं कि सामान्य वितरण की पूंछ पर नमूनों के बीच का अंतर छोटा और छोटा हो जाता है। मैं इसका उपयोग इस संभावना की गणना करने के लिए कर रहा हूं कि उसैन बोल्ट की तुलना में कोई अन्य व्यक्ति तेजी से मौजूद है, उसैन की तुलना दूसरी सबसे तेज, तीसरी सबसे तेज और इसी तरह से करता है।

ऐसा करने के लिए, मैं सबसे बड़े मूल्य की गणना करने की कोशिश कर रहा हूं जो सामान्य वितरण के CDF के संबंध में व्युत्पन्न द्वारा "उसैन बोल्ट" से परे मौजूद है , जो कि वें तक बढ़ाता है (जहाँ लगभग 7,000,000,000 या संख्या है "अधिकतम" से कम नमूने - इसके पीछे तर्क जर्मन टैंक समस्या विकिपीडिया पृष्ठ में वर्णित है जो विभिन्न वितरणों के बीच सामान्यीकृत है), उदाहरण के लिए: $y$ $n$ $n$

$\int_{0}^{\infty}y f_{Y_N} (y)dy = \lambda n \int_{0}^{\infty} y \left [ \tfrac12\left[1 + \operatorname{erf}\left( \frac{y-\mu}{\sigma\sqrt{2}}\right)\right] \right ]^{n-1} \frac{1}{\sqrt{2\pi\sigma^2}}\, e^{-\frac{(y - \mu)^2}{2 \sigma^2}}dy$

क्या यह इस संभावना की गणना करने का एक वैध तरीका है कि उसैन बोल्ट की तुलना में कोई तेजी से मौजूद है?
क्या "जर्मन टैंक समस्या अन्य वितरणों के लिए" के बाहर इस तरह के प्रश्न का नाम है
क्या वितरण के चरम नमूनों से मानक विचलन का अनुमान लगाने का एक अच्छा तरीका है? सभी समय के सबसे तेज 100 मीटर डैश के बारे में जानकारी प्राप्त करना आसान है, औसत और विचरण कठिन है)

विषय में पृष्ठभूमि के बिना प्रोग्रामर के साथ व्यवहार करने में आपके धैर्य के लिए धन्यवाद।

normal-distribution maximum

— ŹV -
स्रोत

आप यह धारणा बनाते हैं कि क्या आप एक एथलीट हैं जो आपकी दौड़ने की गति से स्वतंत्र है। जो ठीक है, लेकिन संदिग्ध है।

— बेयरज

@bayerj हाँ, मुझे लगता है कि यह बहुत स्पष्ट है कि यह अगले ओलंपिक चैलेंजर की भविष्यवाणी करने का एक बहुत बुरा तरीका होगा। हालांकि, यह सामान्य रूप से एक दिलचस्प सवाल लगता है और मैं इसे अपनी सर्वश्रेष्ठ क्षमता का जवाब देने की कोशिश कर रहा हूं, इस उम्मीद के साथ कि कोई दया करता है और मेरी मदद करता है।

— .V -

मुझे लगता है कि "तेज (एर)" होने की गुणवत्ता के बाद से प्रश्न बीमार हो गया है, यहां एक आनुवंशिक क्षमता या एथलेटिक प्रतिभा को संदर्भित करता है, न कि उच्च गति तक पहुंचने की वास्तविक क्षमता।

— डिगियो

@Digio बदलें "तेजी से" के साथ "उच्च सीरियल नंबर" है कुछ कंपनी "फ़ुबरको" मानती है कि सामान्य रूप से वितरित सीरियल नंबर के साथ उत्पादों का एक सेट है।

— .वी -

एक प्रश्न w / एक उदाहरण को प्रेरित करना आम तौर पर एक अच्छी बात है। हालांकि, यह उदाहरण उन लोगों को विचलित कर रहा है जो आप वास्तव में पूछने की कोशिश कर रहे हैं। क्या आप वास्तव में सामना कर रहे स्थिति पर चर्चा करने के लिए इसे संपादित कर सकते हैं?

— गुंग - को पुनः स्थापित मोनिका

जवाबों:

अन्य उत्तरों के विपरीत, मेरा तर्क है कि आप उपलब्ध आंकड़ों के अनुसार बोल्ट क्षमताओं के बारे में कुछ कह सकते हैं। सबसे पहले, आइए अपने प्रश्न को छोटा करें। आप सबसे तेजी से मानव के बारे में पूछ रहे हैं, लेकिन चूंकि पुरुषों और महिलाओं के लिए दौड़ने की गति के वितरण में अंतर है, जहां सबसे अच्छी महिला धावक महिला थोड़ी धीमी लगती है तो सबसे अच्छा पुरुष धावक, हमें पुरुष धावक पर ध्यान देना चाहिए। कुछ डेटा प्राप्त करने के लिए, हम पिछले 45 वर्षों से 100 रन पर सर्वश्रेष्ठ वर्ष के प्रदर्शन को देख सकते हैं । इस डेटा के बारे में कई बातें हैं:

वे सबसे अच्छे चलने वाले समय हैं, इसलिए वे हमें सभी मनुष्यों की क्षमताओं के बारे में नहीं बताते हैं, लेकिन न्यूनतम प्राप्त गति के बारे में बताते हैं ।
हम मानते हैं कि यह डेटा दुनिया के सर्वश्रेष्ठ धावकों के नमूने को दर्शाता है। हालांकि ऐसा हो सकता है कि बेहतर धावक भी थे जो चैंपियनशिप में भाग नहीं लेते थे, यह धारणा काफी हद तक उचित प्रतीत होती है।

पहले, आइए चर्चा करें कि इस डेटा का विश्लेषण कैसे नहीं किया जाए। आप देख सकते हैं कि यदि हम समय के खिलाफ चलने की साजिश करते हैं, तो हम एक मजबूत रैखिक संबंध का निरीक्षण करेंगे।

यह आपको पूर्वानुमान लगाने के लिए रैखिक प्रतिगमन का उपयोग करने के लिए प्रेरित कर सकता है कि हम अगले वर्षों में कितना बेहतर धावक देख सकते हैं। लेकिन यह एक बहुत बुरा विचार होगा, जो आपको यह निष्कर्ष निकालने के लिए मजबूर कर देगा कि लगभग दो हजार वर्षों में मनुष्य शून्य सेकंड में 100 मीटर दौड़ने में सक्षम होंगे, और इसके बाद वे नकारात्मक समय को प्राप्त करना शुरू कर देंगे! यह स्पष्ट रूप से बेतुका है, क्योंकि हम कल्पना कर सकते हैं कि हमारी क्षमताओं की कुछ प्रकार की जैविक और भौतिक सीमा है, जो हमारे लिए अज्ञात है।

$Y = \max(X_1,X_2,\dots,X_n)$ $X_1,X_2,\dots,X_n$ $Y_i$ $Z_1,Z_2,\dots,Z_k$ $-Z_i$ न्यूनतम के लिए एक GEV वितरण का पालन करें। इसलिए हम GEV वितरण को रनिंग स्पीड डेटा में फिट कर सकते हैं, जो बहुत अच्छा फिट होता है (नीचे देखें)।

यदि आप मॉडल द्वारा सुझाए गए संचयी वितरण को देखते हैं, तो आप देखेंगे कि उसैन बोल्ट द्वारा सबसे अच्छा चलने का समय सबसे कम $1\%$ वितरण की पूंछ। इसलिए यदि हम इस डेटा, और इस खिलौना-उदाहरण विश्लेषण से चिपके रहते हैं, तो हम यह निष्कर्ष निकालेंगे कि बहुत कम चलने वाले समय की संभावना नहीं है (लेकिन जाहिर है, संभव है)। इस विश्लेषण के साथ स्पष्ट समस्या यह है कि इस तथ्य को नजरअंदाज कर दिया जाए कि हमने साल-दर-साल के सुधारों को सबसे अच्छे तरीके से देखा है। यह हमें उत्तर के पहले भाग में वर्णित समस्या पर वापस लाता है, अर्थात यहाँ प्रतिगमन मॉडल को जोखिम भरा मानना। एक और चीज़ जो बेहतर हो सकती है वह यह है कि हम बायेसियन दृष्टिकोण का उपयोग कर सकते हैं और पहले से सूचनात्मक मान सकते हैं जो कि भौतिक रूप से संभव चल रहे समय के बारे में कुछ डेटा-आउट ज्ञान के लिए जिम्मेदार होगा, जिसे अभी तक नहीं देखा जा सकता है (लेकिन, जहां तक मुझे पता है, यह वर्तमान समय में अज्ञात है)। अंत में, इसी तरह के चरम मूल्य सिद्धांत का उपयोग पहले से ही खेल अनुसंधान में किया गया था, उदाहरण के लिए आइंमहल और मैग्नस (2008) द्वाराएक्सट्रीम-वैल्यू थ्योरी पेपर के माध्यम से एथलेटिक्स में रिकॉर्ड ।

आप विरोध कर सकते हैं कि आप तेजी से चलने वाले समय की संभावना के बारे में नहीं पूछते हैं, लेकिन तेज धावक के अवलोकन की संभावना के बारे में। दुर्भाग्य से, यहाँ हम बहुत कुछ नहीं कर सकते क्योंकि हम नहीं जानते कि क्या संभावना है कि एक धावक एक पेशेवर एथलीट बन जाएगा और रिकॉर्ड किया गया रनिंग समय उसके लिए उपलब्ध होगा। यह यादृच्छिक रूप से नहीं होता है और इस तथ्य में योगदान करने वाले बहुत सारे कारक हैं कि कुछ धावक पेशेवर एथलीट बन जाते हैं और कुछ नहीं (या यहां तक कि किसी को दौड़ना पसंद है और सभी को चलाता है)। इसके लिए, हमें धावकों पर एक विस्तृत जनसंख्या-विस्तृत डेटा रखना होगा, इसके अलावा जब आप वितरण के चरम सीमाओं के बारे में पूछेंगे, तो डेटा बहुत बड़ा होगा। तो इस पर, मैं अन्य उत्तरों से सहमत हूं।

— टिम
स्रोत

मेरी पहली वृत्ति यह एक बुरा विचार है, लेकिन मुझे थोड़ा क्यों टूटने दो।

1) आप एक अप्रचलित चर, अव्यक्त चल कौशल को मापना चाहते हैं, एक अवलोकन योग्य, रिकॉर्ड किए गए समय के साथ। यह ठीक है, लेकिन: जर्मन टैंक समस्या में, सीरियल नंबर सभी समान समान वितरण से उत्पन्न होते हैं। आपकी समस्या में, आपको चलने वाले चर समय से अव्यक्त चर कौशल (7 बिलियन लोगों में) का अनुमान लगाना होगा। जीटीपी में, कई सीरियल नंबर ज्ञात हैं। आपकी समस्या में, आपने कोई डेटा एकत्र नहीं किया है और केवल अधिकतम (बोल्ट) पर जा रहे हैं। इसके अलावा, आप यह मान लेते हैं कि यह अप्रचलित अव्यक्त कौशल वास्तविक चल रहे समय से उस बिंदु तक असंबंधित है जहां यह संभव है कि कोई व्यक्ति जो कभी नहीं चला है, बोल्ट से बेहतर है। यह सिर्फ बेतुका लगता है!

2) एथलीट जनसंख्या के यादृच्छिक नमूने नहीं हैं। वे कई परीक्षणों द्वारा सावधानी से चुने गए हैं। यदि हम यह मान लें कि सभी को चलाने में सक्षम हर किसी ने अपने जीवन में कम से कम एक बार दौड़ लगाई है और प्रत्येक व्यक्ति ने इस पर निर्णय लिया है कि क्या उन्हें कितनी बार या कितने के आधार पर प्रतिस्पर्धा के उच्च स्तर पर जारी रखना चाहिए? दौड़ --- तो यह प्रतीत नहीं होता है कि बोल्ट वास्तव में सबसे तेज इंसान है।

ये सिर्फ पहली वजह हैं जो दिमाग में आती हैं। ईमानदारी से, आप इसके साथ किसी मूर्ख व्यक्ति की गलती पर हैं। आप जिस तरह की बात कर रहे हैं, उसकी "संभावना" को मापने का कोई तरीका नहीं है।

— पतित होना
स्रोत

एक अन्य प्रतिवादी ने इसी तरह की टिप्पणी की और यह निस्संदेह सच है कि इस आधार पर श्री बोल्ट की तुलना में किसी के तेजी से मौजूद होने की संभावना का आकलन बहुत त्रुटिपूर्ण है। यह जानना और भी दिलचस्प होगा कि क्या इन चरम मूल्यों पर आधारित भविष्यवाणी का तकनीकी तर्क सही है या नहीं।

— .वी - 20

मैं इस सवाल को अमूर्त करने का सुझाव दूंगा ताकि आप वास्तव में पूछने की कोशिश कर रहे हों, जैसा कि संदर्भ बहुत विचलित करने वाला है। यह अभी भी मेरे लिए स्पष्ट नहीं है कि आप किस "सामान्य वितरण" का प्रतिनिधित्व कर रहे हैं। वास्तविक रन समय? एथलीटों की क्षमता चल रही है?

— पतित हेस्सियन

-2

जवाब न है।

आप मान रहे हैं कि जनसंख्या (एथलीटों) से एक नमूना है, और बोल्ट इस नमूने पर अधिकतम है। इसलिए, आप इस संभावना की तलाश कर रहे हैं कि अधिकतम जनसंख्या अधिकतम नमूने से अधिक हो। वह तुम्हारी परिकल्पना है।

क्या होगा अगर आपकी धारणा गलत है, और नमूना वास्तव में आबादी थी?

मैं एक उचित तर्क दे सकता हूं कि हर व्यक्ति जो दौड़ सकता है उसे हरा देने का मौका है। किसी ने भी नहीं किया, इसलिए वह पृथ्वी की आबादी का सच्चा अधिकतम है।

यह स्पष्ट है कि एथलीट एक यादृच्छिक नमूना नहीं हैं। मुझे उम्मीद है कि इस बारे में कोई सवाल नहीं है। एक एथलीट कैसे बनता है, इसमें यादृच्छिकता की एक डिग्री होती है। दूसरी ओर, यदि कोई एथलीट नहीं है तो उसके एथलेटिक कौशल और उपलब्धियों की तुलना एथलीट से नहीं होने जा रही है। मैं इसे ले सकता हूं कि कोई व्यक्ति संभावित रूप से बोल्ट की तुलना में अधिक तेजी से दौड़ सकता है, प्रशिक्षण के लिए सभी शर्तें दी गई हैं और बोल्ट के रूप में कठिन प्रशिक्षण दिया गया है। हालांकि, यह शून्य संभावना है कि आप एक गैर एथलीट को खींचते हैं और वह ट्रैक और फील्ड परिस्थितियों में बोल्ट को 100 मीटर डैश में हरा देता है।

— Aksakal
स्रोत

मैं इसके पीछे की कार्यप्रणाली में अधिक रुचि रखता हूं, यह सही है, ऐसे टैंकों की कल्पना करें जिनके सीरियल नंबर सामान्य रूप से वितरित किए जा रहे हैं w / डुप्लिकेट को चलाने की गति के बजाय हो सकता है :)

— maybeV -