क्या आज उसैन बोल्ट से तेज कोई मौजूद है?


12

संपादित करें: मैं एक नमूना आबादी को दिए गए जनसंख्या में "सही" अधिकतम की संभावना को निर्धारित करने के तकनीकी मुद्दों और कार्यप्रणाली में अधिक रुचि रखता हूं। रिकॉर्ड-सेटिंग डैश समय से श्री बोल्ट की तुलना में तेज धावक की संभावना का अनुमान लगाने में समस्याएं हैं जो स्पष्ट और सूक्ष्म दोनों हैं। यह मामला नहीं होने की कल्पना करके मुझे हास्य।


उसैन बोल्ट 100 मीटर डैश के लिए सबसे तेज़ मानव मापा गया है। हालांकि, एथलीटों की कम संख्या को देखते हुए, यह संभावना प्रतीत होती है कि "सच्चा" सबसे तेज मानव जीवित कहीं सोफे पर बैठा है और उसने कभी भी प्रतिस्पर्धी दौड़ने का प्रयास नहीं किया है।

मैं इस तथ्य का उपयोग करने की कोशिश कर रहा हूं कि सामान्य वितरण की पूंछ पर नमूनों के बीच का अंतर छोटा और छोटा हो जाता है। मैं इसका उपयोग इस संभावना की गणना करने के लिए कर रहा हूं कि उसैन बोल्ट की तुलना में कोई अन्य व्यक्ति तेजी से मौजूद है, उसैन की तुलना दूसरी सबसे तेज, तीसरी सबसे तेज और इसी तरह से करता है।

ऐसा करने के लिए, मैं सबसे बड़े मूल्य की गणना करने की कोशिश कर रहा हूं जो सामान्य वितरण के CDF के संबंध में व्युत्पन्न द्वारा "उसैन बोल्ट" से परे मौजूद है , जो कि वें तक बढ़ाता है (जहाँ लगभग 7,000,000,000 या संख्या है "अधिकतम" से कम नमूने - इसके पीछे तर्क जर्मन टैंक समस्या विकिपीडिया पृष्ठ में वर्णित है जो विभिन्न वितरणों के बीच सामान्यीकृत है), उदाहरण के लिए:n nynn

0yYएन(y)y=λn0y[12[1+ERF(y-μσ2)]]n-112πσ2-(y-μ)22σ2y

  1. क्या यह इस संभावना की गणना करने का एक वैध तरीका है कि उसैन बोल्ट की तुलना में कोई तेजी से मौजूद है?

  2. क्या "जर्मन टैंक समस्या अन्य वितरणों के लिए" के बाहर इस तरह के प्रश्न का नाम है

  3. क्या वितरण के चरम नमूनों से मानक विचलन का अनुमान लगाने का एक अच्छा तरीका है? सभी समय के सबसे तेज 100 मीटर डैश के बारे में जानकारी प्राप्त करना आसान है, औसत और विचरण कठिन है)

विषय में पृष्ठभूमि के बिना प्रोग्रामर के साथ व्यवहार करने में आपके धैर्य के लिए धन्यवाद।


2
आप यह धारणा बनाते हैं कि क्या आप एक एथलीट हैं जो आपकी दौड़ने की गति से स्वतंत्र है। जो ठीक है, लेकिन संदिग्ध है।
बेयरज

@bayerj हाँ, मुझे लगता है कि यह बहुत स्पष्ट है कि यह अगले ओलंपिक चैलेंजर की भविष्यवाणी करने का एक बहुत बुरा तरीका होगा। हालांकि, यह सामान्य रूप से एक दिलचस्प सवाल लगता है और मैं इसे अपनी सर्वश्रेष्ठ क्षमता का जवाब देने की कोशिश कर रहा हूं, इस उम्मीद के साथ कि कोई दया करता है और मेरी मदद करता है।
.V -

1
मुझे लगता है कि "तेज (एर)" होने की गुणवत्ता के बाद से प्रश्न बीमार हो गया है, यहां एक आनुवंशिक क्षमता या एथलेटिक प्रतिभा को संदर्भित करता है, न कि उच्च गति तक पहुंचने की वास्तविक क्षमता।
डिगियो

@Digio बदलें "तेजी से" के साथ "उच्च सीरियल नंबर" है कुछ कंपनी "फ़ुबरको" मानती है कि सामान्य रूप से वितरित सीरियल नंबर के साथ उत्पादों का एक सेट है।
.वी -

1
एक प्रश्न w / एक उदाहरण को प्रेरित करना आम तौर पर एक अच्छी बात है। हालांकि, यह उदाहरण उन लोगों को विचलित कर रहा है जो आप वास्तव में पूछने की कोशिश कर रहे हैं। क्या आप वास्तव में सामना कर रहे स्थिति पर चर्चा करने के लिए इसे संपादित कर सकते हैं?
गुंग - को पुनः स्थापित मोनिका

जवाबों:


2

अन्य उत्तरों के विपरीत, मेरा तर्क है कि आप उपलब्ध आंकड़ों के अनुसार बोल्ट क्षमताओं के बारे में कुछ कह सकते हैं। सबसे पहले, आइए अपने प्रश्न को छोटा करें। आप सबसे तेजी से मानव के बारे में पूछ रहे हैं, लेकिन चूंकि पुरुषों और महिलाओं के लिए दौड़ने की गति के वितरण में अंतर है, जहां सबसे अच्छी महिला धावक महिला थोड़ी धीमी लगती है तो सबसे अच्छा पुरुष धावक, हमें पुरुष धावक पर ध्यान देना चाहिए। कुछ डेटा प्राप्त करने के लिए, हम पिछले 45 वर्षों से 100 रन पर सर्वश्रेष्ठ वर्ष के प्रदर्शन को देख सकते हैं । इस डेटा के बारे में कई बातें हैं:

  • वे सबसे अच्छे चलने वाले समय हैं, इसलिए वे हमें सभी मनुष्यों की क्षमताओं के बारे में नहीं बताते हैं, लेकिन न्यूनतम प्राप्त गति के बारे में बताते हैं ।
  • हम मानते हैं कि यह डेटा दुनिया के सर्वश्रेष्ठ धावकों के नमूने को दर्शाता है। हालांकि ऐसा हो सकता है कि बेहतर धावक भी थे जो चैंपियनशिप में भाग नहीं लेते थे, यह धारणा काफी हद तक उचित प्रतीत होती है।

पहले, आइए चर्चा करें कि इस डेटा का विश्लेषण कैसे नहीं किया जाए। आप देख सकते हैं कि यदि हम समय के खिलाफ चलने की साजिश करते हैं, तो हम एक मजबूत रैखिक संबंध का निरीक्षण करेंगे।

बेस्ट रनिंग टाइम बनाम समय

यह आपको पूर्वानुमान लगाने के लिए रैखिक प्रतिगमन का उपयोग करने के लिए प्रेरित कर सकता है कि हम अगले वर्षों में कितना बेहतर धावक देख सकते हैं। लेकिन यह एक बहुत बुरा विचार होगा, जो आपको यह निष्कर्ष निकालने के लिए मजबूर कर देगा कि लगभग दो हजार वर्षों में मनुष्य शून्य सेकंड में 100 मीटर दौड़ने में सक्षम होंगे, और इसके बाद वे नकारात्मक समय को प्राप्त करना शुरू कर देंगे! यह स्पष्ट रूप से बेतुका है, क्योंकि हम कल्पना कर सकते हैं कि हमारी क्षमताओं की कुछ प्रकार की जैविक और भौतिक सीमा है, जो हमारे लिए अज्ञात है।

X 1 , X 2 , , X n Y i Z 1 , Z 2 , , Z k - Z iY=अधिकतम(एक्स1,एक्स2,...,एक्सn)एक्स1,एक्स2,...,एक्सnYमैंजेड1,जेड2,...,जेड-जेडमैंन्यूनतम के लिए एक GEV वितरण का पालन करें। इसलिए हम GEV वितरण को रनिंग स्पीड डेटा में फिट कर सकते हैं, जो बहुत अच्छा फिट होता है (नीचे देखें)।

गति चलाने के लिए GEV वितरण

यदि आप मॉडल द्वारा सुझाए गए संचयी वितरण को देखते हैं, तो आप देखेंगे कि उसैन बोल्ट द्वारा सबसे अच्छा चलने का समय सबसे कम1%वितरण की पूंछ। इसलिए यदि हम इस डेटा, और इस खिलौना-उदाहरण विश्लेषण से चिपके रहते हैं, तो हम यह निष्कर्ष निकालेंगे कि बहुत कम चलने वाले समय की संभावना नहीं है (लेकिन जाहिर है, संभव है)। इस विश्लेषण के साथ स्पष्ट समस्या यह है कि इस तथ्य को नजरअंदाज कर दिया जाए कि हमने साल-दर-साल के सुधारों को सबसे अच्छे तरीके से देखा है। यह हमें उत्तर के पहले भाग में वर्णित समस्या पर वापस लाता है, अर्थात यहाँ प्रतिगमन मॉडल को जोखिम भरा मानना। एक और चीज़ जो बेहतर हो सकती है वह यह है कि हम बायेसियन दृष्टिकोण का उपयोग कर सकते हैं और पहले से सूचनात्मक मान सकते हैं जो कि भौतिक रूप से संभव चल रहे समय के बारे में कुछ डेटा-आउट ज्ञान के लिए जिम्मेदार होगा, जिसे अभी तक नहीं देखा जा सकता है (लेकिन, जहां तक ​​मुझे पता है, यह वर्तमान समय में अज्ञात है)। अंत में, इसी तरह के चरम मूल्य सिद्धांत का उपयोग पहले से ही खेल अनुसंधान में किया गया था, उदाहरण के लिए आइंमहल और मैग्नस (2008) द्वाराएक्सट्रीम-वैल्यू थ्योरी पेपर के माध्यम से एथलेटिक्स में रिकॉर्ड

आप विरोध कर सकते हैं कि आप तेजी से चलने वाले समय की संभावना के बारे में नहीं पूछते हैं, लेकिन तेज धावक के अवलोकन की संभावना के बारे में। दुर्भाग्य से, यहाँ हम बहुत कुछ नहीं कर सकते क्योंकि हम नहीं जानते कि क्या संभावना है कि एक धावक एक पेशेवर एथलीट बन जाएगा और रिकॉर्ड किया गया रनिंग समय उसके लिए उपलब्ध होगा। यह यादृच्छिक रूप से नहीं होता है और इस तथ्य में योगदान करने वाले बहुत सारे कारक हैं कि कुछ धावक पेशेवर एथलीट बन जाते हैं और कुछ नहीं (या यहां तक ​​कि किसी को दौड़ना पसंद है और सभी को चलाता है)। इसके लिए, हमें धावकों पर एक विस्तृत जनसंख्या-विस्तृत डेटा रखना होगा, इसके अलावा जब आप वितरण के चरम सीमाओं के बारे में पूछेंगे, तो डेटा बहुत बड़ा होगा। तो इस पर, मैं अन्य उत्तरों से सहमत हूं।


1

मेरी पहली वृत्ति यह एक बुरा विचार है, लेकिन मुझे थोड़ा क्यों टूटने दो।

1) आप एक अप्रचलित चर, अव्यक्त चल कौशल को मापना चाहते हैं, एक अवलोकन योग्य, रिकॉर्ड किए गए समय के साथ। यह ठीक है, लेकिन: जर्मन टैंक समस्या में, सीरियल नंबर सभी समान समान वितरण से उत्पन्न होते हैं। आपकी समस्या में, आपको चलने वाले चर समय से अव्यक्त चर कौशल (7 बिलियन लोगों में) का अनुमान लगाना होगा। जीटीपी में, कई सीरियल नंबर ज्ञात हैं। आपकी समस्या में, आपने कोई डेटा एकत्र नहीं किया है और केवल अधिकतम (बोल्ट) पर जा रहे हैं। इसके अलावा, आप यह मान लेते हैं कि यह अप्रचलित अव्यक्त कौशल वास्तविक चल रहे समय से उस बिंदु तक असंबंधित है जहां यह संभव है कि कोई व्यक्ति जो कभी नहीं चला है, बोल्ट से बेहतर है। यह सिर्फ बेतुका लगता है!

2) एथलीट जनसंख्या के यादृच्छिक नमूने नहीं हैं। वे कई परीक्षणों द्वारा सावधानी से चुने गए हैं। यदि हम यह मान लें कि सभी को चलाने में सक्षम हर किसी ने अपने जीवन में कम से कम एक बार दौड़ लगाई है और प्रत्येक व्यक्ति ने इस पर निर्णय लिया है कि क्या उन्हें कितनी बार या कितने के आधार पर प्रतिस्पर्धा के उच्च स्तर पर जारी रखना चाहिए? दौड़ --- तो यह प्रतीत नहीं होता है कि बोल्ट वास्तव में सबसे तेज इंसान है।

ये सिर्फ पहली वजह हैं जो दिमाग में आती हैं। ईमानदारी से, आप इसके साथ किसी मूर्ख व्यक्ति की गलती पर हैं। आप जिस तरह की बात कर रहे हैं, उसकी "संभावना" को मापने का कोई तरीका नहीं है।


एक अन्य प्रतिवादी ने इसी तरह की टिप्पणी की और यह निस्संदेह सच है कि इस आधार पर श्री बोल्ट की तुलना में किसी के तेजी से मौजूद होने की संभावना का आकलन बहुत त्रुटिपूर्ण है। यह जानना और भी दिलचस्प होगा कि क्या इन चरम मूल्यों पर आधारित भविष्यवाणी का तकनीकी तर्क सही है या नहीं।
.वी - 20

3
मैं इस सवाल को अमूर्त करने का सुझाव दूंगा ताकि आप वास्तव में पूछने की कोशिश कर रहे हों, जैसा कि संदर्भ बहुत विचलित करने वाला है। यह अभी भी मेरे लिए स्पष्ट नहीं है कि आप किस "सामान्य वितरण" का प्रतिनिधित्व कर रहे हैं। वास्तविक रन समय? एथलीटों की क्षमता चल रही है?
पतित हेस्सियन

-2

जवाब न है।

आप मान रहे हैं कि जनसंख्या (एथलीटों) से एक नमूना है, और बोल्ट इस नमूने पर अधिकतम है। इसलिए, आप इस संभावना की तलाश कर रहे हैं कि अधिकतम जनसंख्या अधिकतम नमूने से अधिक हो। वह तुम्हारी परिकल्पना है।

क्या होगा अगर आपकी धारणा गलत है, और नमूना वास्तव में आबादी थी?

मैं एक उचित तर्क दे सकता हूं कि हर व्यक्ति जो दौड़ सकता है उसे हरा देने का मौका है। किसी ने भी नहीं किया, इसलिए वह पृथ्वी की आबादी का सच्चा अधिकतम है।

यह स्पष्ट है कि एथलीट एक यादृच्छिक नमूना नहीं हैं। मुझे उम्मीद है कि इस बारे में कोई सवाल नहीं है। एक एथलीट कैसे बनता है, इसमें यादृच्छिकता की एक डिग्री होती है। दूसरी ओर, यदि कोई एथलीट नहीं है तो उसके एथलेटिक कौशल और उपलब्धियों की तुलना एथलीट से नहीं होने जा रही है। मैं इसे ले सकता हूं कि कोई व्यक्ति संभावित रूप से बोल्ट की तुलना में अधिक तेजी से दौड़ सकता है, प्रशिक्षण के लिए सभी शर्तें दी गई हैं और बोल्ट के रूप में कठिन प्रशिक्षण दिया गया है। हालांकि, यह शून्य संभावना है कि आप एक गैर एथलीट को खींचते हैं और वह ट्रैक और फील्ड परिस्थितियों में बोल्ट को 100 मीटर डैश में हरा देता है।


मैं इसके पीछे की कार्यप्रणाली में अधिक रुचि रखता हूं, यह सही है, ऐसे टैंकों की कल्पना करें जिनके सीरियल नंबर सामान्य रूप से वितरित किए जा रहे हैं w / डुप्लिकेट को चलाने की गति के बजाय हो सकता है :)
maybeV -
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.