"ज्यादातर पुरुष ज्यादातर महिलाओं की तुलना में तेज़ होते हैं" संभावित रूप से थोड़ा अस्पष्ट है, लेकिन मैं आमतौर पर इसके इरादे की व्याख्या करता हूं कि यदि हम यादृच्छिक परिरक्षण को देखते हैं, तो अधिकांश समय आदमी तेज होगा - यानी यादृच्छिक के लिए (जहां 'समय आ गया है आदि) मई के पुरुष'।P(Mi<Fj)>12i,jMii
बेशक मुहावरे की अन्य व्याख्याएं संभव हैं (कि आखिरकार क्या अस्पष्टता है) और उनमें से कुछ अन्य संभावनाएं आपके तर्क के अनुरूप हो सकती हैं।
[हमारे पास यह भी मुद्दा है कि क्या हम नमूनों या आबादी के बारे में बात कर रहे हैं ... "अधिकांश पुरुष [...] अधिकांश महिलाएं" जनसंख्या विवरण (संभावित समय की आबादी के बारे में) लगती हैं, लेकिन हमने केवल बार ही देखा है ऐसा लगता है कि हम एक नमूने के रूप में व्यवहार कर रहे हैं, इसलिए हमें इस बात से सावधान रहना चाहिए कि हम दावे को कितना व्यापक बनाते हैं।]
ध्यान दें कि का अर्थ । वे विपरीत दिशाओं में जा सकते हैं।P(Mi<Fj)>12M˜<F˜
[मैं यह नहीं कह रहा कि आप यह सोचकर गलत हैं कि यादृच्छिक एमएफ जोड़े का अनुपात जहां पुरुष महिला की तुलना में तेज था, 1/2 से अधिक है - आप निश्चित रूप से सही हैं। मैं सिर्फ यह कह रहा हूं कि आप इसे मध्यस्थों की तुलना करके नहीं बता सकते। न ही आप इसे दूसरे नमूने के मध्यिका के ऊपर या नीचे प्रत्येक नमूने में अनुपात को देखकर बता सकते हैं। आपको एक अलग तुलना करनी होगी।]
यह है कि, जबकि औसत आदमी औसत महिला से तेज हो सकता है, समय का एक नमूना (या उस समय के लिए एक निरंतर वितरण) संभव है, जहां मौका है कि एक यादृच्छिक आदमी एक यादृच्छिक महिला की तुलना में तेज है से कम । बड़े नमूनों में दो विपरीत संकेत प्रत्येक महत्वपूर्ण हो सकते हैं।12
उदाहरण:
डेटा सेट A:
1.58 2.10 16.64 17.34 18.74 19.90 1.53 2.78 16.48 17.53 18.57 19.05
1.64 2.01 16.79 17.10 18.14 19.70 1.25 2.73 16.19 17.76 18.82 19.08
1.42 2.56 16.73 17.01 18.86 19.98
डेटा सेट बी:
3.35 4.62 5.03 20.97 21.25 22.92 3.12 4.83 5.29 20.82 21.64 22.06
3.39 4.67 5.34 20.52 21.10 22.29 3.38 4.96 5.70 20.45 21.67 22.89
3.44 4.13 6.00 20.85 21.82 22.05
डेटा सेट C:
6.63 7.92 8.15 9.97 23.34 24.70 6.40 7.54 8.24 9.37 23.33 24.26
6.18 7.74 8.63 9.62 23.07 24.80 6.54 7.37 8.37 9.09 23.22 24.16
6.57 7.58 8.81 9.08 23.43 24.45
(डेटा यहां हैं , लेकिन वहां एक अलग उद्देश्य के लिए इस्तेमाल किया जा रहा है - मेरे स्मरण के लिए मैंने इसे खुद बनाया है)
ध्यान दें कि A <B का अनुपात 2/3 है, A <C का अनुपात 5/9 है और B <C का अनुपात 2/3 है। ए बनाम बी और बी बनाम सी दोनों 5% के स्तर पर महत्वपूर्ण हैं, लेकिन हम नमूनों की पर्याप्त प्रतियां जोड़कर किसी भी स्तर के महत्व को प्राप्त कर सकते हैं। हम नमूनों से नक़ल करके भी, लेकिन पर्याप्त रूप से छोटे घबराना (अंकों के बीच के सबसे छोटे अंतराल से काफी छोटे) से बच सकते हैं।
सैंपल मेडियन दूसरी दिशा में जाते हैं: मेडियन (ए)> मेडियन (बी)> मेडियन (सी)
फिर हम कुछ तुलनात्मक स्तर पर - किसी भी महत्व के स्तर के लिए - नमूनों की पुनरावृत्ति के द्वारा महत्व प्राप्त कर सकते हैं।
इसे वर्तमान समस्या से संबंधित करने के लिए, कल्पना करें कि A "महिलाओं का समय" है और B "पुरुषों का समय" है। तब मध्ययुगीन पुरुषों का समय तेज़ होता है, लेकिन बेतरतीब ढंग से चुना गया आदमी उस समय का 2/3 एक बेतरतीब ढंग से चुनी गई महिला की तुलना में धीमा होगा।
नमूने ए और सी से हमारे क्यू लेना हम डेटा का एक बड़ा सेट उत्पन्न कर सकते हैं (आर में) निम्नानुसार है:
n <- 300
F <- c(runif(n/3,0,5),runif(n-n/3,15,20))
M <- c(runif(n-n/3,7.5,12.5),runif(n/3,22.5,27.5))
F का माध्य 16.25 के आसपास होगा जबकि M का माध्य 11.25 के आसपास होगा लेकिन उन मामलों का अनुपात जहां F <M 5/9 होगा।
[यदि हमने एन / 3 को एक द्विपद वैरिएबल के साथ मापदंडों से बदल दिया है n तथा 13
हम उस जनसंख्या से नमूना लेंगे जहाँ F के वितरण का माध्य 16.25 पर है जबकि M के वितरण का माध्य 11.25 पर है। इस बीच उस आबादी में संभावना है कि एफ <एम फिर से 5/9 होगा।]
उस पर भी ध्यान दें P(F<med(M))=23 तथा P(M>med(F))=23 जबकि med(M)<med(F) (पर्याप्त दूरी तक)।