यह तथ्य क्यों नहीं है कि 1 मंझला दूसरे माध्यिका से कम है, इसका मतलब है कि समूह 1 में अधिकांश समूह 2 में सबसे कम हैं?


9

मेरा मानना ​​था कि नीचे दिए गए बॉक्सप्लॉट्स की व्याख्या "अधिकांश पुरुष अधिकांश महिलाओं की तुलना में तेज़ हैं" (इस डेटासेट में), मुख्यतः क्योंकि औसत पुरुषों का समय औसत महिलाओं के समय से कम था। लेकिन R और सांख्यिकी प्रश्नोत्तरी पर EdX पाठ्यक्रम ने मुझे बताया कि गलत है। कृपया यह समझने में मेरी मदद करें कि मेरा अंतर्ज्ञान गलत क्यों है।

यहाँ सवाल है:

चलो 2002 में न्यूयॉर्क सिटी मैराथन से फिनिशरों के यादृच्छिक नमूने पर विचार करें। यह डेटासेट आरआरआर पैकेज में पाया जा सकता है। लाइब्रेरी लोड करें और फिर nym.2002 डेटासेट लोड करें।

library(dplyr)
data(nym.2002, package="UsingR")

पुरुषों और महिलाओं के परिष्करण समय की तुलना करने के लिए बॉक्सप्लॉट्स और हिस्टोग्राम का उपयोग करें। निम्नलिखित में से कौन सा अंतर का सबसे अच्छा वर्णन करता है?

  1. नर और मादा का समान वितरण होता है।
  2. ज़्यादातर पुरुष ज़्यादातर महिलाओं की तुलना में तेज़ होते हैं।
  3. नर और मादा के समान दाएं तिरछे वितरण होते हैं, जो 20 मिनट बाईं ओर स्थानांतरित होते हैं।
  4. दोनों वितरण सामान्य रूप से लगभग 30 मिनट के अंतर के साथ वितरित किए जाते हैं।

पुरुषों और महिलाओं के लिए NYC मैराथन समय हैं, जैसे कि क्वांटाइल्स, हिस्टोग्राम और बॉक्सप्लाट्स:

# Men's time quantile
      0%      25%      50%      75%     100% 
147.3333 226.1333 256.0167 290.6375 508.0833

# Women's time quantile
      0%      25%      50%      75%     100% 
175.5333 250.8208 277.7250 309.4625 566.7833

पुरुष और महिला समय - हिस्टोग्राम

पुरुष और महिला समय - बॉक्सप्लॉट


समान वितरण के लिए नेत्रहीन जांच करने के लिए, आपके हिस्टोग्राम को एक ही एक्स डोमेन और डिब्बे का उपयोग करना चाहिए, जबकि वाई अक्ष को सापेक्ष आवृत्ति दिखाना चाहिए। बिन बैंड के आकार का लाभ उच्च ग्रैन्युलैरिटी से होगा, जैसे 25 या 50 मिनट। इसके अतिरिक्त, दोनों बॉक्सप्लॉट्स और हिस्टोग्राम पर, माध्यिका (पहले से ही बॉक्सप्लेट में), माध्य और मोड ड्रा करें।
g3o2

शीर्षक से प्रश्न को फिर से लिखें: और पर समान वितरण पर विचार करें । उत्तरार्द्ध का माध्य बड़ा है, लेकिन प्रत्येक से एक यादृच्छिक बोध दिया जाता है, दूसरे के बड़े होने की संभावना उतनी ही है जितनी छोटी ( ) है। इसलिए यदि आप "यादृच्छिक रूप से बड़े हैं" दो यादृच्छिक नमूने X और Y दिए गए हैं, प्रत्येक में से एक, "X और Y के मध्यस्थों के बीच का संबंध इसके बारे में बहुत कुछ नहीं कहता है। {0,3}{2}0.5P(X>Y)>0.5
एलेक्स्र

जवाबों:


7

मुझे लगता है कि आपके द्वारा गलत के रूप में चिह्नित किए जाने का कारण इतना नहीं है कि आपके द्वारा दिए गए बहुविकल्पीय प्रश्न का उत्तर गलत था, बल्कि विकल्प 3 "पुरुष और महिलाओं के समान पूर्व तिरछे वितरण होते हैं, जो 20 मिनट पहले बाईं ओर स्थानांतरित होते हैं" एक बेहतर विकल्प होता क्योंकि यह उपलब्ध कराई गई जानकारी के आधार पर अधिक जानकारीपूर्ण होता है।


मैं इस स्पष्टीकरण से सहमत हूं। इसके अलावा, "सबसे अधिक से अधिक तेज" बहुत अस्पष्ट है। @Glen_b द्वारा दिए गए उत्तर के बावजूद, मैं इस तरह की भाषा के लिए बॉक्स भूखंडों में बहुत अधिक अलगाव की उम्मीद करूंगा। जैसे "सभी 75% पुरुष सभी 75% महिलाओं की तुलना में तेज़ हैं", जो मुझे लगता है कि 75 वें प्रतिशत पुरुषों के समय के 25 वें प्रतिशत महिलाओं के समय से कम होगा। लेकिन भाषा अस्पष्ट है।
साल मांगियाफिको

1
इसके अलावा, यह कई विकल्प परीक्षण लेने के सिद्धांत के लिए जाता है: हमेशा सबसे अच्छा उत्तर चुनें।
साल मंगियाफिको

यह समझ में आता है; ऐसा नहीं है कि दूसरी पसंद गलत थी, लेकिन यह सही विकल्प ("नर और मादा के समान पूर्व तिरछे वितरण होते हैं, 20 मिनट बाईं ओर स्थानांतरित होते हैं।") ट्रूअर था। हालाँकि, मैं हिस्टोग्राम में 20 मिनट की शिफ्ट नहीं देखता; यह मेरे लिए 50 मिनट की शिफ्ट की तरह दिखता है। चूंकि मेरे पास दो मौके थे, इसलिए मुझे सवाल सही लगा, FWIW :-)।
जीरा

@ जीमिन: मुझे यकीन नहीं है कि यह वास्तव में सही है। "अधिकांश पुरुष ज्यादातर महिलाओं की तुलना में तेज़ होते हैं" अस्पष्ट है जो "सबसे" का अर्थ है - मेरा मानना ​​है कि मैंने कभी कठोर परिभाषा नहीं देखी है, और सहजता से यह आमतौर पर 50% (शायद 70% +) से अधिक है? । यदि वे "बहुमत" कहते हैं तो शायद यह स्पष्ट हो जाएगा।
user541686

9

यहाँ सबसे छोटा प्रति-उदाहरण मुझे मिल सकता है:

ए 1,4,10;  B 0,6,9

  • एक ( [1, 4, 10])और बी ( [0, 6, 9]) एक ही औसत है ( 5)

  • B का A ( ) की 6तुलना में बड़ा माध्यिका ( ) है4

  • एक 5/9 संभावना है कि एक यादृच्छिक तत्व यादृच्छिक बी तत्व से बड़ा है ।

यहाँ 4 तत्वों के साथ एक और उदाहरण दिया गया है:

A 1,1,3,10;  B 0,0,6,9


7

"ज्यादातर पुरुष ज्यादातर महिलाओं की तुलना में तेज़ होते हैं" संभावित रूप से थोड़ा अस्पष्ट है, लेकिन मैं आमतौर पर इसके इरादे की व्याख्या करता हूं कि यदि हम यादृच्छिक परिरक्षण को देखते हैं, तो अधिकांश समय आदमी तेज होगा - यानी यादृच्छिक के लिए (जहां 'समय आ गया है आदि) मई के पुरुष'।P(Mi<Fj)>12i,jMii

बेशक मुहावरे की अन्य व्याख्याएं संभव हैं (कि आखिरकार क्या अस्पष्टता है) और उनमें से कुछ अन्य संभावनाएं आपके तर्क के अनुरूप हो सकती हैं।

[हमारे पास यह भी मुद्दा है कि क्या हम नमूनों या आबादी के बारे में बात कर रहे हैं ... "अधिकांश पुरुष [...] अधिकांश महिलाएं" जनसंख्या विवरण (संभावित समय की आबादी के बारे में) लगती हैं, लेकिन हमने केवल बार ही देखा है ऐसा लगता है कि हम एक नमूने के रूप में व्यवहार कर रहे हैं, इसलिए हमें इस बात से सावधान रहना चाहिए कि हम दावे को कितना व्यापक बनाते हैं।]

ध्यान दें कि का अर्थ । वे विपरीत दिशाओं में जा सकते हैं।P(Mi<Fj)>12M~<F~

[मैं यह नहीं कह रहा कि आप यह सोचकर गलत हैं कि यादृच्छिक एमएफ जोड़े का अनुपात जहां पुरुष महिला की तुलना में तेज था, 1/2 से अधिक है - आप निश्चित रूप से सही हैं। मैं सिर्फ यह कह रहा हूं कि आप इसे मध्यस्थों की तुलना करके नहीं बता सकते। न ही आप इसे दूसरे नमूने के मध्यिका के ऊपर या नीचे प्रत्येक नमूने में अनुपात को देखकर बता सकते हैं। आपको एक अलग तुलना करनी होगी।]

यह है कि, जबकि औसत आदमी औसत महिला से तेज हो सकता है, समय का एक नमूना (या उस समय के लिए एक निरंतर वितरण) संभव है, जहां मौका है कि एक यादृच्छिक आदमी एक यादृच्छिक महिला की तुलना में तेज है से कम । बड़े नमूनों में दो विपरीत संकेत प्रत्येक महत्वपूर्ण हो सकते हैं।12


उदाहरण:

डेटा सेट A:

 1.58  2.10 16.64 17.34 18.74 19.90  1.53  2.78 16.48 17.53 18.57 19.05
 1.64  2.01 16.79 17.10 18.14 19.70  1.25  2.73 16.19 17.76 18.82 19.08
 1.42  2.56 16.73 17.01 18.86 19.98

डेटा सेट बी:

 3.35  4.62  5.03 20.97 21.25 22.92  3.12  4.83  5.29 20.82 21.64 22.06
 3.39  4.67  5.34 20.52 21.10 22.29  3.38  4.96  5.70 20.45 21.67 22.89
 3.44  4.13  6.00 20.85 21.82 22.05

डेटा सेट C:

 6.63  7.92  8.15  9.97 23.34 24.70  6.40  7.54  8.24  9.37 23.33 24.26
 6.18  7.74  8.63  9.62 23.07 24.80  6.54  7.37  8.37  9.09 23.22 24.16
 6.57  7.58  8.81  9.08 23.43 24.45

(डेटा यहां हैं , लेकिन वहां एक अलग उद्देश्य के लिए इस्तेमाल किया जा रहा है - मेरे स्मरण के लिए मैंने इसे खुद बनाया है)

ध्यान दें कि A <B का अनुपात 2/3 है, A <C का अनुपात 5/9 है और B <C का अनुपात 2/3 है। ए बनाम बी और बी बनाम सी दोनों 5% के स्तर पर महत्वपूर्ण हैं, लेकिन हम नमूनों की पर्याप्त प्रतियां जोड़कर किसी भी स्तर के महत्व को प्राप्त कर सकते हैं। हम नमूनों से नक़ल करके भी, लेकिन पर्याप्त रूप से छोटे घबराना (अंकों के बीच के सबसे छोटे अंतराल से काफी छोटे) से बच सकते हैं।

सैंपल मेडियन दूसरी दिशा में जाते हैं: मेडियन (ए)> मेडियन (बी)> मेडियन (सी)

फिर हम कुछ तुलनात्मक स्तर पर - किसी भी महत्व के स्तर के लिए - नमूनों की पुनरावृत्ति के द्वारा महत्व प्राप्त कर सकते हैं।

नमूने ए, बी और सी के स्ट्रिपचार्ट, मेडियन के विपरीत दिशा में पी (ए <बी) दिखाने में चिह्नित किए गए मध्यस्थों के साथ आदि।

इसे वर्तमान समस्या से संबंधित करने के लिए, कल्पना करें कि A "महिलाओं का समय" है और B "पुरुषों का समय" है। तब मध्ययुगीन पुरुषों का समय तेज़ होता है, लेकिन बेतरतीब ढंग से चुना गया आदमी उस समय का 2/3 एक बेतरतीब ढंग से चुनी गई महिला की तुलना में धीमा होगा।

नमूने ए और सी से हमारे क्यू लेना हम डेटा का एक बड़ा सेट उत्पन्न कर सकते हैं (आर में) निम्नानुसार है:

n <- 300
F <- c(runif(n/3,0,5),runif(n-n/3,15,20))
M <- c(runif(n-n/3,7.5,12.5),runif(n/3,22.5,27.5))

F का माध्य 16.25 के आसपास होगा जबकि M का माध्य 11.25 के आसपास होगा लेकिन उन मामलों का अनुपात जहां F <M 5/9 होगा।

[यदि हमने एन / 3 को एक द्विपद वैरिएबल के साथ मापदंडों से बदल दिया है n तथा 13 हम उस जनसंख्या से नमूना लेंगे जहाँ F के वितरण का माध्य 16.25 पर है जबकि M के वितरण का माध्य 11.25 पर है। इस बीच उस आबादी में संभावना है कि एफ <एम फिर से 5/9 होगा।]

उस पर भी ध्यान दें P(F<med(M))=23 तथा P(M>med(F))=23 जबकि med(M)<med(F) (पर्याप्त दूरी तक)।


मैं देख सकता हूं कि कैसे साधन विपरीत दिशाओं में जा सकते हैं, लेकिन मैं अपने अंतर्ज्ञान को स्वीकार करता हूं यहां ओपी से मेल खाता है। मैं यह नहीं देखता कि (कैसे नमूना त्रुटि के मुद्दे से अलग) कर सकते हैं।
गुंग - को पुनः स्थापित मोनिका

@ गुंग I ने एक उदाहरण शामिल किया। मैं अपने शुरुआती अंतर्ज्ञानों को इस तरह से प्यार करता हूं - उनके प्रति प्रतिकार खोजकर। यदि मैं अधिक आता हूं (मुझे विश्वास है कि मेरे पास कहीं और है) मैं उनका उल्लेख करने की कोशिश करूंगा।
Glen_b -Reinstate Monica

मूल प्रश्न में बॉक्सप्लॉट से पता चलता है कि पुरुषों का लगभग 60-65% (नेत्रगोलक द्वारा) महिलाओं के लिए औसत समय से कम है (अर्थात 50% महिलाओं के लिए समय से कम)। यह वह टुकड़ा है जिसे मैं दूर करना चाहूंगा।
जीरा

@ मेरे ऊपर A और C के नमूने में C, 2/3 की C, A के लिए माध्यिका से कम हैं (अधिकांश C, माध्य A की तुलना में तेज़ हैं), जबकि P(Ai<Cj) यादृच्छिक के लिए i,jलगभग 56% है (ज्यादातर समय एक यादृच्छिक ए एक यादृच्छिक सी धड़कता है)। [मुझे नहीं लगता कि आपका निष्कर्ष वास्तव में आपके डेटा के बारे में गलत है, यह सिर्फ इतना है कि यह जानकारी का एकमात्र टुकड़ा इसे स्थापित करने के लिए पर्याप्त नहीं होगा।] - मैंने उस विशिष्ट के बारे में अपनी पोस्ट के अंत में एक छोटा सा संपादन किया है। तुलना। मुझे लगता है कि एक ही समय में आपके हिस्टोग्राम और बॉक्सप्लेट में विवरणों का मिलान करना और मेरे द्वारा बनाए गए उलट-पलट की स्थिति को प्राप्त करना बहुत मुश्किल होगा
Glen_b -Reinstate Monica

3
मैं वाक्यांश की व्याख्या करता हूं "अधिकांश पुरुष ज्यादातर महिलाओं की तुलना में तेज़ होते हैं" के रूप में "कम से कम 50% पुरुष कम से कम 50% महिलाओं की तुलना में तेज़ हैं"। दूसरे शब्दों में: एक आदमी एक्स को देखते हुए, यह पूछना समझ में आता है कि क्या एक्स 50% महिलाओं की तुलना में तेज है। मेरे लिए, दावा तो कहता है कि कम से कम 50% पुरुषों के पास यह संपत्ति है। यह (मुझे लगता है) सही है अगर औसत आदमी औसत महिला की तुलना में तेज है, क्योंकि 50% पुरुष मध्ययुगीन पुरुष की तुलना में तेज होंगे, जो औसत महिला की तुलना में तेज है, जो 50% महिलाओं की तुलना में तेज है। (लेकिन ध्यान दें कि यह केवल 25% महिला-पुरुष जोड़े को शामिल करता है, जो मुझे लगता है कि आपके महान उदाहरण की व्याख्या करता है।)
मैथमैटैंडन

3

इस ब्लॉग पोस्ट से निम्नलिखित आंकड़े लिए गए हैं , जो इन विचारों के एक महत्वपूर्ण व्यावहारिक अनुप्रयोग को दर्शाता है ।

मानकीकरण 2 वितरणों की तुलना करने के लिए एक शक्तिशाली उपकरण प्रदान करता है। निम्नलिखित 3 आंकड़े इंग्लैंड के नेशनल चाइल्ड मेजरमेंट प्रोग्राम (NCMP) के 130 महीने के लड़के और लड़कियों की ऊंचाइयों की तुलना करते हैं। (इस डेटा सेट में यह सामान्य आयु थी; मैंने इसे केवल सबसे अधिक डेटा प्राप्त करने के लिए चुना था, और इसलिए एक ही आयु के भीतर सबसे चिकनी भूखंड हैं।)

चित्र 1: इंग्लैंड के राष्ट्रीय बाल मापन कार्यक्रम (NCMP) से 130 महीने की उम्र के लड़के और लड़कियों की ऊँचाई

चित्र 1: इंग्लैंड के राष्ट्रीय बाल मापन कार्यक्रम (NCMP) से 130 महीने की उम्र के लड़के और लड़कियों की ऊँचाई

चित्र 2: 130 महीने से अधिक उम्र के लड़कों और लड़कियों के लिए ऊंचाई के प्रतिशत।  स्रोत: अंग्रेजी एनसीएमपी

चित्र 2: 130 महीने से अधिक उम्र के लड़कों और लड़कियों के लिए ऊंचाई के प्रतिशत। स्रोत: अंग्रेजी एनसीएमपी

चित्र 3: समान उम्र के लड़कों के सापेक्ष 130-महीने की लड़कियों की ऊंचाइयों का वितरण।

चित्र 3: एक ही उम्र के लड़कों के सापेक्ष 130-महीने की लड़कियों की ऊंचाइयों का वितरण।

इन आंकड़ों के अंतिम में, लड़कों की हाइट के अनुसार ऊंचाई की तुलना मानकीकृत की गई है । इस प्रकार, चित्र 3 में बिंदीदार ग्रे लाइनों के साथ पढ़ना, आप इस तरह के बयान कर सकते हैं:

  • लड़कों के लिए माध्यिका (यानी, 50 वीं-प्रतिशताइल) ऊंचाई लड़कियों के लिए लगभग 45 प्रतिशत है। इस प्रकार, 100% - 45% = 55% लड़कियां औसत दर्जे के लड़के से लंबी थीं।
  • लड़कियों के लिए शीर्ष-चतुर्थक ऊँचाई (75 वाँ प्रतिशत) लड़कों के लिए शीर्ष पंचक (80 वाँ प्रतिशत) मारती है। इस प्रकार, 130 मोस की उम्र के बच्चों में, 4 में से 3 लड़कियों से लंबी एक लड़की भी 5 में से 4 लड़कों से लंबी है।

इस भूखंड में संभावित भ्रम का एक बिंदु उल्लेख के योग्य है। हालांकि लड़कों की 45 ° लाइन लड़कियों के मैजेंटा कर्व की तुलना में प्लॉट पर 'अधिक' है, फिर भी यह अवलोकन अच्छी तरह से ज्ञात तथ्य से मेल खाता है कि इस उम्र में (ये 6 वें ग्रेडर हैं), लड़कियां आमतौर पर लड़कों की तुलना में अधिक लंबी होती हैं। । ध्यान दें कि यह उंचाई ठीक से इस तथ्य से परिलक्षित होती है कि मजेंटा वक्र नीले रंग की रेखा के सापेक्ष सही स्थानांतरित हो गया है

यह दृष्टिकोण काफी सामान्य है । इस तरह की तुलना के तहत, समूहों में से एक - एक जिसे आप मानकीकृत करते हैं - 45 ° लाइन बन जाता है। अन्य समूह सामान्य रूप से किसी भी मोनोटोन बढ़ते हुए वक्र को निचले बाएं से ऊपर दाएं तरफ खींच सकते हैं। बशर्ते कि अंतर्निहित वितरण निरंतर हैं (घनत्व में बिंदु द्रव्यमान की कमी है), तुलनात्मक वक्र निरंतर होगा। यदि अंतर्निहित घनत्व समान समर्थन साझा करते हैं , तो वक्र से चलना चाहिए(0,0) सेवा (1,1)

आपका मूल प्रश्न अब ज्यामितीय शब्दों में पुनर्गठित किया जा सकता है, एक प्रश्न के रूप में कि क्या आप चित्र 3 के मैजेंटा वक्र को खींच सकते हैं ताकि एक साथ प्राप्त करने के लिए (ए) के मध्य और (बी) के बीच का संबंध थोड़ा मायावी संबंध जो कि Glen_b हो उसके जवाब में स्पष्ट (सही-सही, मुझे विश्वास है)। मुझे आश्चर्य है कि यदि वितरण संबंधी असंतुलन (घनत्व में बिंदु द्रव्यमान) एक 'रोगात्मक' मामले को प्रदान करने में सक्षम हो सकता है। मैं अनुमान लगाता हूं कि इस तरह का कोई भी पैथोलॉजिकल केस prov नियम को साबित करने वाला अपवाद ’होगा।


यदि कोई आपके क्विज़ प्रश्न का सबसे सरल, तार्किक अनुवाद विश्लेषण के लिए अधिक औपचारिक भाषा में करता है, तो (ऊपर से बच्चों की हाइट्स की सेटिंग का उपयोग करके) हम एक व्यक्ति कहना चाहेंगे x यदि संपत्ति TMB है तो xमी ओस्ट बी oys की तुलना में टी एलर है । तब आपके क्विज प्रश्न ने पूछा कि क्या ज्यादातर लड़कियों के पास टीएमबी संपत्ति है । यदि कोई 'सबसे' को आधे से अधिक परिभाषित करता है , तो टीएमबी संपत्ति का मतलब मंझले कद के लड़के से लंबा होना है। यह पूछे जाने पर कि क्या ज्यादातर लड़कियों के पास टीएमबी संपत्ति है, यह पूछने के लिए कि क्या औसत लड़की के पास यह संपत्ति है। इस खाते पर, प्रश्नोत्तरी प्रश्न का उत्तर हां होगा ।

दूसरी ओर, यदि 'अधिकांश' का वास्तविक आशय "> 50%" था, तो व्यक्ति अधिक सटीक वाक्यांश "बहुसंख्यक" नियोजित होने की उम्मीद कर सकता है। अगर कोई मुझे "शायद" कुछ बताता है, तो मुझे लगता है कि 60% या उससे अधिक व्यक्तिपरक संभावना है। इसी तरह, मेरे लिए "सबसे" का मतलब कुछ और है जैसे 70-80%। स्पष्ट रूप से, ऊपर दिए गए कथानक से, यदि 'अधिकांश' को कसौटी के रूप में 52.5% से अधिक कठोर मान लिया जाता है, तो आप यह नहीं कह सकते हैं कि "अधिकांश लड़कियों [के पास संपत्ति है कि वे] अधिकांश लड़कों की तुलना में अधिक लंबी हैं।" मुझे आश्चर्य है कि अगर प्रश्नोत्तरी प्रश्न के लिए तर्क का हिस्सा शब्दों की एक परीक्षा को प्रोत्साहित करना था क्योंकि वे संख्यात्मक धारणाओं से संबंधित हैं। (यदि आपको लगता है कि यह सब थोड़ा मूर्खतापूर्ण है, तो विचार करें इन ग्राफों पर, दिखाते हैं कि लोग अलग-अलग संभाव्य शब्दों और वाक्यांशों की व्याख्या कैसे करते हैं।) शायद इरादा भी इस बिंदु को रेखांकित करना था कि वास्तविक दुनिया के वितरण में बहुत भिन्नता मौजूद है, और यह कि एक एकल आँकड़ा (माध्य, मतलब, क्या-क्या है) आप) शायद ही कभी व्यापक, व्यापक बयानों का समर्थन करेंगे।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.