एंडी फील्ड्स, एट ऑल, आर ऑल का उपयोग करके खोज सांख्यिकी की धारा 1.7.2 , औसत बनाम माध्य के गुणों को सूचीबद्ध करते हुए, बताती है:
... मतलब अलग-अलग नमूनों में स्थिर होता है।
मंझला के कई गुणों की व्याख्या करने के बाद, जैसे
... वितरण के किसी भी छोर पर औसतन चरम स्कोर से औसतन अप्रभावित है ...
यह देखते हुए कि मध्ययुगीन चरम स्कोर से अपेक्षाकृत अप्रभावित है, मैंने सोचा होगा कि यह नमूनों में अधिक स्थिर होगा। इसलिए मैं लेखकों के जोर से हैरान था। पुष्टि करने के लिए मैंने एक सिमुलेशन चलाया - मैंने 1M यादृच्छिक संख्याएँ उत्पन्न कीं और 100 नंबरों की 1000 बार गणना की और प्रत्येक नमूने के माध्य और माध्यिका की गणना की और फिर उन नमूना साधनों और माध्यकों की एसडी गणना की।
nums = rnorm(n = 10**6, mean = 0, sd = 1)
hist(nums)
length(nums)
means=vector(mode = "numeric")
medians=vector(mode = "numeric")
for (i in 1:10**3) { b = sample(x=nums, 10**2); medians[i]= median(b); means[i]=mean(b) }
sd(means)
>> [1] 0.0984519
sd(medians)
>> [1] 0.1266079
p1 <- hist(means, col=rgb(0, 0, 1, 1/4))
p2 <- hist(medians, col=rgb(1, 0, 0, 1/4), add=T)
जैसा कि आप देख सकते हैं कि माध्यकों की तुलना में साधन अधिक कसकर वितरित किए जाते हैं।
संलग्न छवि में लाल हिस्टोग्राम मंझला लोगों के लिए है - जैसा कि आप देख सकते हैं कि यह कम लंबा है और इसमें फैटर टेल है जो लेखक के दावे की पुष्टि करता है।
मैं इस से भड़क रहा हूँ, हालांकि! माध्यिका जो अधिक स्थिर है वह अंततः नमूनों में अधिक भिन्न हो सकती है? यह विरोधाभास लगता है! किसी भी अंतर्दृष्टि की सराहना की जाएगी।
rnorm
साथ बदलने का प्रयास करें rcauchy
।