क्या माध्य माध्य से अधिक उचित है?


17

मैंने हाल ही में सलाह पढ़ी है कि आपको आम तौर पर मध्यवर्ग का उपयोग करना चाहिए न कि आउटलेर्स को खत्म करने के लिए। उदाहरण: निम्न आलेख http://www.amazon.com/Forensic-Science-Introduction-Scientific-Investigative/product-reviews/1420064932/

इस समय 16 समीक्षाएँ हैं:

review= c(5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 4, 4, 3, 2, 1, 1)
summary(review)  ## "ordinary" summary

Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
1.000   3.750   5.000   4.062   5.000   5.000 

क्योंकि वे मीन का उपयोग करते हैं लेख को 4 स्टार मिलते हैं लेकिन अगर वे मेडियन का उपयोग करते हैं तो इसे 5 स्टार मिलेंगे।

क्या मंझला 'फेयर' जज नहीं है?


एक प्रयोग बताता है कि माध्यिका की त्रुटि हमेशा माध्य से बड़ी होती है। मध्यमा बदतर है?

library(foreach)

#the overall population of bookjudgments
n<-5
p<-0.5
expected.value<-n*p
peoplesbelieve <-rbinom(10^6,n, p)

#16 ratings made for 100 books
ratings <- foreach(i=1:100, .combine=rbind) %do% sample(peoplesbelieve,16)
stat <- foreach(i=1:100, .combine=rbind) %do% c(mean=mean(ratings[i,]), median=median(ratings[i,]))

#which mean square error is bigger? Mean's or Median's?
meansqrterror.mean<-mean((stat[,"mean"]-expected.value)^2)
meansqrterror.median<-mean((stat[,"median"]-expected.value)^2)

res<-paste("mean MSE",meansqrterror.mean)
res<-paste(res, "| median MSE", meansqrterror.median)
print(res)


3
क्यों 5 स्टार रेटिंग उचित होगी? 6/16 समीक्षाएं हैं, जिन्होंने कम रेटिंग दी ...
nico

ठीक है, आपको लगता है कि औसत सही औसत है? बहुमत ने कहा कि इसके 5. 60% अधिक बाकी 6/16 ने ऐसा कहा।
रोलैंड कोफ्लर

2
अगर मुझे असतत मूल्यांकन देना होता, तो उन 16 समीक्षाओं को देखकर मैं 4 देता, 5 नहीं, जैसा कि मेरे लिए- 5 का मतलब होगा कि सभी (या महान बहुमत) के वोट 5. 6/16 ~ 40% हैं , जो बिल्कुल नगण्य नहीं है।
निको

8
तो, संक्षेप में, मुझे लगता है कि न तो इसका मतलब है और न ही माध्य अच्छा है। अलग-अलग मतों के साथ एक सौदेबाजी (जैसा कि अमेज़न करता है) दिखाना सबसे अच्छा विकल्प है। इसके अलावा, यह बताना दिलचस्प है कि ऑनलाइन 1-5 रेटिंग्स हमेशा इतनी निष्पक्ष नहीं होती हैं ... youtube-global.blogspot.com/2009/09/…
nico

1
@ निको: स्कोरिंग जाल से भरा हुआ है, जो आप बताते हैं वह मेरे लेख के तर्कों में से एक है: objektorient.blogspot.com/2010/09/…
रोलाण्ड

जवाबों:


26

समस्या यह है कि आपने वास्तव में परिभाषित नहीं किया है कि अच्छी या उचित रेटिंग का क्या मतलब है। आप @ केविन के जवाब पर एक टिप्पणी में सुझाव देते हैं कि अगर आपको कोई समीक्षा बुरी लगती है तो आप उसे पसंद नहीं करते हैं। लेकिन दो वस्तुओं की तुलना करना जहां एक का "सही रिकॉर्ड" है और दूसरे की एक बुरी समीक्षा है, शायद उस अंतर को प्रतिबिंबित किया जाना चाहिए।

kn11+(2k1n)2exp((2k1n)2n2)


22

आपको जो उत्तर मिलता है वह आपके द्वारा पूछे गए प्रश्न पर निर्भर करता है।

माध्य और माध्य विभिन्न प्रश्नों के उत्तर देते हैं। इसलिए वे अलग-अलग जवाब देते हैं। ऐसा नहीं है कि एक दूसरे की तुलना में "निष्पक्ष" है। मेडियंस का उपयोग अक्सर अत्यधिक तिरछे डेटा (जैसे आय) के साथ किया जाता है। लेकिन, वहाँ भी, कभी-कभी मतलब सबसे अच्छा होता है। और कभी-कभी आप केंद्रीय प्रवृत्ति का कोई माप नहीं चाहते हैं।

इसके अलावा, जब भी आप केंद्रीय प्रवृत्ति का माप देते हैं, तो आपको प्रसार का कुछ उपाय देना चाहिए। सबसे आम पेयरिंग माध्य-मानक विचलन और मध्य-इंटरक्वेर्टाइल रेंज हैं। इन आंकड़ों में, केवल 5 का माध्यिका देना, मुझे लगता है, भ्रामक है, या, कम से कम, बिना सूचना के। औसतन 5 भी होगा अगर हर एक वोट 5 था।


5
प्रसार के माप के बारे में आपकी बात यहाँ एक कुंजी है। यह उन मुद्दों में से एक है जो इस चर्चा में आता है, अन्य नामों के तहत, और यह एरिक पी के वजन योजनाओं की चर्चा के साथ भी जुड़ा हुआ है।
वेन

8

यदि केवल विकल्प 1 से 5 की सीमा में पूर्णांक होते हैं, तो क्या वास्तव में एक आउटलाइन माना जा सकता है?

α=0.05

Grubbs test for one outlier

data:  review  G = 2.0667, U = 0.6963,
p-value = 0.2153 alternative
hypothesis: lowest value 1 is an outlier

क्योंकि आपके उदाहरण में सिर्फ एक व्यक्ति नाटकीय रूप से परिणाम बदल सकता है। यदि व्यक्ति का मानना ​​है कि पुस्तक में एक अलग विषय है तो उसकी गलती रेटिंग को बदल देगी
रोलाण्ड कोफ्लर

2
क्या किसी की राय में गलती है? मैं तर्क दूंगा कि विफलता केवल कुछ डेटा बिंदुओं से एक ही आंकड़े के आधार पर सार्थक निष्कर्ष निकालने की कोशिश कर रही है। जैसा कि @nico द्वारा ऊपर उल्लेख किया गया है, अमेज़ॅन सभी रेटिंगों का एक बार ग्राफ दिखाता है।
किमी 14

5

एक प्रयोग बताता है कि माध्यिका की त्रुटि हमेशा माध्य से बड़ी होती है।

यह आपके द्वारा उपयोग किए जाने वाले लागत फ़ंक्शन पर निर्भर करता है।

MSE को कम से कम किया जाता है। इसलिए यदि आप MSE माध्यिका का उपयोग करते हैं तो हमेशा माध्य से भी बदतर होगा।

लेकिन, अगर आप निरपेक्ष त्रुटि का उपयोग करेंगे, तो इससे भी बदतर होगा!

इस पर एक अच्छा स्पष्टीकरण यहाँ पाया जा सकता है: http://www.johnmyleswhite.com/notebook/2013/03/22/modes-medians-and-means-an-unifying-perspective/

चुनाव आपकी समस्या और वरीयताओं पर निर्भर करता है। यदि आप नहीं चाहते हैं कि "केंद्रीय बिंदु" की स्थिति पर आउटलेर का बड़ा प्रभाव पड़े, तो आप मध्यिका का चयन करते हैं। अगर आप आउटलेयर की परवाह करते हैं, तो आप मतलबी हैं।


4

बस एक त्वरित विचार:

यदि आप मानते हैं कि प्रत्येक रेटिंग एक अव्यक्त निरंतर चर से खींची गई है, तो आप इस अंतर्निहित वितरण के माध्यम के बजाय ब्याज के इस अंतर्निहित निरंतर चर के माध्य को परिभाषित कर सकते हैं। जहाँ वितरण सममित है, तो माध्य और माध्य अंत में समान मात्रा का अनुमान लगा रहे होंगे। जहां वितरण तिरछा होता है, मध्य माध्य से भिन्न होता है। इस मामले में, मेरे दिमाग में, हम जो विशिष्ट मूल्य के रूप में सोचते हैं, उससे अधिक मेल खाते हैं। यह समझने का कोई तरीका है कि औसत आय और मंझला घर की कीमतें आमतौर पर औसत के बजाय रिपोर्ट क्यों की जाती हैं।

हालाँकि, जब आपके पास कम संख्या में असतत मूल्य होते हैं, तो मंझला खराब प्रदर्शन करता है।

शायद, आप कुछ घनत्व अनुमान प्रक्रिया का उपयोग कर सकते हैं और फिर उस का माध्य ले सकते हैं, या कुछ प्रक्षेपित माध्यिका का उपयोग कर सकते हैं।


2

स्टार रेटिंग के लिए माध्यिका का उपयोग करने के बारे में बड़ी बात यह है कि स्मार्ट उपयोगकर्ता (माध्यिका के उपयोग के बारे में जानते हैं) सिस्टम को "खेल" नहीं करेंगे:

यदि तर्कसंगत उपयोगकर्ता को लगता है कि उचित रेटिंग 4 स्टार होनी चाहिए, लेकिन इसमें वर्तमान में 4.5 स्टार हैं, तो चार सितारों को प्राप्त करने का सबसे अच्छा तरीका है (यह मानते हुए कि छह से अधिक वोट मिले हैं) का मतलब औसत रेटिंग प्रणाली में 1 स्टार को वोट देना है ।

जबकि एक औसत आधारित प्रणाली में, उपयोगकर्ता की तर्कसंगत पसंद बस यह है कि उपयोगकर्ता को लगता है कि उत्पाद को कितने सितारों को वोट देना है।

यह स्टार रेटिंग सिस्टम के लिए दूसरी कीमत की नीलामी के बराबर है।


दिलचस्प तर्क, उचित स्कोर कार्यों
एनालॉग

काफी नहीं। मेरा जवाब ऐसे उदाहरण दिखाता है जहां एक नया उच्च या निम्न मान औसतन को स्थानांतरित कर देगा।
निक कॉक्स

काफी नहीं क्या ? अच्छा जवाब, वैसे।
स्टीफन बेर्सियर

तर्कसंगत रणनीति चरम वोट करने के लिए हो सकती है। स्वाभाविक रूप से, हमेशा एक सवाल है कि दूसरों के वोटों के बारे में कितना जाना जाता है।
निक कॉक्स

@NickCox केवल यदि आप वास्तव में चरम को उचित रेटिंग चाहते हैं। इसलिए मुझे विश्वास है कि मैंने जो लिखा है वह सभी मामलों में काम करता है। और यह आपके उत्तर के विपरीत नहीं है।
स्टीफन बेर्सियर

1

कई अच्छे उत्तर अभी भी अधिक टिप्पणियों के लिए जगह छोड़ते हैं।

सबसे पहले, किसी ने इस विचार पर आपत्ति नहीं जताई है कि मध्यमा आउटलेर्स को खत्म करने का इरादा है, लेकिन मैं इसे योग्य करूंगा। अभिप्रेत अर्थ स्पष्ट है, लेकिन वास्तविक डेटा के लिए अधिक जटिल होना आसान है। अधिकांश में, माध्य को छूट देने या आउटलेर्स को नजरअंदाज करने का इरादा है, लेकिन यह भी गारंटी नहीं है। उदाहरण के लिए, 1 1 1 5 5 5 की रेटिंग के साथ माध्य और माध्य 3 पर सहमत हैं, इसलिए सभी अच्छे लग सकते हैं। लेकिन एक अतिरिक्त 5 माध्यिका को 5 तक टिप करेगा और एक अतिरिक्त 1 माध्यिका को 1. को टिप देगा। प्रत्येक मामले में माध्य लगभग 0.286 होगा। इसलिए माध्यिका की तुलना में माध्य यहाँ अधिक प्रतिरोधी है। उदाहरण को असामान्य के रूप में खारिज किया जा सकता है, लेकिन यह अपमानजनक नहीं है। बात मूल नहीं है, स्वाभाविक रूप से। एक जगह जो इसे बनाया गया है वह मोस्टेलर, एफ और टुकी, जेडब्ल्यू 1977 में है। डेटा विश्लेषण और प्रतिगमन। पढ़ना, एमए: एडिसन-वेस्ले, पीपी .3-35।

दूसरा, छंटनी के साधनों का उल्लेख किया गया है और विचार एक बड़ा धक्का देने के योग्य है। मीन और माध्य को स्टार्क विकल्प की आवश्यकता नहीं है, ताकि विश्लेषक को एक (दूसरे के लिए वोट) चुनना पड़े। आप प्रत्येक पूंछ में मूल्यों की एक निश्चित संख्या को ट्रिम करने के आधार पर सभी संभव ट्रिम किए गए साधनों पर विचार कर सकते हैं । तालिका माध्य की गणना में शामिल मानों की संख्या # के रूप में दिखाती है:

  +----------------------------+
  | number    #   trimmed mean |
  |----------------------------|
  |      0   16         4.0625 |
  |      1   14       4.214286 |
  |      2   12       4.416667 |
  |      3   10            4.6 |
  |      4    8           4.75 |
  |      5    6       4.833333 |
  |      6    4              5 |
  |      7    2              5 |
  +----------------------------+

यहां मुख्य तस्वीर यह है कि आप अपने डिस्काउंट रेट (प्रत्येक पूंछ में इतने मूल्यों को संदेह के रूप में अनदेखा कर सकते हैं) को अत्यधिक मूल्यों के कारण बंद होने के जोखिम के खिलाफ एक प्रकार का बीमा चुन सकते हैं। मैं जो देख रहा हूं वह माध्य और माध्यिका के बीच काफी सहज ढाल है, जो यहां अपेक्षित है क्योंकि 1, 2, 3, 4, 5 सभी मान डेटा में मौजूद हैं। अनुक्रम में एक बड़ी छलांग एक अलग-थलग के साथ होने की उम्मीद है।

प्रत्येक पूंछ में समान संख्याओं को ट्रिम करने के लिए ट्रिम किए गए साधनों के साथ कोई दायित्व नहीं है, लेकिन मैं उस पर विस्तार नहीं करूंगा।

तीसरा, उदाहरण अमेज़ॅन समीक्षाओं का है। संदर्भ हमेशा मार्गदर्शक में प्रासंगिक है कि आप डेटा को कैसे सारांशित करना चाहते हैं । अमेज़ॅन की समीक्षा के मामले में सबसे अच्छा जवाब समीक्षाओं को पढ़ना है! जैसा कि उच्च और निम्न ग्रेड एक जैसा होता है, जो सहज ज्ञान युक्त आधार पर होता है (संक्षेप में: इस पुस्तक के लेखक मेरे मित्र हैं) और / या आपके निर्णय के लिए अप्रासंगिक (स्पष्ट रूप से: पुनः विक्रेता ने मेरे साथ बुरा बर्ताव किया है), मेरे लिए कोई स्पष्ट बात नहीं है इस तरह के डेटा को संक्षेप में प्रस्तुत करने के लिए निहितार्थ, और वास्तव में आपको वितरण दिखा कर अमेज़ॅन को अधिकतम जानकारीपूर्ण बनाया जा रहा है।

चौथा, और सबसे प्राथमिक, लेकिन सभी का मौलिक, जो आपको चुन रहा है? कभी-कभी माध्य और मध्य दोनों को सूचित किया जाना चाहिए (और, जैसा कि कहा गया है, एक वितरण ग्राफ भी)।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.