"कोई चित्रमय विधियाँ" एक बड़े बाधा की तरह नहीं है, लेकिन ... यहाँ कुछ अजीब विचार हैं। दोनों रेटिंग्स को निरंतर मानते हैं, जो एक वैचारिक कमजोरी है, और शायद केवल एक ही नहीं ...
कुकुदता
- {1,1,1,5,5,5} = का कर्टोसिस 1 -5 रेटिंग वाले किसी भी कॉम्बो के साथ आपको कम कर्टोसिस नहीं मिलेगा।
- {1,2,3,4,5} का कुर्तोसिस = 1.7। निचले का अर्थ है अधिक चरम मान; अधिक मध्य का मतलब है।
- यदि वितरण लगभग सममित नहीं है तो यह काम नहीं करेगा। मैं नीचे प्रदर्शित करूँगा।
नकारात्मक द्विपद प्रतिगमन
: इस तरह एक डेटा फ्रेम के साथ फ़िट मॉडल एफ आर ई क्यू यू ई एन सी y ~ आर एक टी मैं n जी + √
Rating12345Frequency31157937
नकारात्मक द्विपद प्रतिगमन का उपयोग कर। द
√Frequency∼Rating+Rating−−−−−−√ गुणांक शून्य के पास होना चाहिए, अगर रेटिंग कर रहे हैं
समान रूप से वितरितसकारात्मक है, अगर वहाँ आनुपातिक अधिक मध्यम रेंज मूल्यों (सीएफ हैं
द्विपद बंटनRating−−−−−−√ ), या इसके बाद के संस्करण है, जो के लिए गुणांक है जैसे ध्रुवीकरण वितरण के साथ नकारात्मक - 11.8।
FWIW, यहाँ मैं जिस r कोड के साथ खेल रहा हूँ, वह है:
x=rbinom(99,4,c(.1,.9))+1;y=sample(0:4,99,replace=T)+1 #Some polarized & uniform rating data
table(x);table(y) #Frequencies
require(moments);kurtosis(x);kurtosis(y) #Kurtosis
Y=data.frame(n=as.numeric(table(y)),rating=as.numeric(levels(factor(y)))) #Data frame setup
X=data.frame(n=as.numeric(table(x)),rating=as.numeric(levels(factor(x)))) #Data frame setup
require(MASS);summary(glm.nb(n~rating+sqrt(rating),X)) #Negative binomial of polarized data
summary(glm.nb(n~rating+sqrt(rating),Y)) #Negative binomial of uniform data
प्लॉट में फेंकने का विरोध नहीं कर सकते ...
require(ggplot2);ggplot(X,aes(x=rating,y=n))+geom_point()+stat_smooth(formula=y~x+I(sqrt(x)),method='glm',family='poisson')
द Rating−−−−−−√
संपादित करें: बस इस प्रश्न को साइडबार पर विज्ञापित देखा है:
और जब मैंने क्लिक किया, तो मैंने इसे हॉट नेटवर्क प्रश्नों में खुद को वापस लिंक करते हुए देखा, जैसा कि कभी-कभी होता है ,
इसलिए मैंने सोचा कि यह अधिक आम तौर पर उपयोगी तरीके से फिर से देखने के लायक हो सकता है। मैंने माउंटेन थ्री वुल्फ मून शॉर्ट स्लीव टी के लिए अमेज़ॅन ग्राहक समीक्षाओं पर अपने तरीके आज़माने का फैसला किया :
RatingFrequency1208254389419852273
βRating√=−19.1
σ2FrequencyThe Mountain Three Wolf Moon Short Sleeve Tee Ratings=1.31
x=rep(5:1,c(2273,198,89,54,208))
var(x)/(4*length(x)/(length(x)-1))