रेटिंग के लिए आत्मविश्वास अंतराल कैसे खोजें?

32

इवान मिलर की " औसत रेटिंग के आधार पर छाँटने का तरीका नहीं " रेटेड वस्तुओं के लिए एक समझदार कुल "स्कोर" प्राप्त करने के लिए आत्मविश्वास अंतराल के निचले हिस्से का उपयोग करने का प्रस्ताव है। हालाँकि, यह एक बर्नौली मॉडल के साथ काम कर रहा है: रेटिंग्स या तो अंगूठे ऊपर हैं या अंगूठे नीचे हैं।

रेटिंग मॉडल के लिए उपयोग करने के लिए एक उचित आत्मविश्वास अंतराल क्या है जो $1$ से $k$ सितारों का असतत स्कोर प्रदान करता है , यह मानते हुए कि किसी आइटम के लिए रेटिंग की संख्या छोटी हो सकती है?

मुझे लगता है कि मैं देख सकता हूं कि विल्सन और एगेस्टी-कूप के बीच के अंतराल को कैसे अनुकूलित किया जा सकता है

\tilde{p} = \frac{\sum_{i = 1}^{n} x_{i} + z_{α / 2}^{2} p_{0}}{n + z_{α / 2}^{2}}

$\tilde{p} = \frac{\sum_{i=1}^n{x_i} + z_{\alpha/2}^2\; p_0}{n + z_{\alpha/2}^2}$

जहां या तो या (शायद बेहतर) यह सभी वस्तुओं पर औसत रेटिंग है। हालांकि, मुझे यकीन नहीं है कि अंतराल की चौड़ाई को कैसे अनुकूलित किया जाए। मेरा (संशोधित) सबसे अच्छा अनुमान होगा $p_0 = \frac{k+1}{2}$

\tilde{p} \pm \frac{z_{α / 2}}{\tilde{n}} \sqrt{\frac{\sum_{i = 1}^{n} (x_{i} - \tilde{p})^{2} + z_{α / 2} (p_{0} - \tilde{p})^{2}}{\tilde{n}}}

$\tilde{p} \pm \frac{z_{\alpha/2}}{\tilde{n}} \sqrt{\frac{\sum_{i=1}^n{(x_i - \tilde{p})^2} + z_{\alpha/2}(p_0-\tilde{p})^2}{\tilde{n}}}$

साथ $\tilde{n} = n + z_{\alpha/2}^2$ , लेकिन मैं और अधिक से अधिक Agresti-Coull की एक सादृश्य के रूप में यह हाथ से लहराते, के रूप में है कि लेने के साथ औचित्य नहीं कर सकते हैं

Estimate (\bar{X}) \pm \frac{z_{α / 2}}{\tilde{n}} \sqrt{Estimate (Var (X))}

$\text{Estimate}(\bar{X}) \pm \frac{z_{\alpha/2}}{\tilde{n}} \sqrt{\text{Estimate}(\text{Var}(X))}$

क्या मानक आत्मविश्वास अंतराल हैं जो लागू होते हैं? (ध्यान दें कि मेरे पास किसी भी पत्रिका के लिए सदस्यता नहीं है या विश्वविद्यालय के पुस्तकालय तक आसान पहुंच नहीं है; हर तरह से उचित संदर्भ देते हैं, लेकिन कृपया वास्तविक परिणाम के साथ पूरक करें!)

confidence-interval estimation

— पीटर टेलर
स्रोत

4

क्योंकि वर्तमान उत्तरों में (शायद राजनीति से बाहर) इस मुद्दे पर घिरे हुए हैं, मैं यह बताना चाहूंगा कि यह एप्लिकेशन विश्वास सीमाओं का एक भयानक दुरुपयोग है। LCL का उपयोग करने के लिए रैंक के साधनों का कोई सैद्धांतिक औचित्य नहीं है (और बहुत सारे कारण हैं कि LCL वास्तव में रैंकिंग के उद्देश्यों के लिए औसत से भी बदतर है)। इस प्रकार यह प्रश्न बुरी तरह से दोषपूर्ण दृष्टिकोण पर आधारित है, जिसके कारण यह अपेक्षाकृत कम ध्यान आकर्षित कर सकता है।

— whuber

2

इस विशेष प्रश्न की एक अच्छी विशेषता यह है कि इसमें वास्तविक प्रश्न को नजरअंदाज करने के लिए हमारे पास पर्याप्त संदर्भ है और जो एक अधिक महत्वपूर्ण अंतर्निहित है, उस पर ध्यान केंद्रित करें।

— कार्ल

1

मुझे खुशी है कि आपने अपनी पसंद, पीटर को बदले हुए शीर्षक को संशोधित किया। मेरा मूल संपादन स्व-सेवा करने के लिए नहीं, बल्कि शीर्षक को प्रश्न के पाठ को प्रतिबिंबित करने के लिए बनाया गया था। आप वास्तव में क्या मतलब है के अंतिम मध्यस्थ हैं।

— व्हीबर

23

जैसे कार्ल ब्रोमन ने अपने जवाब में कहा, एक बायेसियन दृष्टिकोण आत्मविश्वास अंतराल का उपयोग करने की तुलना में बहुत बेहतर होगा।

विश्वास अंतराल के साथ समस्या

आत्मविश्वास के अंतराल का उपयोग करना बहुत अच्छा काम क्यों नहीं कर सकता है? एक कारण यह है कि यदि आपके पास किसी आइटम के लिए कई रेटिंग नहीं हैं, तो आपका आत्मविश्वास अंतराल बहुत व्यापक होने वाला है, इसलिए आत्मविश्वास अंतराल का निचला भाग छोटा होगा। इस प्रकार, कई रेटिंग्स वाले आइटम आपकी सूची में सबसे नीचे होंगे।

सहज रूप से, हालांकि, आप शायद औसत रेटिंग के पास कई रेटिंग्स के बिना आइटम चाहते हैं, इसलिए आप आइटम की अपनी अनुमानित रेटिंग को सभी वस्तुओं पर औसत रेटिंग की ओर आकर्षित करना चाहते हैं (यानी, आप अपनी अनुमानित रेटिंग को पूर्व की ओर धकेलना चाहते हैं ) । यह वही है जो एक बायेसियन दृष्टिकोण करता है।

बायेसियन दृष्टिकोण I: रेटिंग पर सामान्य वितरण

पूर्व की ओर अनुमानित रेटिंग को स्थानांतरित करने का एक तरीका है, जैसा कि कार्ल के उत्तर में है, फॉर्म अनुमान का उपयोग करने के लिए : $w*R + (1-w)*C$

वस्तुओं के लिए रेटिंग पर का मतलब है। $R$
सभी वस्तुओं (या जो कुछ भी आप अपनी रेटिंग को हटना चाहते हैं) से अधिक है। $C$
ध्यान दें कि सूत्र और का एक भारित संयोजन है $R$ । $C$
को दिया गया भार है, जहाँ $w = \frac{v}{v+m}$ $R$ $v$ बियर और लिए समीक्षाओं की संख्या है $m$ किसी प्रकार का निरंतर "थ्रेशोल्ड" पैरामीटर है।
ध्यान दें कि जब बहुत बड़ा है, यानी, जब हमारे पास वर्तमान आइटम के लिए बहुत सारी रेटिंग है, तो 1 के बहुत करीब है, इसलिए हमारी अनुमानित रेटिंग बहुत करीब है और हम पूर्व थोड़ा ध्यान देते हैं । जब छोटा होता है, तब, 0 के बहुत करीब होता है, इसलिए अनुमानित रेटिंग पूर्व पर बहुत अधिक भार रखती । $v$ $w$ $R$ $C$ $v$ $w$ $C$

यह अनुमान, वास्तव में, वस्तु की औसत रेटिंग के पीछे के अनुमान के रूप में एक बायेसियन व्याख्या दे सकता है जब व्यक्तिगत रेटिंग उस मतलब के आसपास केंद्रित एक सामान्य वितरण से आती है।

हालांकि, यह मानते हुए कि रेटिंग सामान्य वितरण से आती है, दो समस्याएं हैं:

एक सामान्य वितरण निरंतर है , लेकिन रेटिंग्स हैं असतत हैं ।
एक आइटम के लिए रेटिंग जरूरी नहीं कि एक असमान गॉसियन आकार का पालन करें। उदाहरण के लिए, शायद आपका आइटम बहुत ध्रुवीकरण कर रहा है, इसलिए लोग या तो इसे बहुत उच्च रेटिंग देते हैं या इसे बहुत कम रेटिंग देते हैं।

बायेसियन दृष्टिकोण II: रेटिंग पर बहुराष्ट्रीय वितरण

इसलिए रेटिंग के लिए एक सामान्य वितरण संभालने के बजाय, आइए एक बहुराष्ट्रीय वितरण मान लें । अर्थात्, कुछ विशिष्ट आइटम दिए गए हैं, संभावना कि एक यादृच्छिक उपयोगकर्ता इसे 1 स्टार, एक प्रायिकता $p_1$ $p_2$ कि एक यादृच्छिक उपयोगकर्ता इसे 2 स्टार देगा, और इसी तरह।

बेशक, हमें पता नहीं है कि ये संभावनाएं क्या हैं। जैसा कि हम इस आइटम के लिए अधिक से अधिक रेटिंग प्राप्त करते हैं, हम अनुमान लगा सकते हैं कि करीब है $p_1$ , जहांउन उपयोगकर्ताओं की संख्या है जिन्होंने इसे 1 स्टार दिया है औरकुल उपयोगकर्ताओं की संख्या है जिन्होंने आइटम को रेट किया है, लेकिन जब हम पहली बार शुरू करते हैं, तो हमारे पास कुछ भी नहीं है। इसलिए हमइन संभावनाओं परएकडिरिक्लेट पूर्वलगाते हैं। $\frac{n_1}{n}$ $n_1$ $n$ $Dir(\alpha_1, \ldots, \alpha_k)$

क्या यह Dirichlet पूर्व है? हम प्रत्येक पैरामीटर के बारे में सोच सकते हैं कि किसी वर्चुअल व्यक्ति ने आइटम को दिए गए तारों की संख्या की "आभासी गणना" के रूप में । उदाहरण के लिए, यदि , , और अन्य सभी $\alpha_i$ $i$ $\alpha_1 = 2$ $\alpha_2 = 1$ $\alpha_i$ 0 के बराबर हैं, तो हम यह सोचकर यह कह सकते हैं कि दो आभासी लोगों ने आइटम 1 सितारा दिया और एक आभासी व्यक्ति ने आइटम 2 दिया अभिनय किया है। इसलिए इससे पहले कि हम कोई वास्तविक उपयोगकर्ता प्राप्त करें, हम इस आभासी वितरण का उपयोग आइटम की रेटिंग का अनुमान लगाने के लिए कर सकते हैं।

[ मापदंडों को चुनने का एक तरीका यह होगा कि को तारों के वोटों के समग्र अनुपात के बराबर सेट । (ध्यान दें कि पैरामीटर आवश्यक रूप से पूर्णांक नहीं हैं।)] $\alpha_i$ $\alpha_i$ $i$ $\alpha_i$

फिर, एक बार वास्तविक रेटिंग्स आने के बाद, बस अपने ड्यूरिचलेट के वर्चुअल काउंट्स से पहले अपनी गिनती जोड़ें। जब भी आप अपने आइटम की रेटिंग का अनुमान लगाना चाहते हैं, तो बस आइटम की सभी रेटिंग्स (दोनों वर्चुअल रेटिंग्स और उसकी रेटिंग रेटिंग्स) पर माध्य लें।

— raegtin
स्रोत

1

दृष्टिकोण 2 समान दृष्टिकोण 1 के समान है, क्या यह नहीं है, लेकिन एक अलग औचित्य के साथ?

— पीटर टेलर

2

@ अभिनेता: ओह, सच! एहसास नहीं हुआ कि जब तक आपने इसका उल्लेख नहीं किया =)। (यदि आप सब करना चाहते हैं तो पीछे के साधन का उपयोग करें, वे समान हैं। मुझे लगता है कि यदि आप एक अलग तरह के स्कोर की गणना करना चाहते हैं तो एक ड्यूरिचेल पोस्टीरियर उपयोगी हो सकता है, जैसे, किसी प्रकार का ध्रुवता माप, हालांकि वह दुर्लभ की तरह हो सकता है।)

— रैगेटिन

1

m

$m$

15

यह स्थिति बायेसियन दृष्टिकोण के लिए रोती है। यहां रेटिंग्स की बेयसियन रैंकिंग के लिए सरल दृष्टिकोण हैं (टिप्पणियों के लिए विशेष रूप से भुगतान करें , जो दिलचस्प हैं) और यहां , और फिर यहां इन पर एक और टिप्पणी । इन कड़ियों में से पहली टिप्पणी में से एक के रूप में बताते हैं:

BeerAdvocate (बीए) के सर्वश्रेष्ठ ... एक Bayesian अनुमान का उपयोग करता है:

भारित रैंक (WR) = (v / (v + m)) × R + (m / (v + m)) × C

जहां:
आर = बीयर की समीक्षा के लिए औसत
v = बीयर की समीक्षा के लिए
मी = न्यूनतम समीक्षा सूचीबद्ध करने के लिए आवश्यक न्यूनतम (वर्तमान में 10)
सी = सूची में औसत (वर्तमान में 2.5)

— कार्ल
स्रोत

2

बीयर एडवोकेट विधि का एक नुकसान यह है कि यह परिवर्तनशीलता का ध्यान नहीं रखता है। फिर भी, मैं कम उदासीनता सीमा विचार के लिए सोच की इस पंक्ति को पसंद करता हूं।

— कार्ल