रेटिंग के लिए आत्मविश्वास अंतराल कैसे खोजें?


32

इवान मिलर की " औसत रेटिंग के आधार पर छाँटने का तरीका नहीं " रेटेड वस्तुओं के लिए एक समझदार कुल "स्कोर" प्राप्त करने के लिए आत्मविश्वास अंतराल के निचले हिस्से का उपयोग करने का प्रस्ताव है। हालाँकि, यह एक बर्नौली मॉडल के साथ काम कर रहा है: रेटिंग्स या तो अंगूठे ऊपर हैं या अंगूठे नीचे हैं।

रेटिंग मॉडल के लिए उपयोग करने के लिए एक उचित आत्मविश्वास अंतराल क्या है जो 1 से k सितारों का असतत स्कोर प्रदान करता है , यह मानते हुए कि किसी आइटम के लिए रेटिंग की संख्या छोटी हो सकती है?

मुझे लगता है कि मैं देख सकता हूं कि विल्सन और एगेस्टी-कूप के बीच के अंतराल को कैसे अनुकूलित किया जा सकता है

p~=i=1nxi+zα/22p0n+zα/22

जहां या तो या (शायद बेहतर) यह सभी वस्तुओं पर औसत रेटिंग है। हालांकि, मुझे यकीन नहीं है कि अंतराल की चौड़ाई को कैसे अनुकूलित किया जाए। मेरा (संशोधित) सबसे अच्छा अनुमान होगाp0=k+12

p~±zα/2n~i=1n(xip~)2+zα/2(p0p~)2n~

साथ n~=n+zα/22 , लेकिन मैं और अधिक से अधिक Agresti-Coull की एक सादृश्य के रूप में यह हाथ से लहराते, के रूप में है कि लेने के साथ औचित्य नहीं कर सकते हैं

Estimate(X¯)±zα/2n~Estimate(Var(X))

क्या मानक आत्मविश्वास अंतराल हैं जो लागू होते हैं? (ध्यान दें कि मेरे पास किसी भी पत्रिका के लिए सदस्यता नहीं है या विश्वविद्यालय के पुस्तकालय तक आसान पहुंच नहीं है; हर तरह से उचित संदर्भ देते हैं, लेकिन कृपया वास्तविक परिणाम के साथ पूरक करें!)


4
क्योंकि वर्तमान उत्तरों में (शायद राजनीति से बाहर) इस मुद्दे पर घिरे हुए हैं, मैं यह बताना चाहूंगा कि यह एप्लिकेशन विश्वास सीमाओं का एक भयानक दुरुपयोग है। LCL का उपयोग करने के लिए रैंक के साधनों का कोई सैद्धांतिक औचित्य नहीं है (और बहुत सारे कारण हैं कि LCL वास्तव में रैंकिंग के उद्देश्यों के लिए औसत से भी बदतर है)। इस प्रकार यह प्रश्न बुरी तरह से दोषपूर्ण दृष्टिकोण पर आधारित है, जिसके कारण यह अपेक्षाकृत कम ध्यान आकर्षित कर सकता है।
whuber

2
इस विशेष प्रश्न की एक अच्छी विशेषता यह है कि इसमें वास्तविक प्रश्न को नजरअंदाज करने के लिए हमारे पास पर्याप्त संदर्भ है और जो एक अधिक महत्वपूर्ण अंतर्निहित है, उस पर ध्यान केंद्रित करें।
कार्ल

1
मुझे खुशी है कि आपने अपनी पसंद, पीटर को बदले हुए शीर्षक को संशोधित किया। मेरा मूल संपादन स्व-सेवा करने के लिए नहीं, बल्कि शीर्षक को प्रश्न के पाठ को प्रतिबिंबित करने के लिए बनाया गया था। आप वास्तव में क्या मतलब है के अंतिम मध्यस्थ हैं।
व्हीबर

जवाबों:


23

जैसे कार्ल ब्रोमन ने अपने जवाब में कहा, एक बायेसियन दृष्टिकोण आत्मविश्वास अंतराल का उपयोग करने की तुलना में बहुत बेहतर होगा।

विश्वास अंतराल के साथ समस्या

आत्मविश्वास के अंतराल का उपयोग करना बहुत अच्छा काम क्यों नहीं कर सकता है? एक कारण यह है कि यदि आपके पास किसी आइटम के लिए कई रेटिंग नहीं हैं, तो आपका आत्मविश्वास अंतराल बहुत व्यापक होने वाला है, इसलिए आत्मविश्वास अंतराल का निचला भाग छोटा होगा। इस प्रकार, कई रेटिंग्स वाले आइटम आपकी सूची में सबसे नीचे होंगे।

सहज रूप से, हालांकि, आप शायद औसत रेटिंग के पास कई रेटिंग्स के बिना आइटम चाहते हैं, इसलिए आप आइटम की अपनी अनुमानित रेटिंग को सभी वस्तुओं पर औसत रेटिंग की ओर आकर्षित करना चाहते हैं (यानी, आप अपनी अनुमानित रेटिंग को पूर्व की ओर धकेलना चाहते हैं ) । यह वही है जो एक बायेसियन दृष्टिकोण करता है।

बायेसियन दृष्टिकोण I: रेटिंग पर सामान्य वितरण

पूर्व की ओर अनुमानित रेटिंग को स्थानांतरित करने का एक तरीका है, जैसा कि कार्ल के उत्तर में है, फॉर्म w - R + ( 1 - w ) के अनुमान का उपयोग करने के लिए :wR+(1w)C

  • वस्तुओं के लिए रेटिंग पर आर का मतलब है।R
  • सभी वस्तुओं (या जो कुछ भी आप अपनी रेटिंग को हटना चाहते हैं) से अधिक है।C
  • ध्यान दें कि सूत्र और का एक भारित संयोजन हैRC
  • Rको दिया गया भार है, जहाँvw=vv+mRv बियर और मी के लिए समीक्षाओं की संख्या हैm किसी प्रकार का निरंतर "थ्रेशोल्ड" पैरामीटर है।
  • ध्यान दें कि जब बहुत बड़ा है, यानी, जब हमारे पास वर्तमान आइटम के लिए बहुत सारी रेटिंग है, तो w 1 के बहुत करीब है, इसलिए हमारी अनुमानित रेटिंग R के बहुत करीब है और हम पूर्व C पर थोड़ा ध्यान देते हैं । जब v छोटा होता है, तब, w 0 के बहुत करीब होता है, इसलिए अनुमानित रेटिंग पूर्व C पर बहुत अधिक भार रखती हैvwRCvwC

यह अनुमान, वास्तव में, वस्तु की औसत रेटिंग के पीछे के अनुमान के रूप में एक बायेसियन व्याख्या दे सकता है जब व्यक्तिगत रेटिंग उस मतलब के आसपास केंद्रित एक सामान्य वितरण से आती है।

हालांकि, यह मानते हुए कि रेटिंग सामान्य वितरण से आती है, दो समस्याएं हैं:

  • एक सामान्य वितरण निरंतर है , लेकिन रेटिंग्स हैं असतत हैं
  • एक आइटम के लिए रेटिंग जरूरी नहीं कि एक असमान गॉसियन आकार का पालन करें। उदाहरण के लिए, शायद आपका आइटम बहुत ध्रुवीकरण कर रहा है, इसलिए लोग या तो इसे बहुत उच्च रेटिंग देते हैं या इसे बहुत कम रेटिंग देते हैं।

बायेसियन दृष्टिकोण II: रेटिंग पर बहुराष्ट्रीय वितरण

इसलिए रेटिंग के लिए एक सामान्य वितरण संभालने के बजाय, आइए एक बहुराष्ट्रीय वितरण मान लें । अर्थात्, कुछ विशिष्ट आइटम दिए गए हैं, संभावना 1 कि एक यादृच्छिक उपयोगकर्ता इसे 1 स्टार, एक प्रायिकता पी 2 देगाp1p2 कि एक यादृच्छिक उपयोगकर्ता इसे 2 स्टार देगा, और इसी तरह।

बेशक, हमें पता नहीं है कि ये संभावनाएं क्या हैं। जैसा कि हम इस आइटम के लिए अधिक से अधिक रेटिंग प्राप्त करते हैं, हम अनुमान लगा सकते हैं कि एन 1 के करीब हैp1 , जहांn1उन उपयोगकर्ताओं की संख्या है जिन्होंने इसे 1 स्टार दिया है औरnकुल उपयोगकर्ताओं की संख्या है जिन्होंने आइटम को रेट किया है, लेकिन जब हम पहली बार शुरू करते हैं, तो हमारे पास कुछ भी नहीं है। इसलिए हमइन संभावनाओं परएकडिरिक्लेट पूर्वDir(α1,,αk)लगाते हैं।n1nn1n Dir(α1,,αk)

क्या यह Dirichlet पूर्व है? हम प्रत्येक पैरामीटर के बारे में सोच सकते हैं कि किसी वर्चुअल व्यक्ति ने आइटम को मैं दिए गए तारों की संख्या की "आभासी गणना" के रूप में । उदाहरण के लिए, यदि α 1 = 2 , α 2 = 1 , और अन्य सभी α iαiiα1=2α2=1αi 0 के बराबर हैं, तो हम यह सोचकर यह कह सकते हैं कि दो आभासी लोगों ने आइटम 1 सितारा दिया और एक आभासी व्यक्ति ने आइटम 2 दिया अभिनय किया है। इसलिए इससे पहले कि हम कोई वास्तविक उपयोगकर्ता प्राप्त करें, हम इस आभासी वितरण का उपयोग आइटम की रेटिंग का अनुमान लगाने के लिए कर सकते हैं।

[ मापदंडों को चुनने का एक तरीका यह होगा कि मैं α i को I तारों के वोटों के समग्र अनुपात के बराबर सेट करूं । (ध्यान दें कि α i पैरामीटर आवश्यक रूप से पूर्णांक नहीं हैं।)]αiαiiαi

फिर, एक बार वास्तविक रेटिंग्स आने के बाद, बस अपने ड्यूरिचलेट के वर्चुअल काउंट्स से पहले अपनी गिनती जोड़ें। जब भी आप अपने आइटम की रेटिंग का अनुमान लगाना चाहते हैं, तो बस आइटम की सभी रेटिंग्स (दोनों वर्चुअल रेटिंग्स और उसकी रेटिंग रेटिंग्स) पर माध्य लें।


1
दृष्टिकोण 2 समान दृष्टिकोण 1 के समान है, क्या यह नहीं है, लेकिन एक अलग औचित्य के साथ?
पीटर टेलर

2
@ अभिनेता: ओह, सच! एहसास नहीं हुआ कि जब तक आपने इसका उल्लेख नहीं किया =)। (यदि आप सब करना चाहते हैं तो पीछे के साधन का उपयोग करें, वे समान हैं। मुझे लगता है कि यदि आप एक अलग तरह के स्कोर की गणना करना चाहते हैं तो एक ड्यूरिचेल पोस्टीरियर उपयोगी हो सकता है, जैसे, किसी प्रकार का ध्रुवता माप, हालांकि वह दुर्लभ की तरह हो सकता है।)
रैगेटिन

1
मीटर

15

यह स्थिति बायेसियन दृष्टिकोण के लिए रोती है। यहां रेटिंग्स की बेयसियन रैंकिंग के लिए सरल दृष्टिकोण हैं (टिप्पणियों के लिए विशेष रूप से भुगतान करें , जो दिलचस्प हैं) और यहां , और फिर यहां इन पर एक और टिप्पणी । इन कड़ियों में से पहली टिप्पणी में से एक के रूप में बताते हैं:

BeerAdvocate (बीए) के सर्वश्रेष्ठ ... एक Bayesian अनुमान का उपयोग करता है:

भारित रैंक (WR) = (v / (v + m)) × R + (m / (v + m)) × C

जहां:
आर = बीयर की समीक्षा के लिए औसत
v = बीयर की समीक्षा के लिए
मी = न्यूनतम समीक्षा सूचीबद्ध करने के लिए आवश्यक न्यूनतम (वर्तमान में 10)
सी = सूची में औसत (वर्तमान में 2.5)


2
बीयर एडवोकेट विधि का एक नुकसान यह है कि यह परिवर्तनशीलता का ध्यान नहीं रखता है। फिर भी, मैं कम उदासीनता सीमा विचार के लिए सोच की इस पंक्ति को पसंद करता हूं।
कार्ल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.