जैसे कार्ल ब्रोमन ने अपने जवाब में कहा, एक बायेसियन दृष्टिकोण आत्मविश्वास अंतराल का उपयोग करने की तुलना में बहुत बेहतर होगा।
विश्वास अंतराल के साथ समस्या
आत्मविश्वास के अंतराल का उपयोग करना बहुत अच्छा काम क्यों नहीं कर सकता है? एक कारण यह है कि यदि आपके पास किसी आइटम के लिए कई रेटिंग नहीं हैं, तो आपका आत्मविश्वास अंतराल बहुत व्यापक होने वाला है, इसलिए आत्मविश्वास अंतराल का निचला भाग छोटा होगा। इस प्रकार, कई रेटिंग्स वाले आइटम आपकी सूची में सबसे नीचे होंगे।
सहज रूप से, हालांकि, आप शायद औसत रेटिंग के पास कई रेटिंग्स के बिना आइटम चाहते हैं, इसलिए आप आइटम की अपनी अनुमानित रेटिंग को सभी वस्तुओं पर औसत रेटिंग की ओर आकर्षित करना चाहते हैं (यानी, आप अपनी अनुमानित रेटिंग को पूर्व की ओर धकेलना चाहते हैं ) । यह वही है जो एक बायेसियन दृष्टिकोण करता है।
बायेसियन दृष्टिकोण I: रेटिंग पर सामान्य वितरण
पूर्व की ओर अनुमानित रेटिंग को स्थानांतरित करने का एक तरीका है, जैसा कि कार्ल के उत्तर में है, फॉर्म w - R + ( 1 - w ) के अनुमान का उपयोग करने के लिए :w∗R+(1−w)∗C
- वस्तुओं के लिए रेटिंग पर आर का मतलब है।R
- सभी वस्तुओं (या जो कुछ भी आप अपनी रेटिंग को हटना चाहते हैं) से अधिक है।C
- ध्यान दें कि सूत्र और का एक भारित संयोजन हैR ।C
- Rको दिया गया भार है, जहाँvw=vv+mRv बियर और मी के लिए समीक्षाओं की संख्या हैm किसी प्रकार का निरंतर "थ्रेशोल्ड" पैरामीटर है।
- ध्यान दें कि जब बहुत बड़ा है, यानी, जब हमारे पास वर्तमान आइटम के लिए बहुत सारी रेटिंग है, तो w 1 के बहुत करीब है, इसलिए हमारी अनुमानित रेटिंग R के बहुत करीब है और हम पूर्व C पर थोड़ा ध्यान देते हैं । जब v छोटा होता है, तब, w 0 के बहुत करीब होता है, इसलिए अनुमानित रेटिंग पूर्व C पर बहुत अधिक भार रखती है ।vwRCvwC
यह अनुमान, वास्तव में, वस्तु की औसत रेटिंग के पीछे के अनुमान के रूप में एक बायेसियन व्याख्या दे सकता है जब व्यक्तिगत रेटिंग उस मतलब के आसपास केंद्रित एक सामान्य वितरण से आती है।
हालांकि, यह मानते हुए कि रेटिंग सामान्य वितरण से आती है, दो समस्याएं हैं:
- एक सामान्य वितरण निरंतर है , लेकिन रेटिंग्स हैं असतत हैं ।
- एक आइटम के लिए रेटिंग जरूरी नहीं कि एक असमान गॉसियन आकार का पालन करें। उदाहरण के लिए, शायद आपका आइटम बहुत ध्रुवीकरण कर रहा है, इसलिए लोग या तो इसे बहुत उच्च रेटिंग देते हैं या इसे बहुत कम रेटिंग देते हैं।
बायेसियन दृष्टिकोण II: रेटिंग पर बहुराष्ट्रीय वितरण
इसलिए रेटिंग के लिए एक सामान्य वितरण संभालने के बजाय, आइए एक बहुराष्ट्रीय वितरण मान लें । अर्थात्, कुछ विशिष्ट आइटम दिए गए हैं, संभावना 1 कि एक यादृच्छिक उपयोगकर्ता इसे 1 स्टार, एक प्रायिकता पी 2 देगाp1p2 कि एक यादृच्छिक उपयोगकर्ता इसे 2 स्टार देगा, और इसी तरह।
बेशक, हमें पता नहीं है कि ये संभावनाएं क्या हैं। जैसा कि हम इस आइटम के लिए अधिक से अधिक रेटिंग प्राप्त करते हैं, हम अनुमान लगा सकते हैं कि एन 1 के करीब हैp1 , जहांn1उन उपयोगकर्ताओं की संख्या है जिन्होंने इसे 1 स्टार दिया है औरnकुल उपयोगकर्ताओं की संख्या है जिन्होंने आइटम को रेट किया है, लेकिन जब हम पहली बार शुरू करते हैं, तो हमारे पास कुछ भी नहीं है। इसलिए हमइन संभावनाओं परएकडिरिक्लेट पूर्वDir(α1,…,αk)लगाते हैं।n1nn1n Dir(α1,…,αk)
क्या यह Dirichlet पूर्व है? हम प्रत्येक पैरामीटर के बारे में सोच सकते हैं कि किसी वर्चुअल व्यक्ति ने आइटम को मैं दिए गए तारों की संख्या की "आभासी गणना" के रूप में । उदाहरण के लिए, यदि α 1 = 2 , α 2 = 1 , और अन्य सभी α iαiiα1=2α2=1αi 0 के बराबर हैं, तो हम यह सोचकर यह कह सकते हैं कि दो आभासी लोगों ने आइटम 1 सितारा दिया और एक आभासी व्यक्ति ने आइटम 2 दिया अभिनय किया है। इसलिए इससे पहले कि हम कोई वास्तविक उपयोगकर्ता प्राप्त करें, हम इस आभासी वितरण का उपयोग आइटम की रेटिंग का अनुमान लगाने के लिए कर सकते हैं।
[ मापदंडों को चुनने का एक तरीका यह होगा कि मैं α i को I तारों के वोटों के समग्र अनुपात के बराबर सेट करूं । (ध्यान दें कि α i पैरामीटर आवश्यक रूप से पूर्णांक नहीं हैं।)]αiαiiαi
फिर, एक बार वास्तविक रेटिंग्स आने के बाद, बस अपने ड्यूरिचलेट के वर्चुअल काउंट्स से पहले अपनी गिनती जोड़ें। जब भी आप अपने आइटम की रेटिंग का अनुमान लगाना चाहते हैं, तो बस आइटम की सभी रेटिंग्स (दोनों वर्चुअल रेटिंग्स और उसकी रेटिंग रेटिंग्स) पर माध्य लें।