मेरे साथ वहन करने के लिए अग्रिम धन्यवाद, मैं किसी भी प्रकार का सांख्यिकीविद् नहीं हूं और यह नहीं जानता कि मैं जो कल्पना कर रहा हूं उसका वर्णन कैसे करना है, इसलिए Google यहां मेरी मदद नहीं कर रहा है ...
मैं एक वेब एप्लिकेशन में एक रेटिंग प्रणाली शामिल कर रहा हूं, जिस पर मैं काम कर रहा हूं। प्रत्येक उपयोगकर्ता प्रत्येक आइटम को एक बार बिल्कुल रेट कर सकता है।
मैं 4 मानों के साथ एक पैमाने की कल्पना कर रहा था: "दृढ़ता से नापसंद", "नापसंद", "पसंद", और "दृढ़ता से पसंद", और मैंने क्रमशः -5, -2, +2 और +5 के इन मूल्यों को निर्दिष्ट करने की योजना बनाई थी। ।
अब, यदि प्रत्येक आइटम की रेटिंग की समान संख्या होने जा रही थी, तो मैं इस स्कोरिंग प्रणाली के साथ काफी सहज होऊंगा क्योंकि स्पष्ट रूप से सबसे अधिक पसंद और कम से कम पसंद की गई वस्तुओं को अलग करना होगा। हालाँकि, आइटमों की रेटिंग की संख्या समान नहीं होगी, और विभिन्न फ़ोटो पर वोटों की संख्या के बीच असमानता काफी नाटकीय हो सकती है।
उस मामले में, दो वस्तुओं पर संचयी स्कोर की तुलना करने का मतलब है कि बहुत अधिक औसत रेटिंग वाले एक पुराने आइटम में बहुत कम वोटों के साथ एक असाधारण नए आइटम की तुलना में बहुत अधिक स्कोर होने वाला है।
इसलिए, पहली स्पष्ट बात जो हमने औसत लेने के लिए सोची थी ... लेकिन अब अगर किसी आइटम की "+5" की केवल एक रेटिंग है, तो उस आइटम की तुलना में बेहतर औसत है जिसका स्कोर 99 "+5" रेटिंग है और 1 "+2" रेटिंग। सहज रूप से जो किसी आइटम की लोकप्रियता का सटीक प्रतिनिधित्व नहीं है।
मुझे लगता है कि यह समस्या आम है और आप लोगों को मुझे अधिक उदाहरणों के साथ इसे समझने की आवश्यकता नहीं है, इसलिए मैं इस बिंदु पर रुकूंगा और यदि आवश्यक हो तो टिप्पणियों में विस्तार से बताऊंगा।
मेरे प्रश्न हैं:
- इस तरह की समस्या को क्या कहा जाता है, और क्या इसे हल करने के लिए इस्तेमाल की जाने वाली तकनीकों के लिए एक शब्द है? मैं यह जानना चाहूंगा ताकि मैं इस पर पढ़ सकूं।
- यदि आप इस विषय पर किसी भी अनुकूल-अनुकूल संसाधनों के बारे में जानते हैं, तो मैं एक लिंक की बहुत सराहना करूँगा।
- अंत में, मैं इस तरह के डेटा को प्रभावी ढंग से इकट्ठा करने और उसका विश्लेषण करने के बारे में किसी अन्य सुझाव की सराहना करूंगा।