मैं विशेषज्ञों का एक सेट कैसे ऑर्डर या रैंक कर सकता हूं?


11

मेरे पास एक डेटाबेस है जिसमें एक क्षेत्र में बड़ी संख्या में विशेषज्ञ हैं। उन विशेषज्ञों में से प्रत्येक के लिए मेरे पास विभिन्न प्रकार के गुण / डेटा बिंदु हैं:

  • अनुभव के वर्षों की संख्या।
  • लाइसेंस
  • समीक्षाओं की संख्या
  • उन समीक्षाओं की पाठ्य सामग्री
  • गति, गुणवत्ता आदि जैसे कई कारकों के लिए उन समीक्षाओं में से प्रत्येक पर 5 स्टार रेटिंग।
  • पुरस्कार, वर्गीकरण, सम्मेलन आदि।

मैं इन विशेषज्ञों को उनके महत्व के आधार पर 10 में से एक रेटिंग प्रदान करना चाहता हूं। कुछ विशेषज्ञों के लिए कुछ डेटा बिंदु गायब हो सकते हैं। अब मेरा सवाल यह है कि मैं इस तरह के एक एल्गोरिथ्म के साथ कैसे आऊं? किसी ने मुझे कुछ relevent साहित्य की ओर इशारा कर सकते हैं?

इसके अलावा, मुझे चिंता है कि सभी रेटिंग्स / समीक्षाओं के साथ संख्या कुछ मूल्यों के निकट हो सकती है। उदाहरण के लिए, उनमें से अधिकांश का अंत 8 या 5 हो सकता है। क्या केवल कुछ विशेषताओं के लिए अंक में बड़े अंतर को उजागर करने का एक तरीका है।

कुछ अन्य चर्चाएँ जो मुझे लगा कि प्रासंगिक हो सकती हैं:


यह तब तक नहीं किया जा सकता जब तक कि आप कुछ उद्देश्य की कसौटी पर खरे नहीं उतरते; संभवतया अधिकांश संभव रेटिंग्स का निर्माण आपके मापदंडों के कुछ संयोजन के साथ किया जा सकता है।

जवाबों:


12

लोगों ने कई मानदंडों पर रेटिंग चीजों (जैसे विशेषज्ञों) के लिए कई प्रणालियों का आविष्कार किया है: किसी सूची के लिए मल्टी-मापदंड निर्णय विश्लेषण पर विकिपीडिया पृष्ठ पर जाएं । हालांकि, इसका अच्छी तरह से प्रतिनिधित्व नहीं किया गया है, लेकिन वहां से सबसे अधिक बचाव योग्य तरीके हैं: बहु विशेषता मूल्यांकन सिद्धांत। इसमें मानदंडों के सेट के बीच व्यापार-नापसंद का मूल्यांकन करने के लिए तरीकों का एक सेट शामिल है (ए) व्यक्तिगत चर के मूल्यों को फिर से व्यक्त करने के लिए एक उचित तरीका निर्धारित करता है और (बी) रैंकिंग के लिए एक अंक प्राप्त करने के लिए फिर से व्यक्त मूल्यों का वजन करता है। । सिद्धांत सरल और रक्षात्मक हैं, गणित अप्रभावी है, और सिद्धांत के बारे में कुछ भी कल्पना नहीं है। अधिक लोगों को मनमानी स्कोरिंग प्रणालियों का आविष्कार करने के बजाय इन तरीकों को जानना और अभ्यास करना चाहिए।


क्या आप ऐसा करने के लिए आर पैकेज के बारे में जानते हैं?
user333

3
@user नहीं, और मुझे संदेह है कि एक है। यहाँ कोई जादू सॉफ्टवेयर की गोली नहीं है, वैसे: लगभग सभी कार्यों में मुद्दों के माध्यम से सोचने और नियंत्रित फैशन में विशिष्ट ट्रेड-ऑफ़ की खोज करना शामिल है।
whuber

3

अंततः यह केवल एक सांख्यिकीय अभ्यास नहीं हो सकता है। पीसीए एक बहुत शक्तिशाली मात्रात्मक विधि है जो आपको इसके पहले कुछ प्रमुख घटकों पर एक अंक या भार उत्पन्न करने की अनुमति देगा जिसका उपयोग आप रैंकिंग के लिए कर सकते हैं। हालांकि, मुख्य घटक क्या हैं, यह समझाना बहुत चुनौतीपूर्ण है। वे मात्रात्मक निर्माण हैं। वे द्वंद्वात्मक नहीं हैं। इस प्रकार, यह समझाने के लिए कि उनका वास्तव में क्या मतलब है कभी-कभी संभव नहीं है। यह विशेष रूप से सच है यदि आपके पास एक दर्शक है जो मात्रात्मक नहीं है। उन्हें पता नहीं होगा कि आप किस बारे में बात कर रहे हैं। और, अपने पीसीए को कुछ गूढ़ ब्लैक बॉक्स के रूप में सोचेंगे।

इसके बजाय, मैं बस सभी प्रासंगिक चरों को पंक्तिबद्ध करूंगा और एक भार प्रणाली का उपयोग करूंगा, जिसके आधार पर किसी को लगता है कि भार कितना होना चाहिए।

मुझे लगता है कि यदि आप इसे बाहरी लोगों, ग्राहकों, उपयोगकर्ताओं के लिए विकसित करते हैं, तो यह बहुत अच्छा होगा यदि आप उपयोगकर्ताओं को वेटिंग पर निर्णय लेने के लचीलेपन को एम्बेड कर सकते हैं।
कुछ उपयोगकर्ता प्रमाणीकरण और इसके विपरीत की तुलना में अनुभव के वर्षों को अधिक महत्व दे सकते हैं। यदि आप उस निर्णय को उनके पास छोड़ सकते हैं। इस तरह आपका एल्गोरिथ्म एक ब्लैक बॉक्स नहीं है जिसे वे नहीं समझते हैं और वे इसके साथ सहज नहीं हैं। आप इसे पूरी तरह से पारदर्शी रखते हैं और उन मामलों के अपने सापेक्ष मूल्यांकन के आधार पर उनके ऊपर निर्भर करते हैं।


@Gaetan खैर, पीसीए के लिए आपको "पाठ्य सामग्री" जैसे चर के लिए एक उपयुक्त संख्यात्मक कोडिंग ढूंढनी होगी ...
chl

यह मुद्दा मैं नहीं उठा रहा हूं। पीसीए आपके सुझाव के अनुसार डमी चर को संभाल सकता है। पीसीए अविश्वसनीय रूप से शक्तिशाली और लचीला है। लेकिन, यह प्रमुख घटकों की व्याख्या है जो वास्तव में चुनौतीपूर्ण है। मान लें कि पहला प्रमुख घटक इस तरह से शुरू होता है: 0.02 वर्षों का अनुभव - 0.4 समीक्षाएँ + 0.01 संघों की पाठ्य सामग्री ... शायद आप इसे समझा सकते हैं। एक विशेषज्ञ प्रदर्शन अनुभव के वर्षों के लिए आनुपातिक है, लेकिन समीक्षाओं की पाठ्य सामग्री के विपरीत आनुपातिक है? यह बेतुका लगता है। लेकिन, पीसीए अक्सर काउंटर-सहज ज्ञान युक्त परिणाम उत्पन्न करता है।
सायपा सेप

@ गेटन स्टिल, मैं अपनी राय दोहराता हूं कि समस्या यह है कि आप अपने चर का प्रतिनिधित्व कैसे चुनते हैं (या आप एक उपयोगी मीट्रिक कैसे खोजते हैं)। गैर-निरंतर माप या डेटा प्रकारों के मिश्रण से निपटने पर चर के रैखिक संयोजन की व्याख्या करने में कठिनाई के बारे में मैं आपसे सहमत हूं। यही कारण है कि मैंने एक अन्य टिप्पणी में सुझाव दिया कि वैकल्पिक तथ्यात्मक तरीकों की तलाश करें। वैसे भी, उपयोगकर्ता वरीयताओं या विशेषज्ञ समीक्षा (जैसा कि नैदानिक ​​मूल्यांकन में किया जाता है) के आधार पर स्कोरिंग नियमों को विकसित करना भी कुछ प्रकार के सांख्यिकीय सत्यापन (कम से कम स्कोर की विश्वसनीयता सुनिश्चित करने के लिए) के लिए कहता है।
chl

@ गेटन, हां आपकी कुछ टिप्पणियां बहुत मायने रखती हैं, और आप यह कहने में सही हैं कि यह केवल एक सांख्यिकीय अभ्यास नहीं है, बल्कि ऐसे तत्व शामिल हैं जो अधिक व्यक्तिपरक हैं। कारण यह है कि उपयोगकर्ता / ग्राहकों के दृष्टिकोण से इरादे भिन्न हो सकते हैं। यह मानते हुए कि वह एक विशेषज्ञ के लिए एक खोज कर रहा है, तो मैं केवल विशेषज्ञों का चयन करने के लिए उसे फ़िल्टर करने की अनुमति देता हूं> X अनुभव के वर्षों की संख्या और इतने पर लेकिन मान लें कि वह 2 विशेषज्ञों तक संकुचित है, और एक स्वतंत्र तुलना चाहता है। इसलिए मैं किसी भी दो विशेषज्ञों की तुलना करने के लिए एक सामान्य विधि की तलाश कर रहा हूं।
सिदमित्रा

2
यह इंगित करने के लिए +1 सांख्यिकीय अभ्यास नहीं है। सर्वोत्तम रूप से, पीसीए एक विशेष डेटा सेट के भीतर संबंधों का वर्णन कर सकता है और, बोधगम्य रूप से, समीपस्थ-समरूपता की पहचान करके डेटा को सरल बनाता है। यह स्पष्ट नहीं है कि यह हमें कैसे विशेषज्ञों को रैंक करने के बारे में सूचित कर सकता है ।
whuber

0

क्या आपको लगता है कि आप उन सभी विशेषताओं को निर्धारित कर सकते हैं?

यदि हाँ, तो मैं एक प्रमुख घटक विश्लेषण करने का सुझाव दूंगा। सामान्य मामले में जहां सभी सहसंबंध सकारात्मक हैं (और यदि वे नहीं हैं, तो आप आसानी से कुछ परिवर्तन का उपयोग करके वहां पहुंच सकते हैं), पहला प्रमुख घटक विशेषज्ञ के कुल महत्व का एक उपाय माना जा सकता है, क्योंकि यह एक भारित है। सभी विशेषताओं का औसत (और भार चर का संगत योगदान होगा - इस परिप्रेक्ष्य के तहत, विधि स्वयं प्रत्येक विशेषता के महत्व को प्रकट करेगी )। स्कोर जो प्रत्येक विशेषज्ञ पहले प्रमुख घटक में प्राप्त करता है, वही है जो आपको उन्हें रैंक करने की आवश्यकता है।


1
यह अच्छा लग रहा है, लेकिन यह केवल उच्चतम-विचरण विशेषताओं और क्रॉस-सहसंबद्ध लोगों के सबसे बड़े समूहों को नहीं उठाएगा?

1
वैकल्पिक रूप से, एक मिश्रित डेटा के लिए कई पत्राचार विश्लेषण या कई कारक विश्लेषण कर सकते हैं (यदि संख्यात्मक पुनरावर्तन कुछ चर के लिए यथार्थवादी नहीं होता है), और आपके विचार के बाकी (कंप्यूटिंग कारक स्कोर और 1 आयाम पर चर लोडिंग को देखते हुए) लागू होता है भी।
chl

3
ऐसा लगता है कि पहला घटक विशेषज्ञों के बीच समानता की मजबूत दिशा को इंगित करेगा। यह संभवतः कैसे बता सकता है कि कौन बेहतर है और कौन बुरा है, हालांकि? इसके लिए इन चरों के बीच संबंधों और "अच्छा" या "बुरा" विशेषज्ञ होने की गुणवत्ता के बारे में अतिरिक्त जानकारी की आवश्यकता होती है। यदि हम मानते हैं कि सभी चर अच्छे या बुरेपन से जुड़े हुए हैं, तो शायद पीसीए हमें चरम सीमा (या शायद सिर्फ बाहरी!) विशेषज्ञों का पता लगाने में मदद कर सकता है। हालांकि बाहर देखो - यहां तक ​​कि एकरसता धारणा भी संदिग्ध है।
whuber

1
@ जब भी मैं बिंदु को देखता हूं, धन्यवाद। शायद आप इसे अपनी प्रतिक्रिया में जोड़ सकते हैं (जो बहुत स्वागत है)
च्ल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.