मुझे हाल ही में मल्टीलेबल रैंकिंग एल्गोरिदम का मूल्यांकन करने के लिए एक मीट्रिक चुनना था और इस विषय पर मिला, जो वास्तव में मददगार था। यहाँ stpk के उत्तर के लिए कुछ जोड़ दिए गए हैं, जो चुनाव करने में सहायक थे।
- MAP को मल्टीलेबेल समस्याओं के लिए अनुकूलित किया जा सकता है, एक सन्निकटन की कीमत पर
- MAP को k पर परिकलित करने की आवश्यकता नहीं है, लेकिन जब नकारात्मक वर्ग पहले से मौजूद हो तो मल्टीलेबल संस्करण को अनुकूलित नहीं किया जा सकता है
- एमएपी और (एन) डीसीजी दोनों को पुन: लिखा जा सकता है क्योंकि रैंक की गई प्रासंगिकता मूल्यों के औसत औसत के बराबर है
विवरण
हमें औसत परिशुद्धता (एपी) पर ध्यान केंद्रित करें क्योंकि औसत सटीकता (एमएपी) कई प्रश्नों पर एपी का औसत है। एपी को ठीक से बाइनरी डेटा पर परिभाषित किया गया है क्योंकि परिशुद्धता-रिकॉल कर्व के तहत क्षेत्र है, जिसे किसी भी सकारात्मक आइटम पर पूर्ववर्ती के औसत के रूप में फिर से लिखा जा सकता है। ( एमएपी पर विकिपीडिया लेख देखें ) एक संभावित सन्निकटन यह परिभाषित करने के लिए है कि प्रत्येक पर यह प्राथमिकताओं के औसत के रूप में हैआइटम। अफसोस की बात है कि हम अच्छी संपत्ति खो देते हैं कि सूची के अंत में रैंक किए गए नकारात्मक उदाहरणों का एपी के मूल्य पर कोई प्रभाव नहीं पड़ता है। (यह विशेष रूप से दुख की बात है जब यह सकारात्मक उदाहरणों की तुलना में कहीं अधिक नकारात्मक उदाहरणों के साथ एक खोज इंजन का मूल्यांकन करने के लिए आता है। अन्य डाउनसाइड्स की कीमत पर नकारात्मक उदाहरणों को कम करने के लिए एक संभावित समाधान है, जैसे अधिक सकारात्मक वस्तुओं के साथ प्रश्न समान रूप से बन जाएंगे। कुछ सकारात्मक उदाहरणों के साथ प्रश्नों के लिए कठिन।)
दूसरी ओर, इस सन्निकटन में अच्छी संपत्ति है कि यह मल्टीलेबेल के मामले में अच्छी तरह से सामान्य है। वास्तव में, द्विआधारी मामले में, स्थिति k पर परिशुद्धता को स्थिति k से पहले औसत प्रासंगिकता के रूप में भी समझा जा सकता है, जहां एक सकारात्मक उदाहरण की प्रासंगिकता 1 है, और एक नकारात्मक उदाहरण की प्रासंगिकता 0. है। यह परिभाषा काफी स्वाभाविक रूप से फैली हुई है मामला जहां प्रासंगिकता के दो से अधिक विभिन्न स्तर हैं। इस स्थिति में, एपी को प्रत्येक स्थिति में प्रासंगिकताओं के औसत के साधन के रूप में भी परिभाषित किया जा सकता है।
यह अभिव्यक्ति उनके जवाब में stpk द्वारा उद्धृत वीडियो के स्पीकर द्वारा चुनी गई एक है । वह इस वीडियो में दिखाता है कि एपी को प्रासंगिकता के भारित माध्य के रूप में फिर से लिखा जा सकता है, रैंकिंग में -th तत्व का वजनk
wAPk=1Klog(Kk)
जहां रैंक करने के लिए मदों की संख्या है। अब हमारे पास यह अभिव्यक्ति है, हम इसकी तुलना डीसीजी से कर सकते हैं। वास्तव में, DCG भी रैंक की गई प्रासंगिकता का एक भारित औसत है, वजन:K
wDCGk=1log(k+1)
इन दो अभिव्यक्तियों से, हम यह अनुमान लगा सकते हैं कि - एपी 1 से 0. तक दस्तावेजों का वजन करता है - डीसीजी दस्तावेजों की कुल संख्या से स्वतंत्र रूप से दस्तावेजों का वजन करता है।
दोनों मामलों में, यदि प्रासंगिक उदाहरणों की तुलना में बहुत अधिक अप्रासंगिक उदाहरण हैं, तो सकारात्मक का कुल वजन नगण्य हो सकता है। एपी के लिए, नकारात्मक नमूनों को कम करने के लिए वर्कअराउंड किया जाता है, लेकिन मुझे यह सुनिश्चित नहीं है कि सब्सक्रिप्शन के अनुपात का चयन कैसे किया जाए, साथ ही इसे क्वेरी पर या सकारात्मक दस्तावेजों की संख्या पर निर्भर करना है या नहीं। DCG के लिए, हम इसे k पर काट सकते हैं, लेकिन एक ही तरह के सवाल उठते हैं।
मुझे इस बारे में और अधिक सुनने में खुशी होगी, अगर यहां किसी ने इस विषय पर काम किया हो।