मुझे तत्वों का एक सेट मिला है जिसके अनुसार मैं वर्णन कर सकता हूं विशेषताएँ। इस प्रकार:
जहां तत्व के लिए (संख्यात्मक) मूल्यांकन है विशेषताओं के अनुसार । इसलिए मेरे तत्वों को आयाम स्थान में बिंदुओं के रूप में देखा जा सकता है।
मेरे रीडिंग के अनुसार, "बेयस क्लासिफायर" जैसे एल्गोरिदम मौजूद हैं जो मुझे अपने सेट के किसी भी तत्व पर "हां" या "नहीं" प्रकार का उत्तर प्रदान कर सकते हैं, बशर्ते कि मैंने "प्रशिक्षण सेट" का उपयोग किया हो मेरे सेट के तत्व, और एल्गोरिथ्म के अपेक्षित परिणाम। उस डेटा के आधार पर, एल्गोरिथम को किसी अन्य तत्व को लेने में सक्षम होना चाहिए, प्रशिक्षण सेट का हिस्सा नहीं होना चाहिए, और प्रशिक्षण सेट के लिए जो कुछ भी सीखा है उसके आधार पर "हां" या "नहीं" उत्तर प्रदान करना चाहिए। यह बहुत अच्छा है यदि आपके पास किसी तरह का विचार है जो आपकी अपेक्षा (प्रशिक्षण सेट) है, लेकिन आप उन विशिष्ट नियमों के बारे में अनिश्चित हैं जो उस परिणाम के लिए उपज देते हैं।
मैं अपने डेटा के साथ जो करना चाहूंगा, उसे "हां" या "नहीं" प्रकार का उत्तर नहीं मिलेगा, लेकिन मैं तत्वों के भीतर एक रैंकिंग पेश करना चाहूंगा। उनमें से कुछ दूसरों की तुलना में "बेहतर" हैं। बेय्स फिल्टर की तरह, मुझे एक सामान्य विचार मिला है कि मैं क्या उम्मीद करता हूं। मैं इस प्रकार अपने तत्वों के सबसेट से ली गई एक "प्रशिक्षण रैंकिंग" उत्पन्न कर सकता हूं, जिसे मैं विधायक को खिलाऊंगा। उस प्रशिक्षण के आधार पर यह मेरे पूरे सेट को रैंक करने में सक्षम होगा।
ऐसा करने के लिए मैं दो दृष्टिकोण देखता हूं:
- प्रत्येक तत्व को विधायक द्वारा एक अंक दिया जाएगा, फिर स्कोर के अनुसार तत्वों को रैंक किया जाएगा।
- विधायक दो तत्वों और लेने में सक्षम होगा और यह निर्धारित करेगा कि एक बेहतर (जोड़ीदार तुलना) है। उस तुलना ऑपरेशन का उपयोग करके क्विकॉर्ट का उपयोग करें।
नोट: एक स्कोर के आधार पर युग्मक फ़ंक्शन को कार्यान्वित करने के लिए तुच्छ है, और एक जोड़ी के आधार पर फ़ंक्शन के आधार पर, यह स्कोर उत्पन्न करने के लिए तुच्छ है, इसलिए ये समान परिणामों के लिए केवल दो अनुमोदन हैं।
वहाँ एमएलए के उदाहरण है कि एक स्कोरिंग समारोह, या एक जोड़ी की तुलना समारोह प्रदान कर सकते हैं?
संपादित करें: अधिक संदर्भ जोड़ने के लिए: वर्तमान में मेरे आइटम एल्गोरिदम के अनुसार रैंक किए गए हैं जो कि पर गणना करके प्रत्येक आइटम (स्कोर) (वास्तविक संख्या) को उत्पन्न करता है । जबकि उत्पन्न रैंकिंग काफी सही है, मुझे अक्सर इसे किसी तरह से ट्वीक करने के लिए एल्गोरिदम को संशोधित करना पड़ता है क्योंकि मैं स्पष्ट रूप से कुछ वस्तुओं को देख सकता हूं जो कि मुझे उम्मीद के मुताबिक रैंक नहीं हैं।
इसलिए वर्तमान में मेरी डिजाइन प्रक्रिया है:
- एक सही रैंकिंग क्या होगी, इसका अंदाजा लगाइए
- (मैन्युअल रूप से) एक एल्गोरिथ्म प्राप्त करने का प्रयास करें जो उस तरह की वस्तुओं को रैंक करेगा
- परिणामों का निरीक्षण करें
- एल्गोरिथ्म को अनुकूलित करें
इसलिए मैंने विधायक के बारे में सोचा कि मेरी प्रक्रिया के शुरुआती बिंदु से प्रशिक्षण डेटा के रूप में क्या इस्तेमाल किया जा सकता है। मैं शायद अपनी रैंक के हिसाब से शुरुआत करूंगा, अपनी जरूरतों के हिसाब से वस्तुओं की अदला-बदली करूंगा और उसे खिलाऊंगा।