इसलिए हमारे पास एक मशीन लर्निंग एप्लिकेशन की क्षमता है जो क्लासिफायर द्वारा हल किए गए पारंपरिक समस्या डोमेन में काफी करीने से फिट बैठता है, यानी, हमारे पास एक आइटम और एक "बकेट" का वर्णन करने वाले विशेषताओं का एक सेट है जो वे मॉडल बनाने के बजाय, अंत में समाप्त होते हैं। Naive Bayes या इसी तरह के क्लासीफायर में संभावनाओं की तरह, हम चाहते हैं कि हमारा आउटपुट मोटे तौर पर मानव-पठनीय नियमों का एक सेट हो, जिसकी समीक्षा और अंत उपयोगकर्ता द्वारा संशोधित किया जा सके।
एसोसिएशन रूल लर्निंग एल्गोरिदम के परिवार की तरह दिखता है जो इस प्रकार की समस्या को हल करता है, लेकिन ये एल्गोरिदम सुविधाओं के सामान्य संयोजनों की पहचान करने पर ध्यान केंद्रित करते हैं और अंतिम बकेट की अवधारणा को शामिल नहीं करते हैं जो उन सुविधाओं को इंगित कर सकते हैं। उदाहरण के लिए, हमारा डेटा सेट कुछ इस तरह दिखता है:
Item A { 4-door, small, steel } => { sedan }
Item B { 2-door, big, steel } => { truck }
Item C { 2-door, small, steel } => { coupe }
मैं बस नियम चाहता हूं जो कहता है "अगर यह बड़ा है और 2-दरवाजा है, तो यह एक ट्रक है," नियम नहीं जो कहता है "अगर यह 4-दरवाजा है तो यह बहुत छोटा है।"
एक वर्कअराउंड मैं सोच सकता हूं कि बस एसोसिएशन रूल लर्निंग एल्गोरिदम का उपयोग करना है और उन नियमों की अनदेखी करना है जिनमें एंड बकेट शामिल नहीं है, लेकिन ऐसा लगता है कि थोड़ा हैकी है। क्या मैंने एल्गोरिदम के कुछ परिवार को याद किया है? या शायद मैं समस्या को गलत तरीके से शुरू कर रहा हूं?