जहां तक मुझे पता है कि फ्रिक्वेंट पैटर्न माइनिंग (एफपीएम) समस्या को हल करने के लिए एल्गोरिदम के विकास में सुधार की सड़क में कुछ मुख्य चौकियां हैं। सबसे पहले, अग्रि एल्गोरिथ्म 1993 में अग्रवाल एट अल द्वारा प्रस्तावित किया गया था । समस्या की औपचारिकता के साथ। एल्गोरिथ्म डेटा को बनाए रखने के लिए एक जाली का उपयोग करके सेट (पावरसेट) से कुछ सेटों को स्ट्रिप-ऑफ करने में सक्षम था 2^n - 1
। दृष्टिकोण का एक दोष यह था कि प्रत्येक सेट की आवृत्ति की गणना करने के लिए डेटाबेस को फिर से पढ़ने की आवश्यकता थी।
बाद में, वर्ष 1997 में, ज़की एट अल। एल्गोरिथ्म एक्लैट का प्रस्ताव दिया , जिसने जाली के अंदर प्रत्येक सेट की परिणामी आवृत्ति डाली । यह जाली के प्रत्येक नोड पर, लेन-देन-आईडी के सेट को जोड़कर किया गया था, जिसमें रूट से संदर्भित नोड तक आइटम थे। मुख्य योगदान यह है कि प्रत्येक सेट की आवृत्ति को जानने के लिए पूरे डेटासेट को फिर से पढ़ना नहीं पड़ता है, लेकिन इस तरह की डेटा संरचना को बनाए रखने के लिए आवश्यक मेमोरी स्वयं डेटा साइज को पार कर सकती है।
2000 में, हान एट अल। FPGrow नाम के एक उपसर्ग-वृक्ष डेटा संरचना के साथ, FPGrowth नाम का एक एल्गोरिथ्म प्रस्तावित । एल्गोरिथ्म महत्वपूर्ण डेटा संपीड़न प्रदान करने में सक्षम था, जबकि यह भी अनुदान कि केवल लगातार आइटम (उम्मीदवार आइटम पीढ़ी के बिना) उपज होगी। यह मुख्य रूप से प्रत्येक लेनदेन की वस्तुओं को घटते क्रम में क्रमबद्ध करके किया गया था, ताकि सबसे अधिक बार होने वाले आइटम पेड़ डेटा संरचना में कम से कम पुनरावृत्ति वाले हों। चूंकि आवृत्ति केवल पेड़ की गहराई में जाने के दौरान उतरती है, एल्गोरिथ्म गैर-लगातार आइटम को स्ट्रिप-ऑफ करने में सक्षम है ।
संपादित करें :
जहां तक मुझे पता है, यह एक अत्याधुनिक एल्गोरिदम माना जा सकता है, लेकिन मैं अन्य प्रस्तावित समाधानों के बारे में जानना चाहूंगा। एफपीएम के लिए अन्य एल्गोरिदम को "अत्याधुनिक" माना जाता है? ऐसे एल्गोरिदम का अंतर्ज्ञान / मुख्य योगदान क्या है ?
क्या FPGrowth एल्गोरिथ्म को अभी भी लगातार पैटर्न खनन में "कला की स्थिति" माना जाता है? यदि नहीं, तो क्या एल्गोरिथ्म बड़े डेटासेट से लगातार आइटम को अधिक कुशलता से निकाल सकता है?