सादे अंग्रेजी में Apriori एल्गोरिथ्म?


9

मैंने Apriori के बारे में विकि लेख पढ़ा। मुझे प्रून और जॉइन स्टेप समझने में परेशानी होती है। क्या कोई मुझे समझा सकता है कि कैसे अप्रीरी एल्गोरिथ्म सरल शब्दों में काम करता है (जैसे कि नौसिखिया मुझे आसानी से समझ सकता है)?

अच्छा होगा अगर कोई इसमें शामिल स्टेप बाई स्टेप प्रक्रिया को समझाए।


जवाबों:


11

विकिपीडिया लेख विशेष रूप से प्रभावशाली नहीं है। आपको ये स्लाइड अधिक सहायक लग सकती हैं: 1 , 2 , 3

प्रत्येक स्तर पर , आपके पास -emem सेट होते हैं जो अक्सर होते हैं (पर्याप्त समर्थन करते हैं)।

अगले स्तर पर, + -सेट आपके द्वारा विचार की जाने वाली संपत्ति के लिए आवश्यक है कि उनके प्रत्येक उपसमुच्चय को लगातार (पर्याप्त समर्थन हो) होना चाहिए। यह एप्रीरी प्रॉपर्टी है : किसी भी आइटम के अक्सर सब्सेट का लगातार होना।1

इसलिए यदि आप स्तर 2 पर जानते हैं कि सेट , , और पर्याप्त समर्थन के साथ ही सेट हैं, तो स्तर 3 पर आप , , और का उत्पादन करने के लिए एक-दूसरे के साथ जुड़ते हैं लेकिन आपको आगे केवल पर विचार करने की आवश्यकता है : दूसरों के पास अपर्याप्त समर्थन (जैसे या ) के साथ सबसेट है ।{1,2}{1,3}{1,5}{3,5}{1,2,3}{1,2,5}{1,3,5}{2,3,5}{1,3,5}{2,3}{2,5}


2

Apriori एल्गोरिथ्म एक एसोसिएशन नियम खनन एल्गोरिथ्म है जिसका उपयोग डेटा माइनिंग में किया जाता है। इसका उपयोग दिए गए लेन-देन की संख्या के बीच लगातार आइटमसेट को खोजने के लिए किया जाता है।

इसमें मूल रूप से दो चरण होते हैं

  1. स्व शामिल हों
  2. छंटाई

इन चरणों को बार-बार दोहराते हुए, जहाँ k आइटमों की संख्या है, अंतिम पुनरावृत्ति में आपको k आइटम वाले लगातार आइटम सेट मिलते हैं।

एक विस्तृत उदाहरण http://nikhilvithlani.blogspot.com/2012/03/apriori-algorithm-for-data-mining-made.html के साथ एक बहुत ही सरल स्पष्टीकरण के लिए यहां देखें ।

बिना किसी जटिल समीकरण के इसकी सरल व्याख्या है।


2
मैंने इस पोस्ट नोटिस को छोड़ दिया क्योंकि यह आमतौर पर उन मुख्य बिंदुओं का सारांश प्रदान करने के लिए बेहतर है जिन्हें आप बिना स्पष्टीकरण के ब्लॉग के लिंक के बजाय जोर देना चाहते हैं। इसके अलावा, इस साइट का उद्देश्य ख़तरनाक या अल्पकालिक लिंक पर न्यूनतम निर्भरता के साथ विशिष्ट प्रश्नों के जानकार प्रतिक्रियाओं का एक संग्रह बनाना है। इसलिए जब तक आप यह गारंटी नहीं दे सकते कि उपरोक्त लिंक अभी भी 10 वर्षों में जीवित है, कहते हैं, मैं आपको वर्तमान उत्तर में इसके मुख्य बिंदुओं को संक्षेप में प्रस्तुत करने के लिए दृढ़ता से प्रोत्साहित करूंगा।
chl

1

सादे अंग्रेजी में Apriori।

Apriori स्तर-वार खोज के रूप में जाना जाने वाला पुनरावृत्त दृष्टिकोण को नियोजित करता है, जहां k- आइटमसेट का पता लगाने के लिए उपयोग किया जाता है (k + 1) -itemsets । सबसे पहले, लगातार 1-आइटमसेट का सेट डेटाबेस को स्कैन करके प्रत्येक आइटम के लिए गिनती जमा करने के लिए पाया जाता है, और उन वस्तुओं को इकट्ठा करता है जो किसी भी समर्थन को संतुष्ट करते हैं। परिणामी सेट को L1 के रूप में दर्शाया जाता है । अगला, L1 का उपयोग L2 को खोजने के लिए किया जाता है , अक्सर 2-आइटम का सेट , जिसका उपयोग L3 को खोजने के लिए किया जाता है, और इसी तरह, जब तक कि अधिक लगातार के-आइटम नहीं मिलते। प्रत्येक Lk की खोज के लिए डेटाबेस के एक पूर्ण स्कैन की आवश्यकता होती है।

अंतिम पुनरावृत्ति पर आप कई के-आइटम के साथ समाप्त हो जाएंगे, जिसे मूल रूप से एसोसिएशन के नियम कहा जाता है । सभी संभव नियम विभिन्न बाधा के सेट से दिलचस्प नियम का चयन करने के उपायों जैसे समर्थन और विश्वास लागू किया जाता है।

शर्तें और शब्दावली

  • 1-आइटम का अर्थ है {a}, {b}, {c}
  • 2-आइटम का अर्थ है {a, b}, {d, d}, {a, c}
  • K- आइटमसेट का मतलब {i1, i2, i3, ... ik}, {j1, j2, j3, .... kk} है।

स्टेप ज्वाइन करें: 2-आइटम जेनरेट करने के लिए 1-आइटमसेट स्वयं से जुड़ने के लिए बनाया गया है।

प्रून स्टेप: यहां पर जोइन से सेट किया गया है, न्यूनतम सपोर्ट थ्रेशोल्ड के साथ फिल्टर्ड है।

कार्डिनैलिटी सेट: प्रून स्टेप से सेट किया गया।

समर्थन = no.of पारगमन जिसमें 'ए' और 'बी' / कुल लेनदेन नहीं है।

समर्थन => दबा (ए, बी) => पी (एक यू बी)

कॉन्फिडेंट = 'a ’और / b’ वाले कोई भी ट्रांजेक्शन नं।

आत्मविश्वास => कोन (ए, बी) ==> पी (बी) ए सशर्त संभावना के अलावा और कुछ नहीं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.