अधिकतम और बंद अक्सर - उत्तर शामिल हैं


10

My  dataset:
1:A,B,C,E
2:A,C,D,E
3:     B,C,E
4:A,C,D,E
5:    C,D,E
6:    A,D,E

मैं अधिकतम बार-बार आइटम सेट और बंद किए गए लगातार आइटम सेट का पता लगाना चाहता हूं ।

  • बार-बार आइटम सेट XFहै अधिक से अधिक है, तो यह किसी भी लगातार supersets जरूरत नहीं है।
  • आवृत्ति आइटम सेट X is F को बंद कर दिया जाता है यदि उसमें समान आवृत्ति के साथ कोई सुपरसेट न हो

इसलिए मैंने प्रत्येक आइटम सेट की घटना को गिना।

{A} = 4 ;  {B} = 2  ; {C} = 5  ; {D} = 4  ; {E} = 6

{A,B} = 1; {A,C} = 3; {A,D} = 3; {A,E} = 4; {B,C} = 2; 
{B,D} = 0; {B,E} = 2; {C,D} = 3; {C,E} = 5; {D,E} = 3

{A,B,C} = 1; {A,B,D} = 0; {A,B,E} = 1; {A,C,D} = 2; {A,C,E} = 3; 
{A,D,E} = 3; {B,C,D} = 0; {B,C,E} = 2; {C,D,E} = 3

{A,B,C,D} = 0; {A,B,C,E} = 1; {B,C,D,E} = 0

Min_Support पर सेट किया गया 50// बहोत महत्वपूर्ण। उस की याद दिलाने के लिए धन्यवाद स्टीफ़न।

अधिकतम करता है ={A,B,C,E} ?

बंद करता है ={A,B,C,D} and {B,C,D,E}?

जवाबों:


5

मुझे इस स्रोत में थोड़ी विस्तारित परिभाषा मिली (जिसमें एक अच्छी व्याख्या शामिल है)। यहां एक अधिक विश्वसनीय (प्रकाशित) स्रोत है: CHARM: मोहम्मद जे। जकी और चिंग-जुई ह्सियाओ द्वारा बंद किए गए आइटमसेट खनन के लिए एक कुशल एल्गोरिदम

इस स्रोत के अनुसार:

  • एक आइटमसेट को बंद कर दिया जाता है यदि उसके किसी भी तत्काल सुपरसेट का आइटम के समान समर्थन नहीं है
  • एक आइटमसेट अधिकतम बार-बार होता है अगर उसका कोई भी तत्काल सुपरसेट अक्सर नहीं होता है


कुछ टिप्पणी:

  • यह एक min_support (समर्थन = सभी आइटमों की संख्या से विभाजित ब्याज के सबसेट वाले आइटम सेटों की संख्या) को सेट करने के लिए आवश्यक है, जो यह निर्धारित करता है कि कौन सा आइटम अक्सर है । एक आइटम अक्सर तब होता है जब उसका समर्थन> = min_support।
  • एल्गोरिथ्म के संबंध में, केवल min_support वाले आइटम पर विचार किया जाता है जब कोई अधिकतम बार-बार और बंद आइटम खोजने की कोशिश करता है।
  • बंद की परिभाषा में महत्वपूर्ण पहलू यह है कि इससे कोई फर्क नहीं पड़ता कि एक तत्काल सुपरसेट अधिक समर्थन के साथ मौजूद है, केवल एक ही समर्थन के साथ तत्काल सुपरसेट क्या मायने रखता है।
  • अधिकतम लगातार => बंद => लगातार, लेकिन इसके विपरीत नहीं।

ओपी के उदाहरण के लिए आवेदन

ध्यान दें:

  • समर्थन मायने नहीं रखता है
  • मान लीजिए कि min_support = 0.5 है। यह पूरा हो गया है अगर min_support_count> = 3
{ए} = ४; {A, E} के कारण बंद नहीं
{बी} = २; बार-बार न आना = उपेक्षा करना
{C} = 5; {C, E} के कारण बंद नहीं
{D} = 4; {D, E} के कारण बंद नहीं हुआ, लेकिन जैसे {A, D} के कारण अधिकतम नहीं
{ई} = ६; बंद हो गया, लेकिन उदाहरण के लिए {D, E} के कारण अधिकतम नहीं

{(बी, बी} = 1; बार-बार न आना = उपेक्षा करना
{(सी, सी) = 3; {A, C, E} के कारण बंद नहीं
{, डी।} = 3; {A, D, E} के कारण बंद नहीं
{, ई।} = 4; {A, D, E} के कारण बंद, लेकिन अधिकतम नहीं
{बी, सी} = 2; बार-बार न आना = उपेक्षा करना
{बी, डी} = 0; बार-बार न आना = उपेक्षा करना
{बी, ई} = 2; बार-बार न आना = उपेक्षा करना
{C, D} = 3; {C, D, E} के कारण बंद नहीं
{C, E} = 5; बंद हो गया, लेकिन {C, D, E} के कारण अधिकतम नहीं
{डी, ई} = 4; {A, D, E} के कारण बंद, लेकिन अधिकतम नहीं

{(बी, बी, सी} = 1; बार-बार न आना = उपेक्षा करना
{(बी, बी, डी} = 0; बार-बार न आना = उपेक्षा करना
{, बी, बी, ई} = 1; बार-बार न आना = उपेक्षा करना
{, सी, सी, डी} = 2; बार-बार न आना = उपेक्षा करना
{, सी, सी, ई} = 3; अधिक से अधिक बार
{, डी, डी, ई} = 3; अधिक से अधिक बार
{बी, सी, डी} = 0; बार-बार न आना = उपेक्षा करना
{बी, सी, ई} = 2; बार-बार न आना = उपेक्षा करना
{सी, डी, ई} = 3; अधिक से अधिक बार

{, बी, सी, डी} = 0; बार-बार न आना = उपेक्षा करना
{(बी, बी, सी, ई} = 1; बार-बार न आना = उपेक्षा करना
{बी, सी, डी, ई} = 0; बार-बार न आना = उपेक्षा करना

स्रोत लिंक टूट गया है, बस आपको बताएंगे। और हां min_support बहुत महत्वपूर्ण है, मैं .50 का उपयोग कर रहा हूं
माइक जॉन

1
इसके लिए क्षमा करें, ठीक किया गया।
स्टीफन

1
परिवर्तित min_support = 0.5 <=> min_support_count = 3 और उसके अनुसार उदाहरण के लिए परिवर्तित अनुप्रयोग।
स्टीफेन

APRIORI का उपयोग करें, और आप बहुत सारे गिनती और
आइटम के

@ Anony-Mousse मुझे पता है APRIORI ... मैंने बंद और अधिकतम बार-बार आने वाले आइटमों की अवधारणा को यथासंभव विस्तृत करने के लिए मैन्युअल रूप से आइटमसेट पर कदम रखा, क्योंकि यह ओपी (IMHO) की उलझन का स्रोत था।
स्टेफेन

1

आप APRIORI एल्गोरिथ्म पर पढ़ना चाह सकते हैं। यह चतुर चुभन द्वारा अनावश्यक वस्तुओं से बचता है।

{A} = 4 ;  {B} = 2  ; {C} = 5  ; {D} = 4  ; {E} = 6

बी लगातार नहीं है, निकालें।

दो-आइटमों का निर्माण और गणना करें (अभी तक कोई जादू नहीं है, सिवाय इसके कि Bपहले से ही बाहर है)

{A,C} = 3; {A,D} = 3; {A,E} = 4; 
{C,D} = 3; {C,E} = 5; {D,E} = 3

ये सभी बार-बार होते हैं (ध्यान दें कि सभी जो Bअक्सर नहीं हो सकते थे !)

अब उपसर्ग नियम का उपयोग करें। केवल उसी n-1 आइटम के साथ शुरू होने वाले आइटम को मिलाएं। सभी निकालें, जहां कोई भी सबसेट अक्सर नहीं है। शेष वस्तुओं की गणना करें।

{A,C,D} = 2; {A,C,E} = 3; {A,D,E} = 3; 
{C,D,E} = 3

ध्यान दें कि {A,C,D}अक्सर नहीं होता है। जैसा कि कोई साझा उपसर्ग नहीं है, एक बड़ा लगातार आइटम नहीं हो सकता है!

ध्यान दें कि मैंने कितना कम काम किया!

अधिकतम / बंद आइटमसेट के लिए, सबसेट / सुपरसेट को चेक करें।

ध्यान दें कि जैसे {E}=6, और {A,E}=4{E}एक सबसेट है, लेकिन इसका उच्च समर्थन है, अर्थात यह बंद है लेकिन अधिकतम नहीं है। {A}न तो है, क्योंकि यह अधिक से अधिक समर्थन नहीं है {A,E}, यानी यह बेमानी है

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.