मेरे पास डेटा है जो इसके बराबर है:
shopper_1 = ['beer', 'eggs', 'water',...]
shopper_2 = ['diapers', 'beer',...]
...
मैं एक सहसंबंध मैट्रिक्स पाने के लिए सेट किए गए इस डेटा पर कुछ विश्लेषण करना चाहूंगा जिसका एक निहितार्थ होगा: यदि आपने x खरीदा है, तो आप y खरीदने की संभावना रखते हैं।
अजगर का उपयोग करना (या शायद कुछ भी लेकिन MATLAB), मैं उसके बारे में कैसे जा सकता हूं? कुछ बुनियादी दिशा-निर्देश, या संकेत जहां मुझे देखना चाहिए, मदद करेगा।
धन्यवाद,
संपादित करें - मैंने जो सीखा है:
इस तरह की समस्याओं को एसोसिएशन रूल डिस्कवरी के रूप में जाना जाता है। विकिपीडिया में ऐसा करने के लिए कुछ सामान्य एल्गोरिदम को कवर करने वाला एक अच्छा लेख है। अग्रवाल एट के कारण ऐसा करने के लिए क्लासिक एल्गोरिदम एप्रीओरी लगता है। अल।
कि मुझे नारंगी , एक अजगर अजगर डेटा खनन पैकेज के लिए सीसा । लिनक्स के लिए, इसे स्थापित करने का सबसे अच्छा तरीका आपूर्ति किए गए setup.py का उपयोग करके स्रोत से लगता है
डिफ़ॉल्ट रूप से ऑरेंज फाइलों से इनपुट पढ़ता है, कई समर्थित तरीकों में से एक में स्वरूपित।
अंत में, एक साधारण एप्रीओरी एसोसिएशन नियम सीखना नारंगी में सरल है।
arules
तो देखने लायक होगा। हो सकता है कि "संघ के नियम" एक अच्छा खोज शब्द है