हम जानते हैं कि जैकार्ड ( बाइनरी डेटा के किसी भी दो कॉलम के बीच गणना की गई हैX) है aa+b+c, जबकि रोजर्स-तनीमोतो है a+da+d+2(b+c), कहाँ पे
- a - पंक्तियों की संख्या जहां दोनों कॉलम 1 हैं
- b - पंक्तियों की संख्या जहां यह है और अन्य कॉलम 1 नहीं है
- c - पंक्तियों की संख्या जहां अन्य और यह कॉलम 1 नहीं है
- d - पंक्तियों की संख्या जहाँ दोनों कॉलम 0 हैं
a+b+c+d=nमें पंक्तियों की संख्या X
तो हमारे पास हैं:
X′X=A का वर्ग सममित मैट्रिक्स है a सभी स्तंभों के बीच।
(notX)′(notX)=D का वर्ग सममित मैट्रिक्स है घ सभी स्तंभों के बीच ("नहीं X" X में 1-> 0 और 0-> 1 को परिवर्तित कर रहा है)।
इसलिए, एएन - डी सभी स्तंभों के बीच जैकार्ड का वर्गाकार सममित मैट्रिक्स है।
ए + डीA + D + 2 ( n - ( A + D ) )=ए + डी2 एन - ए - डी सभी स्तंभों के बीच रोजर्स-टैनिमोटो का वर्ग सममित मैट्रिक्स है।
मैंने संख्यात्मक रूप से जाँच की अगर ये सूत्र सही परिणाम देते हैं। वे करते हैं।
Upd। आप मैट्रिस भी प्राप्त कर सकते हैंबी तथा सी:
बी = [ १]'एक्स - ए, जहां "[1]" लोगों के मैट्रिक्स को दर्शाता है, आकार के रूप में एक्स। बी का वर्ग असममित मैट्रिक्स है खसभी स्तंभों के बीच; इसका तत्व ij पंक्तियों की संख्या हैएक्सकॉलम I में 0 और कॉलम j में 1 के साथ ।
इसके फलस्वरूप, सी =बी'।
आव्यूह डी इस तरह से भी गणना की जा सकती है: एन - ए - बी - सी।
मत्रियों को जानना ए , बी , सी , डी, आप द्विआधारी डेटा के लिए आविष्कार किए गए किसी भी जोड़ीदार (डिस) समानता गुणांक के मैट्रिक्स की गणना करने में सक्षम हैं।
vegan
पैकेज में पहले से ही कई समानता सूचक (जैकार्ड सहित) लागू हैं । मुझे लगता है कि वे गति के लिए बहुत अच्छी तरह से अनुकूलित होते हैं।