मेरे पास n सेट का एक समूह है जिसके लिए मुझे "विशिष्टता" या "समानता" मान के एक प्रकार की गणना करने की आवश्यकता है। मैं एक उपयुक्त मीट्रिक के रूप में जैककार्ड इंडेक्स पर बस गया हूं । दुर्भाग्य से, जैकार्ड सूचकांक केवल एक बार में दो सेटों पर काम करता है। सभी सेटों के बीच समानता की गणना करने के लिए , n n 2 जैकार्ड गणनाओं के क्रम में इसकी आवश्यकता होगी ।
(यदि यह मदद करता है, तो आमतौर पर 10 से 10000 के बीच होता है, और प्रत्येक सेट में औसतन 500 तत्व होते हैं। इसके अलावा, अंत में, मुझे परवाह नहीं है कि कोई भी दो विशिष्ट सेट समान हैं - बल्कि, मुझे केवल इस बात की परवाह है कि आंतरिक समानता क्या है सेट का पूरा समूह है। (दूसरे शब्दों में, समूह में सभी जैककार्ड इंडेक्स के माध्य (या कम से कम एक पर्याप्त सटीक अनुमान))
दो सवाल:
- वहाँ अभी भी जटिलता के बिना Jaccard सूचकांक का उपयोग करने का एक तरीका है ?
- क्या मेरे द्वारा सुझाए गए तरीके से सेट के समूह में सेट समानता / विशिष्टता की गणना करने का एक बेहतर तरीका है?