मेरे पास 2-डी डेटा का एक सेट है जहां मैं एक निर्दिष्ट दूरी ( ) के भीतर अंक की कुल संख्या को अधिकतम करने वाले हलकों ( ) के केंद्रों की संख्या का पता लगाना चाहता हूं ।आर
उदाहरण के लिए मेरे पास 10,000 डेटा पॉइंट्स और मैं सर्किलों के केंद्रों को खोजना चाहता हूं जो दायरे में अधिक से अधिक पॉइंट्स कैप्चर कर । 5 केंद्र और 10 का त्रिज्या पहले से दिए गए हैं, डेटा से नहीं।N = 5 R = 10
एक सर्कल के भीतर डेटा बिंदु की उपस्थिति एक द्विआधारी या तो / या प्रस्ताव है। यदि , तो 100 यूनिट दूर बनाम 11 बिंदुओं के मान में कोई अंतर नहीं है, क्योंकि वे दोनों> 10 हैं। इसी तरह सर्कल के भीतर होने के लिए, केंद्र के पास बनाम किनारे के पास होने का कोई अतिरिक्त मूल्य नहीं है। । एक डेटा बिंदु या तो एक सर्कल में या बाहर है।
क्या एक अच्छा एल्गोरिथ्म है जिसका उपयोग इस समस्या को हल करने के लिए किया जा सकता है? ये क्लस्टरिंग तकनीकों से संबंधित हैं, लेकिन औसत दूरी को कम करने के बजाय, "दूरी" फ़ंक्शन 0 है यदि बिंदु बिंदुओं में से किसी भी के भीतर है , और 1 अन्यथा।एन
मेरी प्राथमिकता आर में ऐसा करने का एक तरीका खोजना होगा, लेकिन किसी भी दृष्टिकोण की सराहना की जाएगी।