मेरे पास 36k अंक के साथ एक बड़ा डेटासेट है, जो प्रत्येक वर्ग दृश्य वाले क्षेत्र के साथ वाणिज्यिक भूमि उपयोगों का प्रतिनिधित्व करता है। मैंने इस डेटासेट पर एक कर्नेल घनत्व विश्लेषण चलाया है, जो पूरे मेट्रो क्षेत्र पर वाणिज्यिक वर्ग फुटेज का घनत्व दिखाते हुए एक रास्टर का निर्माण करता है। मुझे इस मैस्टर को स्थानीय मैक्सीमा के अनुरूप क्षेत्रों में विभाजित करने की आवश्यकता है, जिसे मैं "केंद्र" कहता हूं। मैंने पहले ही केंद्रों के स्थानों का निर्धारण कर लिया है, और अब मुझे दो काम करने होंगे:
एक बिंदु क्लस्टरिंग टूल का उपयोग करें, जैसे कि "मेडोइड्स के आसपास विभाजन", बिंदुओं को मैंने पहचाने गए केंद्रों के आसपास क्लस्टर में बिंदुओं को समूहित करने के लिए। इस पद्धति के साथ समस्या यह है कि यह कम्प्यूटेशनल रूप से तीव्र है, और इससे भी अधिक अगर मैं आकार से अंक को वजन करने के लिए एक असमानता मैट्रिक्स का उपयोग करने की कोशिश करता हूं।
किसी तरह कर्नेल घनत्व रेखापुंज को विभाजित करें (जो मोटे तौर पर एक इलाके रेखापुंज जैसा दिखता है) प्रत्येक केंद्र के आसपास व्यक्तिगत "पहाड़ियों" में। लेकिन मैं ऐसा करने के लिए किसी भी उपकरण के बारे में नहीं सोच सकता।
इस समस्या ने मुझे कुछ समय के लिए त्रस्त कर दिया है, और मुझे आशा है कि मैं आर में क्लस्टरिंग विधि का प्रदर्शन कर सकूंगा, लेकिन यह समय लेने वाला है और मैं समय से बाहर चल रहा हूं। क्या किसी को घनत्व के चूहों को तीव्रता के पड़ोस में विभाजित करने या बड़े डेटासेट को जल्दी से क्लस्टर करने के लिए एक सरल विधि के बारे में पता है?