दो इष्टतम सबसेट में बिंदुओं के एक सेट का पता लगाना


9

मैं दो समान आकार के सबसेट में बिंदुओं के एक सेट को विभाजित करना चाहता हूं, ताकि वर्गों के भीतर-क्लस्टर योग कम से कम हो। हम मान सकते हैं कि अंक दो-आयामी यूक्लिडियन अंतरिक्ष में हैं। मैं सामान्य k- साधन क्लस्टरिंग एल्गोरिथ्म की तुलना में तेजी से कुछ के लिए उम्मीद कर रहा हूँ कि k = d = 2 दिया गया है। क्या कोई मुझे इसके लिए एक अच्छे एल्गोरिथ्म की दिशा में इंगित कर सकता है?

एक सटीक समाधान आवश्यक नहीं है अगर हमारे पास एक अच्छा अनुमान है।

धन्यवाद!

जवाबों:


10

यदि आप सटीक विभाजन पर जोर देते हैं, तो आपको एक पंक्ति द्वारा विमान में बिंदुओं के एक सेट के सभी संतुलित विभाजन की गणना करने की आवश्यकता है (इष्टतम विभाजन एक वोरोनोई विभाजन है, इसलिए दो बिंदु सेट एक पंक्ति द्वारा अलग हो जाते हैं)। इस तरह के विभाजन के रूप में जाना जाता है -sets। सबसे तेजी से एल्गोरिथ्म वर्तमान में इस काम के लिए जाना जाता है दोहरी में इन विभाजनों की गणना के लिए [यानी, का एक सेट के स्तर लाइनों, के लिए ] । एक बार आपके पास सभी संभावित विभाजन होने के बाद, आपको बस उनमें से हर एक को जांचना होगा। मानक चाल का उपयोग करना, यह प्रत्येक विभाजन के लिए निरंतर समय में किया जा सकता है।हे(n4/3लॉगn)n=n/2

(अपडेट: प्रमाणन कि इष्टतम विभाजन एक से महसूस किया है के लिए, सेट , पूरी तरह से तुच्छ नहीं है मुझे कोई दिलचस्पी पाठक के लिए एक प्यारा व्यायाम के रूप में यह छोड़ना होगा संकेत:।। लाइन दो के माध्यम से गुजर पर विचार करें इष्टतम केंद्र, और इसके लिए सीधा दिशा।)=n/2

आप सटीक समाधान के बारे में परवाह नहीं करते हैं, तो एक आसान दृष्टिकोण के लिए एक coreset उपयोग करने के लिए किया जाएगा -means क्लस्टरिंग। यह इस मामले में भारित अंक होगा, कुल वजन । फिर, आपको बस भारित बिंदु-सेट पर समस्या को हल करने की आवश्यकता है। सबसे आसान समाधान तो होगा केंद्रों के लिए उम्मीदवार स्थानों का एक सेट, और भारित बिंदुओं पर सभी जोड़ों की कोशिश करना। अभ्यर्थी केंद्रों का निर्माण और निर्माण, इस पत्र में वर्णित है:हे(ε-2लॉगn)n

http://sarielhp.org/p/03/kcoreset/

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.