हमें एक सेट 2-आयामी अंक दिए गए हैं और एक पूर्णांक । हमें सर्किलों का एक संग्रह खोजना होगा जो सभी पॉइंट्स को घेरता है जैसे कि सबसे बड़े सर्कल का त्रिज्या जितना संभव हो उतना छोटा है। दूसरे शब्दों में, हम एक सेट खोजने होंगे की सेंटर अंक ऐसा है कि लागत समारोह को कम से कम किया जाता है। यहाँ, डी एक इनपुट बिंदु p_i और एक केंद्र बिंदु c_j के बीच यूक्लिडियन दूरी को दर्शाता है । प्रत्येक बिंदु कश्मीर में कोने को समूहीकृत करने वाले निकटतम क्लस्टर केंद्र को स्वयं निर्दिष्ट करता हैk k n C = { c 1 , c 2 , … , c k } k cost ( C ) = अधिकतम i min j D ( p i , c j ) D p i c j k विभिन्न समूहों।
समस्या को (असतत) -clustering समस्या के रूप में जाना जाता है और यह -hard है। यह -complete प्रभुत्व सेट समस्या से कमी के साथ दिखाया जा सकता है कि यदि \ rho <2 के साथ समस्या के लिए -approximation एल्गोरिथ्म मौजूद है तो \ text {P} = \ text {NP} ।
इष्टतम -approximation एल्गोरिथ्म बहुत सरल और सहज है। एक पहले मनमाने ढंग से P में एक बिंदु p \ _ चुनता है और इसे क्लस्टर केंद्रों के सेट C में डालता है । फिर एक अगला क्लस्टर केंद्र चुनता है जो अन्य सभी क्लस्टर केंद्रों से यथासंभव दूर है। तो जबकि , हम बार-बार P में एक बिंदु j \ _ ढूंढते हैं , जिसके लिए D (j, C) की दूरी अधिकतम है और इसे C में जोड़ें । एक बार हम कर रहे हैं।
यह देखना मुश्किल नहीं है कि इष्टतम लालची एल्गोरिथ्म समय में चलता है । यह एक प्रश्न उठाता है: क्या हम समय प्राप्त कर सकते हैं ? हम कितना बेहतर कर सकते हैं?