मैंने k- साधनों के बारे में शोध किया और ये मुझे मिले: k-mean सबसे सरल एल्गोरिथ्म में से एक है जो ज्ञात क्लस्टरिंग समस्याओं को हल करने के लिए अप्रशिक्षित शिक्षण पद्धति का उपयोग करता है। यह बड़े डेटासेट के साथ वास्तव में अच्छी तरह से काम करता है।
हालांकि, के-मीन्स की कमियां भी हैं जो हैं:
- आउटलेर्स और शोर के लिए मजबूत संवेदनशीलता
- गैर-परिपत्र क्लस्टर आकार के साथ अच्छी तरह से काम नहीं करता है - क्लस्टर की संख्या और प्रारंभिक बीज मूल्य को पहले से निर्दिष्ट करने की आवश्यकता है
- स्थानीय इष्टतम को पारित करने की कम क्षमता।
क्या k- साधनों के बारे में कुछ महान है, क्योंकि ऐसा लगता है कि कमियां k- साधनों के बारे में अच्छी चीजों से परे हैं।
कृपया मुझे सिखाओ।