मैं क्लस्टरिंग विधियों को समझने की कोशिश कर रहा हूं।
मुझे क्या समझ में आया II:
पर्यवेक्षित शिक्षण में, गणना के पहले श्रेणियों / लेबल डेटा को ज्ञात किया जाता है। तो, लेबल, कक्षाएं या श्रेणियां उन मापदंडों को "जानने" के लिए उपयोग की जा रही हैं जो उन समूहों के लिए वास्तव में महत्वपूर्ण हैं।
अनिश्चित सीखने में, डेटासेट को सेगमेंट को सौंपा जाता है, बिना क्लस्टर के जाना जाता है।
इसका मतलब यह है कि, अगर मुझे यह भी पता नहीं है कि एक विभाजन के लिए कौन से पैरामीटर महत्वपूर्ण हैं, तो मुझे पर्यवेक्षित शिक्षण को प्राथमिकता देनी चाहिए?