3
क्लस्टर बिग डेटा आर में और नमूना प्रासंगिक है?
मैं डेटा साइंस में नया हूं और 200,000 पंक्तियों और 50 कॉलमों वाले डेटा सेट में क्लस्टर खोजने में समस्या है। चूँकि डेटा में संख्यात्मक और नाममात्र दोनों चर होते हैं, इसलिए K-Mean जैसे तरीके जो यूक्लिडियन दूरी माप का उपयोग करते हैं, एक उपयुक्त विकल्प नहीं लगता है। इसलिए …