कैसे सबसे अच्छा यह अलग-अलग हो जा रहा है ऐसा करने के लिए काफी है, तो यह कहने के लिए क्या एक कार्य-स्वतंत्र तरह से सबसे अच्छा हो जाएगा असंभव है, काम आप प्रदर्शन कर रहे हैं पर निर्भर करता है।
यदि आपके स्तर सामान्य हैं, तो दो आसान चीजें हैं:
- उन्हें बिन। जैसे, 0 = (0 250), 1 = (251 500), इत्यादि, आप सीमाओं का चयन करना चाह सकते हैं ताकि प्रत्येक बिन में समान आइटम न हों।
- आप स्तरों का लॉग ट्रांसफ़ॉर्म भी ले सकते हैं। यह सीमा को नीचे कर देगा।
यदि स्तर सामान्य नहीं हैं, तो आप अपने डेटासेट में अन्य विशेषताओं / चर के आधार पर स्तरों को क्लस्टर कर सकते हैं और पिछले स्तरों के लिए क्लस्टर आईडी को स्थानापन्न कर सकते हैं। ऐसा करने के कई तरीके हैं क्योंकि क्लस्टरिंग एल्गोरिदम हैं, इसलिए फ़ील्ड व्यापक रूप से खुली है। जैसा कि मैंने पढ़ा, यह वही combine.levels()
कर रहा है। आप इसी तरह का उपयोग kmeans()
कर सकते हैं या prcomp()
। (आप बाद में नए डेटापैट के लिए क्लस्टर का अनुमान लगाने के लिए एक क्लासिफायरियर कर सकते हैं।)