मेरे डेटासेट में मेरे पास दो श्रेणीबद्ध कॉलम हैं, जिन्हें मैं संक्षिप्त करना चाहूंगा। दोनों स्तंभों में दोनों देश हैं, कुछ ओवरलैप (दोनों कॉलम में दिखाई देते हैं)। मैं उसी देश के लिए कॉलम 1 और कॉलम 2 में समान संख्या देना चाहूंगा।
मेरा डेटा कुछ इस तरह दिखता है:
import pandas as pd
d = {'col1': ['NL', 'BE', 'FR', 'BE'], 'col2': ['BE', 'NL', 'ES', 'ES']}
df = pd.DataFrame(data=d)
df
करंट मैं डेटा को रूपांतरित कर रहा हूं जैसे:
from sklearn.preprocessing import LabelEncoder
df.apply(LabelEncoder().fit_transform)
हालांकि यह FR और ES के बीच कोई अंतर नहीं करता है। निम्नलिखित आउटपुट पर आने का एक और सरल तरीका है?
o = {'col1': [2,0,1,0], 'col2': [0,2,4,4]}
output = pd.DataFrame(data=o)
output