मैं अन्य df के साथ df के एक कॉलम की तुलना करना चाहूंगा। कॉलम नाम और अंतिम नाम हैं। मैं जांचना चाहूंगा कि क्या एक डेटा फ्रेम में एक व्यक्ति दूसरे में है।
मैं अन्य df के साथ df के एक कॉलम की तुलना करना चाहूंगा। कॉलम नाम और अंतिम नाम हैं। मैं जांचना चाहूंगा कि क्या एक डेटा फ्रेम में एक व्यक्ति दूसरे में है।
जवाबों:
यदि आप एक निश्चित कॉलम पर मानों की बराबरी करना चाहते हैं तो मान लें कि नाम आप दोनों डेटाफ्रेम को एक नए में मर्ज कर सकते हैं:
mergedStuff = pd.merge(df1, df2, on=['Name'], how='inner')
mergedStuff.head()
मुझे लगता है कि यह अधिक कुशल और तेज़ है तो where
यदि आपके पास एक बड़ा डेटा सेट है
दो अलग-अलग कॉलम में मानों की तुलना करना
सेट का उपयोग करके, प्रत्येक कॉलम में अद्वितीय मान प्राप्त करें। इन दो सेटों के प्रतिच्छेदन दोनों स्तंभों में अद्वितीय मान प्रदान करेंगे।
उदाहरण:
df1 = pd.DataFrame({'c1': [1, 4, 7], 'c2': [2, 5, 1], 'c3': [3, 1, 1]})
df2 = pd.DataFrame({'c4': [1, 4, 7], 'c2': [3, 5, 2], 'c3': [3, 7, 5]})
set(df1['c2']).intersection(set(df2['c2']))
आउटपुट:
{2, 5}
दो डेटाफ्रेम के कॉलम नामों की तुलना करना
आप दो डेटाफ्रेम के कॉलम नामों की तुलना करने की कोशिश कर रहे हैं:
यदि df1
और df2
दो डेटाफ्रेम हैं:
set(df1.columns).intersection(set(df2.columns))
यह अद्वितीय स्तंभ नाम प्रदान करेगा जो दोनों डेटाफ्रेम में निहित हैं।
उदाहरण:
df1 = pd.DataFrame({'c1': [1, 4, 7], 'c2': [2, 5, 1], 'c3': [3, 1, 1]})
df2 = pd.DataFrame({'c4': [1, 4, 7], 'c2': [3, 5, 2], 'c3': [3, 7, 5]})
set(df1.columns).intersection(set(df2.columns))
आउटपुट:
{'c2', 'c3'}