हाय मैं पंडों के लिए कॉनसैट, जॉइन, और मर्ज विधियों के माध्यम से खुदाई कर रहा हूं और मुझे जो चाहिए वह नहीं मिल रहा है।
मान लें कि मेरे पास दो डेटाफ्रेम हैं
A = pd.DataFrame("A",index=[0,1,2,3,4],columns=['Col 1','Col 2','Col 3'])
B = pd.DataFrame("B",index=[0,1,2,3,4],columns=['Col 1','Col 2','Col 3'])
>>> A
Col 1 Col 2 Col 3
0 A A A
1 A A A
2 A A A
3 A A A
4 A A A
>>> B
Col 1 Col 2 Col 3
0 B B B
1 B B B
2 B B B
3 B B B
4 B B B
अब मैं मर्ज किए गए कॉलम के साथ एक नया डेटाफ्रेम बनाना चाहता हूं, मुझे लगता है कि अगर मैं कॉलम चाहता हूं तो इसके लिए एक मल्टी इंडेक्स बनाने के लिए इसका स्पष्टीकरण सबसे आसान है।
index = pd.MultiIndex.from_product([A.columns.values,['A','B']])
>>> index
MultiIndex(levels=[['Col 1', 'Col 2', 'Col 3'], ['A', 'B']],
labels=[[0, 0, 1, 1, 2, 2], [0, 1, 0, 1, 0, 1]])
अब अगर मैं कॉलम के लिए इस मल्टी इंडेक्स के साथ एक खाली डेटाफ़्रेम बनाता हूं
empty_df = pd.DataFrame('-',index=A.index,columns=index)
>>> empty_df
Col 1 Col 2 Col 3
A B A B A B
0 - - - - - -
1 - - - - - -
2 - - - - - -
3 - - - - - -
4 - - - - - -
मेरा सवाल यह है कि मैं क्या मर्ज, कॉनसैट या ज्वाइन करूं? मैंने कॉनसैट के लिए कई चीजों की कोशिश की है ... आंतरिक, बाहरी आदि। मुझे वह नहीं मिल रहा है जो मैं चाहता हूं। केवल एक चीज जिसके बारे में मैं सोच सकता हूं वह है खाली डेटाफ़्रेम करना और फिर वापस भरना।
संपादित करें: Jezrael की प्रतिक्रिया की कोशिश करने के बाद, यह करीब है लेकिन यह बिल्कुल नहीं है। मुझे जो चाहिए वह सॉर्ट के नेस्टेड कॉलम की तरह है। उदाहरण के लिए
empty_df['Col 1']
>>> empty_df['Col 1']
A B
0 - -
1 - -
2 - -
3 - -
4 - -
या
>>> empty_df['Col 1']['A']
0 -
1 -
2 -
3 -
4 -
Name: A, dtype: object
तो यह एक ऐसा समाधान है जिसे मैं स्तंभों पर पुनरावृति के साथ लेकर आया हूं।
row_idx = A.index.union(B.index)
col_idx = pd.MultiIndex.from_product([A.columns.values,['A','B']])
new_df = pd.DataFrame('-',index=row_idx,columns=col_idx)
for column in A.columns:
new_df.loc[:,(column,'A')] = A[column]
new_df.loc[:,(column,'B')] = B[column]
>>> new_df
Col 1 Col 2 Col 3
A B A B A B
0 A B A B A B
1 A B A B A B
2 A B A B A B
3 A B A B A B
4 A B A B A B
>>> new_df['Col 1']
A B
0 A B
1 A B
2 A B
3 A B
4 A B
>>> new_df['Col 1']['A']
0 A
1 A
2 A
3 A
4 A
Name: A, dtype: object