छोटे डेटा-सेट (<150row)
[''.join(i) for i in zip(df["Year"].map(str),df["quarter"])]
या थोड़ा धीमा लेकिन अधिक कॉम्पैक्ट:
df.Year.str.cat(df.quarter)
बड़ा डेटा सेट (> 150 रु)
df['Year'].astype(str) + df['quarter']
अद्यतन: टाइमिंग ग्राफ पंडों 0.23.4
आइए इसे 200K पंक्तियों DF पर परीक्षण करें:
In [250]: df
Out[250]:
Year quarter
0 2014 q1
1 2015 q2
In [251]: df = pd.concat([df] * 10**5)
In [252]: df.shape
Out[252]: (200000, 2)
अपडेट करें: पंडों 0.19.0 का उपयोग कर नए समय
सीपीयू / जीपीयू अनुकूलन के बिना समय (सबसे तेज से सबसे धीमी गति से हल):
In [107]: %timeit df['Year'].astype(str) + df['quarter']
10 loops, best of 3: 131 ms per loop
In [106]: %timeit df['Year'].map(str) + df['quarter']
10 loops, best of 3: 161 ms per loop
In [108]: %timeit df.Year.str.cat(df.quarter)
10 loops, best of 3: 189 ms per loop
In [109]: %timeit df.loc[:, ['Year','quarter']].astype(str).sum(axis=1)
1 loop, best of 3: 567 ms per loop
In [110]: %timeit df[['Year','quarter']].astype(str).sum(axis=1)
1 loop, best of 3: 584 ms per loop
In [111]: %timeit df[['Year','quarter']].apply(lambda x : '{}{}'.format(x[0],x[1]), axis=1)
1 loop, best of 3: 24.7 s per loop
CPU / GPU अनुकूलन का उपयोग करके समय :
In [113]: %timeit df['Year'].astype(str) + df['quarter']
10 loops, best of 3: 53.3 ms per loop
In [114]: %timeit df['Year'].map(str) + df['quarter']
10 loops, best of 3: 65.5 ms per loop
In [115]: %timeit df.Year.str.cat(df.quarter)
10 loops, best of 3: 79.9 ms per loop
In [116]: %timeit df.loc[:, ['Year','quarter']].astype(str).sum(axis=1)
1 loop, best of 3: 230 ms per loop
In [117]: %timeit df[['Year','quarter']].astype(str).sum(axis=1)
1 loop, best of 3: 230 ms per loop
In [118]: %timeit df[['Year','quarter']].apply(lambda x : '{}{}'.format(x[0],x[1]), axis=1)
1 loop, best of 3: 9.38 s per loop
@ Anton-vbr द्वारा उत्तर योगदान
add(dataframe.iloc[:, 0:10])
उदाहरण के लिए कहते हैं ?