पांडा डेटाफ़्रेम [डुप्लिकेट] के लिए निरंतर मान के साथ कॉलम जोड़ें

Question 1

एक DataFrame दिया:

np.random.seed(0)
df = pd.DataFrame(np.random.randn(3, 3), columns=list('ABC'), index=[1, 2, 3])
df

          A         B         C
1  1.764052  0.400157  0.978738
2  2.240893  1.867558 -0.977278
3  0.950088 -0.151357 -0.103219

0 जैसे स्थिर मान वाले नए कॉलम को जोड़ने का सबसे सरल तरीका क्या है?

          A         B         C  new
1  1.764052  0.400157  0.978738    0
2  2.240893  1.867558 -0.977278    0
3  0.950088 -0.151357 -0.103219    0

यह मेरा समाधान है, लेकिन मुझे नहीं पता कि यह NaN को 'नए' कॉलम में क्यों डालता है?

df['new'] = pd.Series([0 for x in range(len(df.index))])

          A         B         C  new
1  1.764052  0.400157  0.978738  0.0
2  2.240893  1.867558 -0.977278  0.0
3  0.950088 -0.151357 -0.103219  NaN

Question 2

कारण यह NaNएक स्तंभ में डालता है क्योंकि df.indexऔर Indexआपके दाहिने हाथ की वस्तु अलग हैं। @ ज़ैच शून्य का एक नया कॉलम असाइन करने का उचित तरीका दिखाता है। सामान्य तौर पर, pandasजितना संभव हो उतना सूचकांकों के संरेखण को करने की कोशिश करता है। एक नकारात्मक पक्ष यह है कि जब सूचकांकों को संरेखित नहीं किया जाता है तो आप NaNकहीं भी संरेखित नहीं होते हैं । आंशिक रूप से, पूरी तरह से, और संरेखित-सभी संरेखित ऑब्जेक्ट्स के साथ संरेखण कार्यों के लिए कुछ अंतर्ज्ञान प्राप्त करने के लिए reindexऔर alignतरीकों के साथ चारों ओर खेलें । उदाहरण के लिए यहां DataFrame.align()आंशिक रूप से संरेखित सूचकांकों के साथ कैसे काम किया जाता है:

In [7]: from pandas import DataFrame

In [8]: from numpy.random import randint

In [9]: df = DataFrame({'a': randint(3, size=10)})

In [10]:

In [10]: df
Out[10]:
   a
0  0
1  2
2  0
3  1
4  0
5  0
6  0
7  0
8  0
9  0

In [11]: s = df.a[:5]

In [12]: dfa, sa = df.align(s, axis=0)

In [13]: dfa
Out[13]:
   a
0  0
1  2
2  0
3  1
4  0
5  0
6  0
7  0
8  0
9  0

In [14]: sa
Out[14]:
0     0
1     2
2     0
3     1
4     0
5   NaN
6   NaN
7   NaN
8   NaN
9   NaN
Name: a, dtype: float64

Question 3

सुपर सरल इन-प्लेस असाइनमेंट: `df['new'] = 0`

इन-प्लेस संशोधन के लिए, प्रत्यक्ष असाइनमेंट करें। यह कार्य प्रत्येक पंक्ति के लिए पांडा द्वारा प्रसारित किया जाता है।

df = pd.DataFrame('x', index=range(4), columns=list('ABC'))
df

   A  B  C
0  x  x  x
1  x  x  x
2  x  x  x
3  x  x  x

df['new'] = 'y'
# Same as,
# df.loc[:, 'new'] = 'y'
df

   A  B  C new
0  x  x  x   y
1  x  x  x   y
2  x  x  x   y
3  x  x  x   y

ऑब्जेक्ट कॉलम के लिए ध्यान दें

यदि आप खाली सूचियों का एक कॉलम जोड़ना चाहते हैं, तो यहां मेरी सलाह है:

ऐसा न करने पर विचार करें। objectकॉलम प्रदर्शन के मामले में बुरी खबर हैं। रीथिंक करें कि आपका डेटा कैसे संरचित है।
अपने डेटा को एक विरल डेटा संरचना में संग्रहीत करने पर विचार करें। अधिक जानकारी: विरल डेटा संरचनाएँ
यदि आपको सूचियों का एक स्तंभ संग्रहीत करना होगा, तो सुनिश्चित करें कि एक ही संदर्भ को कई बार कॉपी न करें।
```
# Wrong
df['new'] = [[]] * len(df)
# Right
df['new'] = [[] for _ in range(len(df))]
```

प्रतिलिपि बनाना: `df.assign(new=0)`

यदि आपको इसके बजाय प्रतिलिपि की आवश्यकता है, तो उपयोग करें DataFrame.assign:

df.assign(new='y')

   A  B  C new
0  x  x  x   y
1  x  x  x   y
2  x  x  x   y
3  x  x  x   y

और, यदि आपको एक ही मान के साथ कई ऐसे कॉलम निर्दिष्ट करने की आवश्यकता है, तो यह उतना ही सरल है,

c = ['new1', 'new2', ...]
df.assign(**dict.fromkeys(c, 'y'))

   A  B  C new1 new2
0  x  x  x    y    y
1  x  x  x    y    y
2  x  x  x    y    y
3  x  x  x    y    y

एकाधिक कॉलम असाइनमेंट

अंत में, यदि आपको विभिन्न मानों के साथ कई कॉलम असाइन करने की आवश्यकता है, तो आप assignएक शब्दकोश के साथ उपयोग कर सकते हैं ।

c = {'new1': 'w', 'new2': 'y', 'new3': 'z'}
df.assign(**c)

   A  B  C new1 new2 new3
0  x  x  x    w    y    z
1  x  x  x    w    y    z
2  x  x  x    w    y    z
3  x  x  x    w    y    z

Question 4

आधुनिक पांडा के साथ आप बस कर सकते हैं:

df['new'] = 0

Question 5

यहाँ लैम्बदास का उपयोग करने वाला एक और लाइनर है (निरंतर मान = 10 के साथ कॉलम बनाएं)

df['newCol'] = df.apply(lambda x: 10, axis=1)

इससे पहले

df
    A           B           C
1   1.764052    0.400157    0.978738
2   2.240893    1.867558    -0.977278
3   0.950088    -0.151357   -0.103219

उपरांत

df
        A           B           C           newCol
    1   1.764052    0.400157    0.978738    10
    2   2.240893    1.867558    -0.977278   10
    3   0.950088    -0.151357   -0.103219   10

पांडा डेटाफ़्रेम [डुप्लिकेट] के लिए निरंतर मान के साथ कॉलम जोड़ें

सुपर सरल इन-प्लेस असाइनमेंट: df['new'] = 0

ऑब्जेक्ट कॉलम के लिए ध्यान दें

प्रतिलिपि बनाना: df.assign(new=0)

एकाधिक कॉलम असाइनमेंट

सुपर सरल इन-प्लेस असाइनमेंट: `df['new'] = 0`

प्रतिलिपि बनाना: `df.assign(new=0)`