पायथन - डेटा फ़्रेम का आयाम


85

पायथन के लिए नया।

आर में, आप मंद (...) का उपयोग करके मैट्रिक्स का आयाम प्राप्त कर सकते हैं। पायथन पंडों में उनके डेटा फ्रेम के लिए संबंधित फ़ंक्शन क्या है?


2
DataFrames और Series के आयाम जानकारी प्राप्त करने के सभी तरीकों के विस्तृत सारांश के लिए नीचे यह उत्तर देखें
Ted Petrou

जवाबों:



24

DataFrame या Series के आयामों की जानकारी प्राप्त करने के सभी तरीकों का सारांश

आपके DataFrame या Series की विशेषताओं के बारे में जानकारी प्राप्त करने के कई तरीके हैं।

नमूना DataFrame और श्रृंखला बनाएँ

df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]})
df

     a  b
0  5.0  9
1  2.0  2
2  NaN  4

s = df['a']
s

0    5.0
1    2.0
2    NaN
Name: a, dtype: float64

shape गुण

shapeविशेषता पंक्तियों की संख्या और DataFrame में स्तंभों की संख्या के दो आइटम टपल देता है। एक श्रृंखला के लिए, यह एक-आइटम टपल लौटाता है।

df.shape
(3, 2)

s.shape
(3,)

len समारोह

किसी DataFrame की पंक्तियों की संख्या प्राप्त करने या किसी श्रृंखला की लंबाई प्राप्त करने के लिए, lenफ़ंक्शन का उपयोग करें । एक पूर्णांक वापस कर दिया जाएगा।

len(df)
3

len(s)
3

size गुण

डेटाफ्रेम या श्रृंखला में तत्वों की कुल संख्या प्राप्त करने के लिए, sizeविशेषता का उपयोग करें । DataFrames के लिए, यह पंक्तियों की संख्या और स्तंभों की संख्या का उत्पाद है। एक श्रृंखला के लिए, यह lenफ़ंक्शन के बराबर होगा :

df.size
6

s.size
3

ndim गुण

यह ndimविशेषता आपके डेटाफ़्रेम या श्रृंखला के आयामों की संख्या लौटाती है। यह DataFrames के लिए हमेशा 2 और श्रृंखला के लिए 1 होगा:

df.ndim
2

s.ndim
1

मुश्किल countविधि

countविधि DataFrame के प्रत्येक स्तंभ / पंक्ति के लिए गैर लापता मूल्यों की संख्या वापस जाने के लिए इस्तेमाल किया जा सकता। यह बहुत भ्रामक हो सकता है, क्योंकि ज्यादातर लोग आमतौर पर प्रत्येक पंक्ति की लंबाई के रूप में गिनती के बारे में सोचते हैं, जो यह नहीं है। जब एक DataFrame पर कॉल किया जाता है, तो एक श्रृंखला सूचकांक में कॉलम नामों और मानों के रूप में गैर-लापता मूल्यों की संख्या के साथ वापस आ जाती है।

df.count() # by default, get the count of each column

a    2
b    3
dtype: int64


df.count(axis='columns') # change direction to get count of each row

0    2
1    2
2    1
dtype: int64

एक श्रृंखला के लिए, गणना के लिए केवल एक अक्ष है और इसलिए यह सिर्फ एक स्केलर लौटाता है:

s.count()
2

infoमेटाडेटा पुनर्प्राप्त करने के लिए विधि का उपयोग करें

infoविधि प्रत्येक स्तंभ के गैर लापता मूल्यों और डेटा प्रकार की संख्या देता है

df.info ()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
a    2 non-null float64
b    3 non-null int64
dtypes: float64(1), int64(1)
memory usage: 128.0 bytes
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.