प्रोग्रामिंग dataframe

10

पायथन पंडों - दो डेटा फ़्रेमों के बीच अंतर ज्ञात करें

मेरे पास दो डेटा फ़्रेम df1 और df2 हैं, जहाँ df2 df1 का सबसेट है। मुझे एक नया डेटा फ़्रेम (df3) कैसे मिलेगा, जो दो डेटा फ़्रेमों के बीच का अंतर है? दूसरे शब्द में, एक डेटा फ्रेम जिसमें df1 में सभी पंक्तियाँ / स्तंभ हैं जो df2 में नहीं …

103 python pandas dataframe

3

पायथन पंडों ने एक कॉलम में NaN को दूसरे कॉलम की संबंधित पंक्ति से मान से प्रतिस्थापित किया

मैं पायथन में इस पंडों डेटाफ्रेम के साथ काम कर रहा हूं। File heat Farheit Temp_Rating 1 YesQ 75 N/A 1 NoR 115 N/A 1 YesA 63 N/A 1 NoT 83 41 1 NoY 100 80 1 YesZ 56 12 2 YesQ 111 N/A 2 NoR 60 N/A 2 YesA …

103 python pandas dataframe nan fillna

4

पांडस डेटाफ्रेम के कॉलम में टेक्स्ट को कैसे बदलें?

मेरे पास इस तरह मेरे डेटाफ़्रेम में एक कॉलम है: range "(2,30)" "(50,290)" "(400,1000)" ... और मैं ,कॉमा को -डैश से बदलना चाहता हूं । मैं वर्तमान में इस पद्धति का उपयोग कर रहा हूं, लेकिन कुछ भी नहीं बदला है। org_info_exc['range'].replace(',', '-', inplace=True) क्या कोई मदद कर सकता है?

102 python replace pandas dataframe

6

Jupyter Python नोटबुक में सभी डेटाफ़्रेम कॉलम प्रदर्शित करें

मैं ज्यूपिटर नोटबुक में डेटाफ़्रेम में सभी कॉलम दिखाना चाहता हूं। बृहस्पति कुछ स्तंभों को दिखाता है और अंतिम कॉलम में डॉट्स जोड़ता है जैसे कि निम्न चित्र में हैं: मैं सभी कॉलम कैसे प्रदर्शित कर सकता हूं?

102 python python-3.x dataframe jupyter-notebook

8

R डेटाफ़्रेम से `Inf` मानों की सफाई

आर में, मेरे पास एक ऑपरेशन है जो Infडेटाफ़्रेम बदलने पर कुछ मान बनाता है । मैं इन Infमूल्यों को चालू करना चाहूंगाNA मूल्यों । मेरे पास बड़े डेटा के लिए कोड धीमा है, क्या ऐसा करने का एक तेज़ तरीका है? कहो कि मेरे पास निम्नलिखित डेटाफ़्रेम हैं: dat …

101 r dataframe data.table

7

पांडस डेटाफ्रैम में एक कॉलम को कैसे शिफ्ट किया जाए

मैं एक पंडों में एक कॉलम को स्थानांतरित करना चाहता हूं DataFrame, लेकिन मैं पूरे डीएफ को फिर से लिखने के बिना प्रलेखन से इसे करने के लिए एक विधि खोजने में सक्षम नहीं हूं। क्या कोई जानता है इसे कैसे करना है? डेटा ढांचा: ## x1 x2 ##0 206 …

101 python pandas dataframe

1

पांडा डेटाफ्रेम के लिए पहली कुछ पंक्तियों को पढ़ने का तरीका

क्या समय के आगे लाइनों की लंबाई को जाने बिना किसी फ़ाइल की read_csvकेवल पहली nपंक्तियों को पढ़ने के लिए उपयोग करने का एक अंतर्निहित तरीका है ? मेरे पास एक बड़ी फ़ाइल है जिसे पढ़ने में लंबा समय लगता है, और कभी-कभी केवल इसका उपयोग करने के लिए पहली, …

100 python pandas csv dataframe

9

पांडा के कई कॉलम लागू करें ()

मेरे पास एक पांडा डेटाफ़्रेम है df_test,। इसमें एक कॉलम 'आकार' होता है जो बाइट्स में आकार का प्रतिनिधित्व करता है। मैंने निम्नलिखित कोड का उपयोग करके KB, MB और GB की गणना की है: df_test = pd.DataFrame([ {'dir': '/Users/uname1', 'size': 994933}, {'dir': '/Users/uname2', 'size': 109338711}, ]) df_test['size_kb'] = df_test['size'].astype(int).apply(lambda …

100 python pandas dataframe apply

2

पंडों के साथ अधिकतम दो या दो से अधिक कॉलम खोजें

मैं कॉलम के साथ एक dataframe है A, B। मुझे Cहर रिकॉर्ड / पंक्ति के लिए एक कॉलम बनाने की जरूरत है : C = max(A, B)। मै यह कैसे कर सकता हूँ?

100 python dataframe pandas

9

पंडों में तालिका के सामने नाम से स्तंभ ले जाएँ

यहाँ मेरा df है: Net Upper Lower Mid Zsore Answer option More than once a day 0% 0.22% -0.12% 2 65 Once a day 0% 0.32% -0.19% 3 45 Several times a week 2% 2.45% 1.10% 4 78 Once a week 1% 1.63% -0.40% 6 65 मैं "Mid"तालिका के सामने …

100 python pandas move dataframe shift

2

अजगर पंडों के साथ बिनिंग कॉलम

मेरे पास संख्यात्मक मानों के साथ डेटा फ़्रेम कॉलम है: df['percentage'].head() 46.5 44.2 100.0 42.12 मैं कॉलम को बिन मायने रखता देखना चाहता हूं: bins = [0, 1, 5, 10, 25, 50, 100] मैं उनके साथ डिब्बे के रूप में परिणाम कैसे प्राप्त कर सकता हूं value counts? [0, 1] …

99 python pandas numpy dataframe binning

5

कैसे एक टाइपफ़ॉर्म कॉलम को स्ट्रिंग टाइप से डबल टाइप में pyspark में बदलें

मेरे पास स्ट्रिंग के रूप में कॉलम के साथ एक डेटाफ्रेम है। मैं स्तंभ प्रकार को PySpark में डबल प्रकार में बदलना चाहता था। निम्नलिखित तरीका है, मैंने किया: toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType()) changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show'])) बस जानना चाहता था, क्या यह सही तरीका है कि लॉजिस्टिक रिग्रेशन से …

99 python apache-spark dataframe pyspark apache-spark-sql

6

पांडा डेटा फ्रेम को श्रृंखला में बदलें

पंडों के लिए मैं कुछ नया हूं। मेरे पास एक पांडा डेटा फ्रेम है जो 23 कॉलमों से 1 पंक्ति है। मैं इसे एक श्रृंखला में बदलना चाहता हूं? मैं सोच रहा हूं कि ऐसा करने का सबसे पैथोनिक तरीका क्या है? मैंने कोशिश की है, pd.Series(myResults)लेकिन यह शिकायत करता …

99 python pandas dataframe series

17

प्रत्येक समूह में अधिकतम मान वाली पंक्ति का चयन कैसे करें

प्रत्येक विषय के लिए कई टिप्पणियों के साथ एक डेटासेट में, मैं प्रत्येक रिकॉर्ड के लिए केवल अधिकतम डेटा मान के साथ एक सबसेट लेना चाहता हूं। उदाहरण के लिए, निम्नलिखित डेटासेट के साथ: ID <- c(1,1,1,2,2,2,2,3,3) Value <- c(2,3,5,2,5,8,17,3,5) Event <- c(1,1,2,1,2,1,2,2,2) group <- data.frame(Subject=ID, pt=Value, Event=Event) विषय 1, …

99 r dataframe r-faq

10

कोई भी मान से Pyspark डेटाफ़ॉर्म कॉलम फ़िल्टर नहीं करें

मैं एक PySpark डेटाफ़्रेम को फ़िल्टर करने का प्रयास कर रहा हूं Noneजिसमें पंक्ति मूल्य है: df.select('dt_mvmt').distinct().collect() [Row(dt_mvmt=u'2016-03-27'), Row(dt_mvmt=u'2016-03-28'), Row(dt_mvmt=u'2016-03-29'), Row(dt_mvmt=None), Row(dt_mvmt=u'2016-03-30'), Row(dt_mvmt=u'2016-03-31')] और मैं एक स्ट्रिंग मान के साथ सही ढंग से फ़िल्टर कर सकता हूं: df[df.dt_mvmt == '2016-03-31'] # some results here लेकिन यह विफल रहता है: df[df.dt_mvmt …

98 python apache-spark dataframe pyspark apache-spark-sql

dataframe पर टैग किए गए जवाब