dataframe पर टैग किए गए जवाब

डेटा फ्रेम एक सारणीबद्ध डेटा संरचना है। आमतौर पर, इसमें डेटा शामिल होता है जहाँ पंक्तियाँ अवलोकित होती हैं और कॉलम विभिन्न प्रकार के चर होते हैं। जबकि "डेटा फ़्रेम" या "डेटाफ़्रेम" शब्द इस अवधारणा के लिए कई भाषाओं में उपयोग किया जाता है (R, Apache Spark, deedle, Maple, Python में पांडा लाइब्रेरी और जूलिया में DataFrames लाइब्रेरी), "तालिका" में प्रयुक्त शब्द है MATLAB और SQL।

10
पायथन पंडों - दो डेटा फ़्रेमों के बीच अंतर ज्ञात करें
मेरे पास दो डेटा फ़्रेम df1 और df2 हैं, जहाँ df2 df1 का सबसेट है। मुझे एक नया डेटा फ़्रेम (df3) कैसे मिलेगा, जो दो डेटा फ़्रेमों के बीच का अंतर है? दूसरे शब्द में, एक डेटा फ्रेम जिसमें df1 में सभी पंक्तियाँ / स्तंभ हैं जो df2 में नहीं …
103 python  pandas  dataframe 

3
पायथन पंडों ने एक कॉलम में NaN को दूसरे कॉलम की संबंधित पंक्ति से मान से प्रतिस्थापित किया
मैं पायथन में इस पंडों डेटाफ्रेम के साथ काम कर रहा हूं। File heat Farheit Temp_Rating 1 YesQ 75 N/A 1 NoR 115 N/A 1 YesA 63 N/A 1 NoT 83 41 1 NoY 100 80 1 YesZ 56 12 2 YesQ 111 N/A 2 NoR 60 N/A 2 YesA …
103 python  pandas  dataframe  nan  fillna 

4
पांडस डेटाफ्रेम के कॉलम में टेक्स्ट को कैसे बदलें?
मेरे पास इस तरह मेरे डेटाफ़्रेम में एक कॉलम है: range "(2,30)" "(50,290)" "(400,1000)" ... और मैं ,कॉमा को -डैश से बदलना चाहता हूं । मैं वर्तमान में इस पद्धति का उपयोग कर रहा हूं, लेकिन कुछ भी नहीं बदला है। org_info_exc['range'].replace(',', '-', inplace=True) क्या कोई मदद कर सकता है?

6
Jupyter Python नोटबुक में सभी डेटाफ़्रेम कॉलम प्रदर्शित करें
मैं ज्यूपिटर नोटबुक में डेटाफ़्रेम में सभी कॉलम दिखाना चाहता हूं। बृहस्पति कुछ स्तंभों को दिखाता है और अंतिम कॉलम में डॉट्स जोड़ता है जैसे कि निम्न चित्र में हैं: मैं सभी कॉलम कैसे प्रदर्शित कर सकता हूं?

8
R डेटाफ़्रेम से `Inf` मानों की सफाई
आर में, मेरे पास एक ऑपरेशन है जो Infडेटाफ़्रेम बदलने पर कुछ मान बनाता है । मैं इन Infमूल्यों को चालू करना चाहूंगाNA मूल्यों । मेरे पास बड़े डेटा के लिए कोड धीमा है, क्या ऐसा करने का एक तेज़ तरीका है? कहो कि मेरे पास निम्नलिखित डेटाफ़्रेम हैं: dat …
101 r  dataframe  data.table 

7
पांडस डेटाफ्रैम में एक कॉलम को कैसे शिफ्ट किया जाए
मैं एक पंडों में एक कॉलम को स्थानांतरित करना चाहता हूं DataFrame, लेकिन मैं पूरे डीएफ को फिर से लिखने के बिना प्रलेखन से इसे करने के लिए एक विधि खोजने में सक्षम नहीं हूं। क्या कोई जानता है इसे कैसे करना है? डेटा ढांचा: ## x1 x2 ##0 206 …
101 python  pandas  dataframe 

1
पांडा डेटाफ्रेम के लिए पहली कुछ पंक्तियों को पढ़ने का तरीका
क्या समय के आगे लाइनों की लंबाई को जाने बिना किसी फ़ाइल की read_csvकेवल पहली nपंक्तियों को पढ़ने के लिए उपयोग करने का एक अंतर्निहित तरीका है ? मेरे पास एक बड़ी फ़ाइल है जिसे पढ़ने में लंबा समय लगता है, और कभी-कभी केवल इसका उपयोग करने के लिए पहली, …
100 python  pandas  csv  dataframe 

9
पांडा के कई कॉलम लागू करें ()
मेरे पास एक पांडा डेटाफ़्रेम है df_test,। इसमें एक कॉलम 'आकार' होता है जो बाइट्स में आकार का प्रतिनिधित्व करता है। मैंने निम्नलिखित कोड का उपयोग करके KB, MB और GB की गणना की है: df_test = pd.DataFrame([ {'dir': '/Users/uname1', 'size': 994933}, {'dir': '/Users/uname2', 'size': 109338711}, ]) df_test['size_kb'] = df_test['size'].astype(int).apply(lambda …



2
अजगर पंडों के साथ बिनिंग कॉलम
मेरे पास संख्यात्मक मानों के साथ डेटा फ़्रेम कॉलम है: df['percentage'].head() 46.5 44.2 100.0 42.12 मैं कॉलम को बिन मायने रखता देखना चाहता हूं: bins = [0, 1, 5, 10, 25, 50, 100] मैं उनके साथ डिब्बे के रूप में परिणाम कैसे प्राप्त कर सकता हूं value counts? [0, 1] …

5
कैसे एक टाइपफ़ॉर्म कॉलम को स्ट्रिंग टाइप से डबल टाइप में pyspark में बदलें
मेरे पास स्ट्रिंग के रूप में कॉलम के साथ एक डेटाफ्रेम है। मैं स्तंभ प्रकार को PySpark में डबल प्रकार में बदलना चाहता था। निम्नलिखित तरीका है, मैंने किया: toDoublefunc = UserDefinedFunction(lambda x: x,DoubleType()) changedTypedf = joindf.withColumn("label",toDoublefunc(joindf['show'])) बस जानना चाहता था, क्या यह सही तरीका है कि लॉजिस्टिक रिग्रेशन से …

6
पांडा डेटा फ्रेम को श्रृंखला में बदलें
पंडों के लिए मैं कुछ नया हूं। मेरे पास एक पांडा डेटा फ्रेम है जो 23 कॉलमों से 1 पंक्ति है। मैं इसे एक श्रृंखला में बदलना चाहता हूं? मैं सोच रहा हूं कि ऐसा करने का सबसे पैथोनिक तरीका क्या है? मैंने कोशिश की है, pd.Series(myResults)लेकिन यह शिकायत करता …

17
प्रत्येक समूह में अधिकतम मान वाली पंक्ति का चयन कैसे करें
प्रत्येक विषय के लिए कई टिप्पणियों के साथ एक डेटासेट में, मैं प्रत्येक रिकॉर्ड के लिए केवल अधिकतम डेटा मान के साथ एक सबसेट लेना चाहता हूं। उदाहरण के लिए, निम्नलिखित डेटासेट के साथ: ID <- c(1,1,1,2,2,2,2,3,3) Value <- c(2,3,5,2,5,8,17,3,5) Event <- c(1,1,2,1,2,1,2,2,2) group <- data.frame(Subject=ID, pt=Value, Event=Event) विषय 1, …
99 r  dataframe  r-faq 

10
कोई भी मान से Pyspark डेटाफ़ॉर्म कॉलम फ़िल्टर नहीं करें
मैं एक PySpark डेटाफ़्रेम को फ़िल्टर करने का प्रयास कर रहा हूं Noneजिसमें पंक्ति मूल्य है: df.select('dt_mvmt').distinct().collect() [Row(dt_mvmt=u'2016-03-27'), Row(dt_mvmt=u'2016-03-28'), Row(dt_mvmt=u'2016-03-29'), Row(dt_mvmt=None), Row(dt_mvmt=u'2016-03-30'), Row(dt_mvmt=u'2016-03-31')] और मैं एक स्ट्रिंग मान के साथ सही ढंग से फ़िल्टर कर सकता हूं: df[df.dt_mvmt == '2016-03-31'] # some results here लेकिन यह विफल रहता है: df[df.dt_mvmt …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.