प्रोग्रामिंग pandas

3

पंडों डेटाफ्रेम को पदानुक्रमित शब्दकोश में कैसे परिवर्तित करें

मेरे पास निम्नलिखित पांडा डेटाफ्रेम हैं: df1 = pd.DataFrame({'date': [200101,200101,200101,200101,200102,200102,200102,200102],'blockcount': [1,1,2,2,1,1,2,2],'reactiontime': [350,400,200,250,100,300,450,400]}) मैं एक पदानुक्रमित शब्दकोश बनाने की कोशिश कर रहा हूं, सूचियों के रूप में एम्बेडेड शब्दकोश के मूल्यों के साथ, जो इस तरह दिखता है: {200101: {1:[350, 400], 2:[200, 250]}, 200102: {1:[100, 300], 2:[450, 400]}} यह मैं कैसे …

16 python pandas

4

कुशलता से दो कॉलम पंक्ति-वार सूची की तुलना करना

जब पंडों का डेटाफ़्रेम इस तरह से हो: import pandas as pd import numpy as np df = pd.DataFrame({'today': [['a', 'b', 'c'], ['a', 'b'], ['b']], 'yesterday': [['a', 'b'], ['a'], ['a']]}) today yesterday 0 ['a', 'b', 'c'] ['a', 'b'] 1 ['a', 'b'] ['a'] 2 ['b'] ['a'] ... etc लेकिन लगभग 100 …

16 python pandas numpy dataframe

5

पंक्तियों को अनुक्रमित और सम्मिलित करते समय पंडों के डेटा फ्रेम के जोर से रोकें

मैं पंडों के डेटा फ्रेम की अलग-अलग पंक्तियों के साथ काम कर रहा हूं, लेकिन पंक्तियों को अनुक्रमित और सम्मिलित करते समय मैं ज़बरदस्ती के मुद्दों पर ठोकर खा रहा हूं। लगता है कि पंडों को हमेशा एक मिश्रित इंट / फ्लोट से सभी-फ्लोट प्रकारों के लिए मजबूर करना पड़ता …

16 python pandas coercion

6

सुमी में जल्दी से सममित जोड़े खोजें

from itertools import product import pandas as pd df = pd.DataFrame.from_records(product(range(10), range(10))) df = df.sample(90) df.columns = "c1 c2".split() df = df.sort_values(df.columns.tolist()).reset_index(drop=True) # c1 c2 # 0 0 0 # 1 0 1 # 2 0 2 # 3 0 3 # 4 0 4 # .. .. .. # …

15 python pandas numpy

3

पंडों में दो जियोडेटाफ़्रेम के साथ निकटतम दूरी प्राप्त करें

यहाँ मेरा पहला जियोडेटफ़्रेम है: !pip install geopandas import pandas as pd import geopandas city1 = [{'City':"Buenos Aires","Country":"Argentina","Latitude":-34.58,"Longitude":-58.66}, {'City':"Brasilia","Country":"Brazil","Latitude":-15.78 ,"Longitude":-70.66}, {'City':"Santiago","Country":"Chile ","Latitude":-33.45 ,"Longitude":-70.66 }] city2 = [{'City':"Bogota","Country":"Colombia ","Latitude":4.60 ,"Longitude":-74.08}, {'City':"Caracas","Country":"Venezuela","Latitude":10.48 ,"Longitude":-66.86}] city1df = pd.DataFrame(city1) city2df = pd.DataFrame(city2) gcity1df = geopandas.GeoDataFrame( city1df, geometry=geopandas.points_from_xy(city1df.Longitude, city1df.Latitude)) gcity2df = geopandas.GeoDataFrame( city2df, geometry=geopandas.points_from_xy(city2df.Longitude, city2df.Latitude)) City1 …

14 python pandas dataframe geolocation geopandas

4

पांडा डेटाफ्रेम में समान मूल्यों के प्रतिशत की गणना करें

मेरे पास एक डेटाफ्रेम है df, जिसमें दो कॉलम हैं: स्क्रिप्ट (पाठ के साथ) और स्पीकर Script Speaker aze Speaker 1 art Speaker 2 ghb Speaker 3 jka Speaker 1 tyc Speaker 1 avv Speaker 2 bhj Speaker 1 और मेरे पास निम्न सूची है: L = ['a','b','c'] निम्नलिखित कोड …

14 python python-3.x pandas dataframe

2

कौन से कॉलम डेटाइम हैं

मेरे पास कई स्तंभों के साथ एक बड़ी डेटाफ़्रेम है, जिनमें से कई प्रकार हैं datetime.datetime। समस्या यह है कि कई में मिश्रित प्रकार भी होते हैं, उदाहरण के लिए datetime.datetimeमान और Noneमान (और संभवतः अन्य अमान्य मान): 0 2017-07-06 00:00:00 1 2018-02-27 21:30:05 2 2017-04-12 00:00:00 3 2017-05-21 22:05:00 …

14 python pandas

3

पंडों में [:] बनाम iloc [:] के साथ अलग-अलग परिणाम क्यों दिए गए हैं?

ilocपंडों में अलग-अलग अनुक्रमण विधियों से मैं इतना भ्रमित हूं । मान लीजिए कि मैं 1-डी डेटाफ़्रेम को 2-डी डेटाफ़्रेम में बदलने की कोशिश कर रहा हूं। पहले मेरे पास निम्नलिखित 1-डी डेटाफ्रेम है a_array = [1,2,3,4,5,6,7,8] a_df = pd.DataFrame(a_array).T और मैं उस 2-डी डेटाफ्रेम में आकार के साथ परिवर्तित …

13 python pandas dataframe

1

पंडों के समारोह to_excel एक अप्रत्याशित टाइप-जनरेट उत्पन्न करते हैं

मैंने पांडा डेटाफ्रेम का एक शब्दकोश बनाया: d[k] = pd.DataFrame(data=data[i]) तो मुझे लगता है कि d[k]एक सही पांडा डेटाफ्रेम है। फिर for k in d.keys(): d[k].to_excel (file_name) फिर मेरे पास त्रुटि है: TypeError: got invalid input value of type <class 'xml.etree.ElementTree.Element'>, expected string or Element मैं पायथन 3.7, पांडा 0.25.3 …

13 python pandas export-to-excel

3

धीरे पांडा डेटाफ़्रेम मल्टीआईंडेक्स रिइंडेक्स

मेरे पास पंडों का फॉर्म का डाटाफ्रेम है: id start_time sequence_no value 0 71 2018-10-17 20:12:43+00:00 114428 3 1 71 2018-10-17 20:12:43+00:00 114429 3 2 71 2018-10-17 20:12:43+00:00 114431 79 3 71 2019-11-06 00:51:14+00:00 216009 100 4 71 2019-11-06 00:51:14+00:00 216011 150 5 71 2019-11-06 00:51:14+00:00 216013 180 6 92 …

13 python pandas numpy dataframe

7

गुण: 'DataFrame' ऑब्जेक्ट में कोई विशेषता नहीं है 'ix'

जब मैं किसी स्तंभ, जैसे df.ix [:, 'col_header'] को खींचने के लिए एक पांडा डेटाफ्रेम की .ix विशेषता का उपयोग करने का प्रयास करता हूं, तो मुझे उपरोक्त त्रुटि मिल रही है। पटकथा ने आज सुबह तक काम किया, लेकिन आज दोपहर मैंने पंडों की एक नई स्थापना के साथ …

13 python pandas dataframe

2

फ़िल्टर किए गए बाइनरी कार्टेशियन उत्पादों को उत्पन्न करें

समस्या का विवरण मैं पूर्ण द्विआधारी कार्टेशियन उत्पादों (कुछ निश्चित स्तंभों के साथ ट्रू और फाल्स के सभी संयोजनों के साथ तालिकाओं) को उत्पन्न करने के लिए एक कुशल तरीके की तलाश कर रहा हूं, जो कुछ विशेष स्थितियों द्वारा फ़िल्टर किए गए हैं। उदाहरण के लिए, तीन कॉलम / …

12 python pandas dataframe

1

पांडासुडीएफ और पायरो 0.15.0

मैंने हाल ही में pysparkEMR क्लस्टर्स पर कई नौकरियों में त्रुटियों का एक समूह शुरू किया है । इरोस हैं java.lang.IllegalArgumentException at java.nio.ByteBuffer.allocate(ByteBuffer.java:334) at org.apache.arrow.vector.ipc.message.MessageSerializer.readMessage(MessageSerializer.java:543) at org.apache.arrow.vector.ipc.message.MessageChannelReader.readNext(MessageChannelReader.java:58) at org.apache.arrow.vector.ipc.ArrowStreamReader.readSchema(ArrowStreamReader.java:132) at org.apache.arrow.vector.ipc.ArrowReader.initialize(ArrowReader.java:181) at org.apache.arrow.vector.ipc.ArrowReader.ensureInitialized(ArrowReader.java:172) at org.apache.arrow.vector.ipc.ArrowReader.getVectorSchemaRoot(ArrowReader.java:65) at org.apache.spark.sql.execution.python.ArrowPythonRunner$$anon$1.read(ArrowPythonRunner.scala:162) at org.apache.spark.sql.execution.python.ArrowPythonRunner$$anon$1.read(ArrowPythonRunner.scala:122) at org.apache.spark.api.python.BasePythonRunner$ReaderIterator.hasNext(PythonRunner.scala:406) at org.apache.spark.InterruptibleIterator.hasNext(InterruptibleIterator.scala:37) at org.apache.spark.sql.execution.python.ArrowEvalPythonExec$$anon$2.<init>(ArrowEvalPythonExec.scala:98) at org.apache.spark.sql.execution.python.ArrowEvalPythonExec.evaluate(ArrowEvalPythonExec.scala:96) at org.apache.spark.sql.execution.python.EvalPythonExec$$anonfun$doExecute$1.apply(EvalPythonExec.scala:127)... वे …

12 pandas apache-spark pyspark pyarrow

5

पांडा डेटाफ़्रेम में नए कॉलम में सूची में मिली आईडी जोड़ें

मान लें कि मेरे पास निम्नलिखित डेटाफ़्रेम (पूर्णांक का एक स्तंभ और पूर्णांक की सूची वाला एक स्तंभ) है ... ID Found_IDs 0 12345 [15443, 15533, 3433] 1 15533 [2234, 16608, 12002, 7654] 2 6789 [43322, 876544, 36789] और आईडी की एक अलग सूची भी ... bad_ids = [15533, 876544, …

11 python python-3.x pandas dataframe

9

एक कॉलम पांडा से एक NxN मैट्रिक्स बनाएं

मेरे पास सूची मूल्य वाले प्रत्येक पंक्ति के साथ डेटाफ्रेम है। id list_of_value 0 ['a','b','c'] 1 ['d','b','c'] 2 ['a','b','c'] 3 ['a','b','c'] मुझे एक पंक्ति के साथ एक स्कोर की गणना करनी है और अन्य सभी पंक्तियों के खिलाफ है उदाहरण के लिए: Step 1: Take value of id 0: ['a','b','c'], …

11 python pandas numpy

pandas पर टैग किए गए जवाब