pandas पर टैग किए गए जवाब

पंडों डेटा हेरफेर और विश्लेषण के लिए एक पायथन लाइब्रेरी है, उदाहरण के लिए डेटाफ्रेम, बहुआयामी समय श्रृंखला और क्रॉस-अनुभागीय डेटासेट आमतौर पर सांख्यिकी, प्रयोगात्मक विज्ञान परिणाम, अर्थमिति, या वित्त में पाए जाते हैं। पंडों पायथन में मुख्य डेटा विज्ञान पुस्तकालयों में से एक है।

3
पंडों डेटाफ्रेम को पदानुक्रमित शब्दकोश में कैसे परिवर्तित करें
मेरे पास निम्नलिखित पांडा डेटाफ्रेम हैं: df1 = pd.DataFrame({'date': [200101,200101,200101,200101,200102,200102,200102,200102],'blockcount': [1,1,2,2,1,1,2,2],'reactiontime': [350,400,200,250,100,300,450,400]}) मैं एक पदानुक्रमित शब्दकोश बनाने की कोशिश कर रहा हूं, सूचियों के रूप में एम्बेडेड शब्दकोश के मूल्यों के साथ, जो इस तरह दिखता है: {200101: {1:[350, 400], 2:[200, 250]}, 200102: {1:[100, 300], 2:[450, 400]}} यह मैं कैसे …
16 python  pandas 

4
कुशलता से दो कॉलम पंक्ति-वार सूची की तुलना करना
जब पंडों का डेटाफ़्रेम इस तरह से हो: import pandas as pd import numpy as np df = pd.DataFrame({'today': [['a', 'b', 'c'], ['a', 'b'], ['b']], 'yesterday': [['a', 'b'], ['a'], ['a']]}) today yesterday 0 ['a', 'b', 'c'] ['a', 'b'] 1 ['a', 'b'] ['a'] 2 ['b'] ['a'] ... etc लेकिन लगभग 100 …

5
पंक्तियों को अनुक्रमित और सम्मिलित करते समय पंडों के डेटा फ्रेम के जोर से रोकें
मैं पंडों के डेटा फ्रेम की अलग-अलग पंक्तियों के साथ काम कर रहा हूं, लेकिन पंक्तियों को अनुक्रमित और सम्मिलित करते समय मैं ज़बरदस्ती के मुद्दों पर ठोकर खा रहा हूं। लगता है कि पंडों को हमेशा एक मिश्रित इंट / फ्लोट से सभी-फ्लोट प्रकारों के लिए मजबूर करना पड़ता …


3
पंडों में दो जियोडेटाफ़्रेम के साथ निकटतम दूरी प्राप्त करें
यहाँ मेरा पहला जियोडेटफ़्रेम है: !pip install geopandas import pandas as pd import geopandas city1 = [{'City':"Buenos Aires","Country":"Argentina","Latitude":-34.58,"Longitude":-58.66}, {'City':"Brasilia","Country":"Brazil","Latitude":-15.78 ,"Longitude":-70.66}, {'City':"Santiago","Country":"Chile ","Latitude":-33.45 ,"Longitude":-70.66 }] city2 = [{'City':"Bogota","Country":"Colombia ","Latitude":4.60 ,"Longitude":-74.08}, {'City':"Caracas","Country":"Venezuela","Latitude":10.48 ,"Longitude":-66.86}] city1df = pd.DataFrame(city1) city2df = pd.DataFrame(city2) gcity1df = geopandas.GeoDataFrame( city1df, geometry=geopandas.points_from_xy(city1df.Longitude, city1df.Latitude)) gcity2df = geopandas.GeoDataFrame( city2df, geometry=geopandas.points_from_xy(city2df.Longitude, city2df.Latitude)) City1 …

4
पांडा डेटाफ्रेम में समान मूल्यों के प्रतिशत की गणना करें
मेरे पास एक डेटाफ्रेम है df, जिसमें दो कॉलम हैं: स्क्रिप्ट (पाठ के साथ) और स्पीकर Script Speaker aze Speaker 1 art Speaker 2 ghb Speaker 3 jka Speaker 1 tyc Speaker 1 avv Speaker 2 bhj Speaker 1 और मेरे पास निम्न सूची है: L = ['a','b','c'] निम्नलिखित कोड …

2
कौन से कॉलम डेटाइम हैं
मेरे पास कई स्तंभों के साथ एक बड़ी डेटाफ़्रेम है, जिनमें से कई प्रकार हैं datetime.datetime। समस्या यह है कि कई में मिश्रित प्रकार भी होते हैं, उदाहरण के लिए datetime.datetimeमान और Noneमान (और संभवतः अन्य अमान्य मान): 0 2017-07-06 00:00:00 1 2018-02-27 21:30:05 2 2017-04-12 00:00:00 3 2017-05-21 22:05:00 …
14 python  pandas 

3
पंडों में [:] बनाम iloc [:] के साथ अलग-अलग परिणाम क्यों दिए गए हैं?
ilocपंडों में अलग-अलग अनुक्रमण विधियों से मैं इतना भ्रमित हूं । मान लीजिए कि मैं 1-डी डेटाफ़्रेम को 2-डी डेटाफ़्रेम में बदलने की कोशिश कर रहा हूं। पहले मेरे पास निम्नलिखित 1-डी डेटाफ्रेम है a_array = [1,2,3,4,5,6,7,8] a_df = pd.DataFrame(a_array).T और मैं उस 2-डी डेटाफ्रेम में आकार के साथ परिवर्तित …

1
पंडों के समारोह to_excel एक अप्रत्याशित टाइप-जनरेट उत्पन्न करते हैं
मैंने पांडा डेटाफ्रेम का एक शब्दकोश बनाया: d[k] = pd.DataFrame(data=data[i]) तो मुझे लगता है कि d[k]एक सही पांडा डेटाफ्रेम है। फिर for k in d.keys(): d[k].to_excel (file_name) फिर मेरे पास त्रुटि है: TypeError: got invalid input value of type <class 'xml.etree.ElementTree.Element'>, expected string or Element मैं पायथन 3.7, पांडा 0.25.3 …

3
धीरे पांडा डेटाफ़्रेम मल्टीआईंडेक्स रिइंडेक्स
मेरे पास पंडों का फॉर्म का डाटाफ्रेम है: id start_time sequence_no value 0 71 2018-10-17 20:12:43+00:00 114428 3 1 71 2018-10-17 20:12:43+00:00 114429 3 2 71 2018-10-17 20:12:43+00:00 114431 79 3 71 2019-11-06 00:51:14+00:00 216009 100 4 71 2019-11-06 00:51:14+00:00 216011 150 5 71 2019-11-06 00:51:14+00:00 216013 180 6 92 …

7
गुण: 'DataFrame' ऑब्जेक्ट में कोई विशेषता नहीं है 'ix'
जब मैं किसी स्तंभ, जैसे df.ix [:, 'col_header'] को खींचने के लिए एक पांडा डेटाफ्रेम की .ix विशेषता का उपयोग करने का प्रयास करता हूं, तो मुझे उपरोक्त त्रुटि मिल रही है। पटकथा ने आज सुबह तक काम किया, लेकिन आज दोपहर मैंने पंडों की एक नई स्थापना के साथ …

2
फ़िल्टर किए गए बाइनरी कार्टेशियन उत्पादों को उत्पन्न करें
समस्या का विवरण मैं पूर्ण द्विआधारी कार्टेशियन उत्पादों (कुछ निश्चित स्तंभों के साथ ट्रू और फाल्स के सभी संयोजनों के साथ तालिकाओं) को उत्पन्न करने के लिए एक कुशल तरीके की तलाश कर रहा हूं, जो कुछ विशेष स्थितियों द्वारा फ़िल्टर किए गए हैं। उदाहरण के लिए, तीन कॉलम / …

1
पांडासुडीएफ और पायरो 0.15.0
मैंने हाल ही में pysparkEMR क्लस्टर्स पर कई नौकरियों में त्रुटियों का एक समूह शुरू किया है । इरोस हैं java.lang.IllegalArgumentException at java.nio.ByteBuffer.allocate(ByteBuffer.java:334) at org.apache.arrow.vector.ipc.message.MessageSerializer.readMessage(MessageSerializer.java:543) at org.apache.arrow.vector.ipc.message.MessageChannelReader.readNext(MessageChannelReader.java:58) at org.apache.arrow.vector.ipc.ArrowStreamReader.readSchema(ArrowStreamReader.java:132) at org.apache.arrow.vector.ipc.ArrowReader.initialize(ArrowReader.java:181) at org.apache.arrow.vector.ipc.ArrowReader.ensureInitialized(ArrowReader.java:172) at org.apache.arrow.vector.ipc.ArrowReader.getVectorSchemaRoot(ArrowReader.java:65) at org.apache.spark.sql.execution.python.ArrowPythonRunner$$anon$1.read(ArrowPythonRunner.scala:162) at org.apache.spark.sql.execution.python.ArrowPythonRunner$$anon$1.read(ArrowPythonRunner.scala:122) at org.apache.spark.api.python.BasePythonRunner$ReaderIterator.hasNext(PythonRunner.scala:406) at org.apache.spark.InterruptibleIterator.hasNext(InterruptibleIterator.scala:37) at org.apache.spark.sql.execution.python.ArrowEvalPythonExec$$anon$2.<init>(ArrowEvalPythonExec.scala:98) at org.apache.spark.sql.execution.python.ArrowEvalPythonExec.evaluate(ArrowEvalPythonExec.scala:96) at org.apache.spark.sql.execution.python.EvalPythonExec$$anonfun$doExecute$1.apply(EvalPythonExec.scala:127)... वे …

5
पांडा डेटाफ़्रेम में नए कॉलम में सूची में मिली आईडी जोड़ें
मान लें कि मेरे पास निम्नलिखित डेटाफ़्रेम (पूर्णांक का एक स्तंभ और पूर्णांक की सूची वाला एक स्तंभ) है ... ID Found_IDs 0 12345 [15443, 15533, 3433] 1 15533 [2234, 16608, 12002, 7654] 2 6789 [43322, 876544, 36789] और आईडी की एक अलग सूची भी ... bad_ids = [15533, 876544, …

9
एक कॉलम पांडा से एक NxN मैट्रिक्स बनाएं
मेरे पास सूची मूल्य वाले प्रत्येक पंक्ति के साथ डेटाफ्रेम है। id list_of_value 0 ['a','b','c'] 1 ['d','b','c'] 2 ['a','b','c'] 3 ['a','b','c'] मुझे एक पंक्ति के साथ एक स्कोर की गणना करनी है और अन्य सभी पंक्तियों के खिलाफ है उदाहरण के लिए: Step 1: Take value of id 0: ['a','b','c'], …
11 python  pandas  numpy 

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.