pandas पर टैग किए गए जवाब

पंडों डेटा हेरफेर और विश्लेषण के लिए एक पायथन लाइब्रेरी है, उदाहरण के लिए डेटाफ्रेम, बहुआयामी समय श्रृंखला और क्रॉस-अनुभागीय डेटासेट आमतौर पर सांख्यिकी, प्रयोगात्मक विज्ञान परिणाम, अर्थमिति, या वित्त में पाए जाते हैं। पंडों पायथन में मुख्य डेटा विज्ञान पुस्तकालयों में से एक है।

8
एक बड़े पांडा डेटाफ्रेम को विभाजित करें
मेरे पास 423244 लाइनों के साथ एक बड़ी डेटाफ्रेम है। मैं इसे 4 में विभाजित करना चाहता हूं। मैंने निम्नलिखित कोड की कोशिश की जिसमें त्रुटि हुई?ValueError: array split does not result in an equal division for item in np.split(df, 4): print item इस डेटाफ्रेम को 4 समूहों में कैसे …
86 python  pandas 

3
दो पांडा डेटा फ्रेम्स को मिलाएं (एक सामान्य कॉलम पर जुड़ें)
मेरे पास 2 डेटाफ्रेम हैं: restaurant_ids_dataframe Data columns (total 13 columns): business_id 4503 non-null values categories 4503 non-null values city 4503 non-null values full_address 4503 non-null values latitude 4503 non-null values longitude 4503 non-null values name 4503 non-null values neighborhoods 4503 non-null values open 4503 non-null values review_count 4503 non-null …

6
पंडों: श्रेणियों को संख्याओं में परिवर्तित करें
मान लीजिए कि मेरा उन देशों के साथ डेटाफ़्रेम है जो इस प्रकार है: cc | temp US | 37.0 CA | 12.0 US | 35.0 AU | 20.0 मुझे पता है कि देशों को 'वन-हॉट एन्कोडिंग' में बदलने के लिए एक pd.get_dummies फ़ंक्शन है। हालांकि, मैं उन्हें इसके बजाय …

6
पांडा: डेटाफ़्रेम की पंक्तियों पर जटिल फ़िल्टर
मैं प्रत्येक पंक्ति के एक फ़ंक्शन द्वारा पंक्तियों को फ़िल्टर करना चाहूंगा, जैसे def f(row): return sin(row['velocity'])/np.prod(['masses']) > 5 df = pandas.DataFrame(...) filtered = df[apply_to_all_rows(df, f)] या एक और अधिक जटिल, आकस्मिक उदाहरण के लिए, def g(row): if row['col1'].method1() == 1: val = row['col1'].method2() / row['col1'].method3(row['col3'], row['col4']) else: val = …
85 python  pandas 

3
कैसे एक पांडा / matplotlib बार ग्राफ कस्टम रंग देने के लिए
मैंने बस स्टैक्ड बार चार्ट बनाने के लिए एक्सेल के प्रतिस्थापन के रूप में पंडों / मेटप्लोटलिब का उपयोग करना शुरू किया। मैं एक मुद्दे में भाग रहा हूं (1) डिफ़ॉल्ट कॉलोर्माॅप में केवल 5 रंग हैं, इसलिए यदि मेरे पास 5 से अधिक श्रेणियां हैं तो रंग दोहराते हैं। …

8
पंडों: समय अंतराल से रोलिंग का मतलब है
मैं पंडों के लिए नया हूं .... मुझे मतदान डेटा का एक गुच्छा मिला है; मैं तीन दिन की खिड़की के आधार पर प्रत्येक दिन के लिए एक अनुमान प्राप्त करने के लिए एक रोलिंग माध्य की गणना करना चाहता हूं। जैसा कि मैंने इस प्रश्न से समझा , रोलिंग_ …

2
Seaborn lmplot facetgrid में कुछ xlim और ylim कैसे सेट करें
मैं सीरमॉर्न के lmplot का उपयोग एक रेखीय प्रतिगमन की साजिश रचने के लिए कर रहा हूं, अपने डेटासेट को दो समूहों में एक श्रेणीगत चर के साथ विभाजित कर रहा हूं। एक्स और वाई दोनों के लिए, मैं दोनों भूखंडों पर मैन्युअल रूप से निचली बाउंड सेट करना चाहता …
85 python  pandas  seaborn 

6
पंडों में मर्ज () और कंकट () के बीच अंतर
के बीच आवश्यक अंतर (रों) क्या है pd.DataFrame.merge()और pd.concat()? अब तक, यह वही है जो मैंने पाया है, कृपया मेरी समझ कितनी पूर्ण और सटीक है, इस पर टिप्पणी करें: .merge()केवल कॉलम (प्लस रो-इंडिस) का उपयोग कर सकते हैं और यह डेटाबेस-शैली के संचालन के लिए शब्दार्थ है। .concat()या तो …
85 python  pandas  join  merge  concat 

3
दो घंटे और मिनटों में दो स्तंभों के बीच पंडों डेटाफ़्रेम समय अंतर की गणना करें
मेरे पास दो कॉलम हैं, fromdateऔर todate, एक डेटाफ्रेम में। import pandas as pd data = {'todate': [pd.Timestamp('2014-01-24 13:03:12.050000'), pd.Timestamp('2014-01-27 11:57:18.240000'), pd.Timestamp('2014-01-23 10:07:47.660000')], 'fromdate': [pd.Timestamp('2014-01-26 23:41:21.870000'), pd.Timestamp('2014-01-27 15:38:22.540000'), pd.Timestamp('2014-01-23 18:50:41.420000')]} df = pd.DataFrame(data) मैं एक नया कॉलम जोड़ता हूं, diffजिसका उपयोग करके दो तिथियों के बीच अंतर पता लगाना है …

9
अगर यह लापता मान है तो एक पांडा डेटाफ्रेम स्ट्रिंग कॉलम को कैसे कम किया जाए?
निम्नलिखित कोड काम नहीं करता है। import pandas as pd import numpy as np df=pd.DataFrame(['ONE','Two', np.nan],columns=['x']) xLower = df["x"].map(lambda x: x.lower()) XLower = ['one', 'two', np.nan] पाने के लिए मुझे इसे कैसे ट्वीक करना चाहिए? दक्षता महत्वपूर्ण है क्योंकि वास्तविक डेटा फ़्रेम विशाल है।

5
पंडों के डेटा फ्रेम में स्तंभ के रूप में संख्यात्मक सरणी जोड़ें
मेरे पास आकार (एक्स, वाई) आकार की एक पंडस डेटा फ़्रेम ऑब्जेक्ट है जो इस तरह दिखता है: [[1, 2, 3], [4, 5, 6], [7, 8, 9]] और आकार का एक खस्ता विरल मैट्रिक्स (CSC) (X, Z) ऐसा कुछ दिखता है [[0, 1, 0], [0, 0, 1], [1, 0, 0]] …
85 python  numpy  pandas 

2
एक पांडा को बचाने के लिए। फ़ाइल के लिए हिस्टोग्राम साजिश
Ipython नोटबुक में, पहले एक पांडा श्रृंखला ऑब्जेक्ट बनाएं, फिर इंस्टेंस विधि .hist () कॉल करके, ब्राउज़र आंकड़ा प्रदर्शित करता है। मैं सोच रहा हूं कि इस आकृति को किसी फ़ाइल में कैसे सहेजा जाए (मेरा मतलब राइट क्लिक से नहीं और जैसा है, लेकिन स्क्रिप्ट में आवश्यक कमांड है)।

2
पायथन - डेटा फ़्रेम का आयाम
पायथन के लिए नया। आर में, आप मंद (...) का उपयोग करके मैट्रिक्स का आयाम प्राप्त कर सकते हैं। पायथन पंडों में उनके डेटा फ्रेम के लिए संबंधित फ़ंक्शन क्या है?
85 python  pandas 

7
2 डेटाफ्रेम को मर्ज करने की कोशिश कर रहा है, लेकिन ValueError प्राप्त करें
ये दो चर में सहेजे गए मेरे दो डेटाफ्रेम हैं: > print(df.head()) > club_name tr_jan tr_dec year 0 ADO Den Haag 1368 1422 2010 1 ADO Den Haag 1455 1477 2011 2 ADO Den Haag 1461 1443 2012 3 ADO Den Haag 1437 1383 2013 4 ADO Den Haag 1386 …

2
एक पांडस डेटाफ्रेम ऑब्जेक्ट में सूचकांक को फिर से परिभाषित करना
मैं एक पांडा DataFrameवस्तु को फिर से अनुक्रमित करने की कोशिश कर रहा हूं , जैसे, From: a b c 0 1 2 3 1 10 11 12 2 20 21 22 To : b c 1 2 3 10 11 12 20 21 22 मैं इस बारे में जा …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.