pandas पर टैग किए गए जवाब

पंडों डेटा हेरफेर और विश्लेषण के लिए एक पायथन लाइब्रेरी है, उदाहरण के लिए डेटाफ्रेम, बहुआयामी समय श्रृंखला और क्रॉस-अनुभागीय डेटासेट आमतौर पर सांख्यिकी, प्रयोगात्मक विज्ञान परिणाम, अर्थमिति, या वित्त में पाए जाते हैं। पंडों पायथन में मुख्य डेटा विज्ञान पुस्तकालयों में से एक है।

1
पायथन से उत्पन्न गतिशील लूप से शून्य मान कैसे छोड़ें?
मेरे पास इस तरह एक डेटा-फ्रेम है: ORDER_NO 2401 2504 2600 2020020 2019-12-04 2019-12-10 2019-12-12 2020024 2019-12-25 NaN 2019-12-20 2020034 NaN NaN 2019-12-20 2020020 2019-12-12 2019-12-15 2019-12-18 मैं उपरोक्त डेटा-फ्रेम से XML बना रहा हूं। मैं XML में पॉपुलर हो रहे null वैल्यू को हटाना चाहता हूं। मेरा कोड XML …

3
पांडा एक कॉलम में मानों की स्थिति के आधार पर कई कॉलमों में मानों को अधिलेखित कर देते हैं
मेरे पास ऐसे डेटाफ़्रेम हैं: df = pd.DataFrame(data={ 'col0': [11, 22,1, 5] 'col1': ['aa:a:aaa', 'a:a', 'a', 'a:aa:a:aaa'], 'col2': ["foo", "foo", "foobar", "bar"], 'col3': [True, False, True, False], 'col4': ['elo', 'foo', 'bar', 'dupa']}) मैं col1 में ":" पर विभाजित होने के बाद सूची की लंबाई प्राप्त करना चाहता हूं, फिर मैं …
11 python  pandas  apply 

2
मैं कैपेस को अलग कॉलम में स्थानांतरित करने के लिए रेगेक्स के साथ कॉलम कैसे विभाजित कर सकता हूं?
मैं regex का उपयोग करके एक कॉलम को विभाजित करने की कोशिश कर रहा हूं, लेकिन विभाजन को सही ढंग से प्राप्त करने के लिए प्रतीत नहीं हो सकता है। मैं सभी अनुगामी CAPS लेने और उन्हें एक अलग कॉलम में स्थानांतरित करने का प्रयास कर रहा हूं। इसलिए मुझे …
11 python  regex  pandas 

7
डेटाफ़्रेम में बार-बार "कुंजी = मान" जोड़े की फ़ाइल पढ़ें
मेरे पास इस प्रारूप में डेटा के साथ एक txt फ़ाइल है। पहली 3 पंक्तियाँ बार-बार दोहराती हैं। name=1 grade=A class=B name=2 grade=D class=A मैं उदाहरण के लिए, तालिका प्रारूप में डेटा को आउटपुट करना चाहूंगा: name | grade | class 1 | A | B 2 | D | …


4
डेटाफ़्रेम को उन समूहों पर फ़िल्टर करना जहां तत्व की गिनती 1 से भिन्न है
मैं निम्नलिखित संरचना वाले DataFrame के साथ काम कर रहा हूं: import pandas as pd df = pd.DataFrame({'group':[1,1,1,2,2,2,2,3,3,3], 'brand':['A','B','X','C','D','X','X','E','F','X']}) print(df) group brand 0 1 A 1 1 B 2 1 X 3 2 C 4 2 D 5 2 X 6 2 X 7 3 E 8 3 F 9 …

2
पंडों: स्थानीय मिनीमा-मैक्सिमा पर आधारित डेटा का ज़िगज़ैग विभाजन
मेरे पास टाइमसीज़ डेटा है। डेटा जनरेट करना date_rng = pd.date_range('2019-01-01', freq='s', periods=400) df = pd.DataFrame(np.random.lognormal(.005, .5,size=(len(date_rng), 3)), columns=['data1', 'data2', 'data3'], index= date_rng) s = df['data1'] मैं स्थानीय मैक्सिमा और स्थानीय मिनीमा के बीच जुड़ने वाली एक ज़िग-ज़ैग लाइन बनाना चाहता हूँ, जो इस शर्त को संतुष्ट करती है कि …

3
कई श्रेणीगत कॉलमों को परिवर्तित करें
मेरे डेटासेट में मेरे पास दो श्रेणीबद्ध कॉलम हैं, जिन्हें मैं संक्षिप्त करना चाहूंगा। दोनों स्तंभों में दोनों देश हैं, कुछ ओवरलैप (दोनों कॉलम में दिखाई देते हैं)। मैं उसी देश के लिए कॉलम 1 और कॉलम 2 में समान संख्या देना चाहूंगा। मेरा डेटा कुछ इस तरह दिखता है: …

1
पांडा में एक ही स्थिति के साथ कई स्तंभों की जांच करने का बेहतर तरीका?
मुझे आउटपुट मिला लेकिन ऐसा करने के लिए अधिक कुशल तरीका खोजने की कोशिश कर रहा हूं: (df['budget'] == 0).sum(), (df['revenue'] == 0).sum(),(df['budget_adj'] == 0).sum(), (df['revenue_adj'] == 0).sum() आउटपुट है (5674, 5993, 5676, 5993)
9 python  pandas 

3
पंडों को पायथन फंक्शन लागू करना डेटाफ़्रेम को समूहीकृत करना - संगणना को गति देने के लिए सबसे कुशल दृष्टिकोण क्या है?
मैं काफी बड़े पंडों के डेटाफ़्रेम के साथ काम कर रहा हूँ - मेरा डेटासेट निम्नलिखित dfसेटअप जैसा दिखता है : import pandas as pd import numpy as np #--------------------------------------------- SIZING PARAMETERS : R1 = 20 # .repeat( repeats = R1 ) R2 = 10 # .repeat( repeats = R2 …

3
पंडों के डेटाफ्रेम से एक कॉलम का केवल हिस्सा अनमेल करें
मेरे पास निम्न उदाहरण है डेटाफ्रेम: df = pd.DataFrame(data = {'RecordID' : [1,1,1,1,1,2,2,2,2,3,3,3,3,4,4,4,4,5,5,5,5], 'DisplayLabel' : ['Source','Test','Value 1','Value 2','Value3','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value 2','Source','Test','Value 1','Value 2'], 'Value' : ['Web','Logic','S','I','Complete','Person','Voice','>20','P','Mail','OCR','A','I','Dictation','Understandable','S','I','Web','Logic','R','S']}) जो यह डेटाफ़्रेम बनाता है: +-------+----------+---------------+----------------+ | Index | RecordID | Display Label | Value | +-------+----------+---------------+----------------+ | 0 | 1 …

1
पंडों DataFrame के उपवर्ग के लिए संपत्ति सेटर
मैं कोशिश कर रहा हूँ pd.DataFrameकि जब ( groupऔर timestamp_col) को इनिशियलाइज़ किया जाए तो उसमें दो आवश्यक तर्क हो । मैं उन तर्कों पर सत्यापन चलाना चाहता हूं groupऔर timestamp_colइसलिए, मेरे पास प्रत्येक गुण के लिए एक सेटर विधि है। यह सब तब तक काम करता है जब तक …

2
डेटाफ़्रेम, पायथन -3 से शीर्ष एन न्यूनतम मान कैसे खोजें
मेरे पास फ़ील्ड 'एज' के साथ डेटाफ़्रेम है, डेटाफ़्रेम से शीर्ष 3 न्यूनतम आयु की आवश्यकता है DF = pd.DataFrame.from_dict({'Name':['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J'], 'Age':[18, 45, 35, 70, 23, 24, 50, 65, 18, 23]}) DF['Age'].min() सूची में शीर्ष दो आयु अर्थात 18, 23 चाहते हैं, …

3
पांडा डेटाफ़्रेम में ऊपर की ओर जाने के लिए हर दूसरी पंक्ति को स्थानांतरित करें
मेरे पास इस आकार में डेटाफ़्रेम है: A B C D E 213-1 XL NaN NaN NaN 21 22.0 12 232.0 101.32 23-0 L NaN NaN NaN 12 23 12 232.2 NaN 31-0 LS NaN NaN NaN 70 70 23 NaN 21.22 मैं उस डेटाफ़्रेम की हर दूसरी पंक्ति को …
9 python  pandas 

1
दो डेटाफ्रेम मर्ज करें और नामों के साथ कॉलम स्तर जोड़ें
हाय मैं पंडों के लिए कॉनसैट, जॉइन, और मर्ज विधियों के माध्यम से खुदाई कर रहा हूं और मुझे जो चाहिए वह नहीं मिल रहा है। मान लें कि मेरे पास दो डेटाफ्रेम हैं A = pd.DataFrame("A",index=[0,1,2,3,4],columns=['Col 1','Col 2','Col 3']) B = pd.DataFrame("B",index=[0,1,2,3,4],columns=['Col 1','Col 2','Col 3']) >>> A Col 1 …

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.