कैसे एक पांडव DataFrame में एक tsv फ़ाइल लोड करने के लिए?


136

मैं अजगर और पांडा के लिए नया हूं। मैं एक tsvफाइल को एक पांडा में लोड करने की कोशिश कर रहा हूं DataFrame

यही मैं कोशिश कर रहा हूं और मुझे जो त्रुटि मिल रही है, वह है:

>>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t'))

Traceback (most recent call last):
  File "<pyshell#28>", line 1, in <module>
    df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t'))
  File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 318, in __init__
    raise PandasError('DataFrame constructor not properly called!')
PandasError: DataFrame constructor not properly called!

11
2017 में इस उत्तर के लिए आने वालों के लिए, का उपयोग करें read_csv('path_to_file', sep='\t')। देखें नीचे इस सवाल का जवाब
टेड Petrou

धन्यवाद @TedPetrou
सॉलोमन

जवाबों:


153

नोट : 17.0 के रूप में from_csvहतोत्साहित किया गया है: pd.read_csvइसके बजाय का उपयोग करें

दस्तावेज़ीकरण एक .from_csv फ़ंक्शन को सूचीबद्ध करता है जो कि आप जो चाहते हैं वह करता है:

DataFrame.from_csv('c:/~/trainSetRel3.txt', sep='\t')

यदि आपके पास एक हेडर है, तो आप पास कर सकते हैं header=0

DataFrame.from_csv('c:/~/trainSetRel3.txt', sep='\t', header=0)

4
इस पद्धति के साथ मेरे कुछ मुद्दे थे - यह अंत में बहुत धीमा और असफल अनुक्रमण था। इसके बजाय, मैंने read_table () का उपयोग किया, जो कि अधिक तेजी से और अतिरिक्त परम के बिना काम करता था।
यूरीक

21
ध्यान दें कि 17.0 के रूप में from_csvहतोत्साहित किया गया है: pd.read_csvइसके बजाय का उपयोग करें !
राफेलवेले

2
मुझे निम्नलिखित का उपयोग करना था: DataFrame.read_csv ('filepath.tsv', sep = '', हैडर = 0)
Archie

3
यह एक बुरा जवाब है; आप टीएसवी को मूल रूप से पढ़ सकते हैं pd.read_csv/read_table, आपको बस सेट करने की आवश्यकता है delim_whitespace=Trueयाsep
smci करें

3
@rafaelvalle ने पदावनत नोटिस जोड़ा
अरयन सिंह

84

17.0 के रूप में from_csvहतोत्साहित किया जाता है।

का प्रयोग करें pd.read_csv(fpath, sep='\t')या pd.read_table(fpath)


4
नोट: read_table को 0.24.0 संस्करण के बाद से हटा दिया गया है। इसके बजाय pandas.read_csv () का उपयोग करें।
मैनुएल श्नाइड 3r

57

का उपयोग करें read_table(filepath)। डिफ़ॉल्ट विभाजक टैब है


1
read_table को किसी भी पैरामीटर की आवश्यकता नहीं है। पूरी तरह से काम कर रहा है।
Jay

19

इसे इस्तेमाल करे

df = pd.read_csv("rating-data.tsv",sep='\t')
df.head()

यहाँ छवि विवरण दर्ज करें

आपको वास्तव में एसईपी पैरामीटर को ठीक करने की आवश्यकता है ।


7

फ़ाइल खोलें, .csv के रूप में सहेजें और फिर आवेदन करें

df = pd.read_csv('apps.csv', sep='\t')

किसी अन्य प्रारूप के लिए भी, बस sep टैग बदलें


0
df = pd.read_csv('filename.csv', sep='\t', header=0)

आप delimitor और हैडर को निर्दिष्ट करके psas डेटा फ़्रेम में सीधे tsv फ़ाइल लोड कर सकते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.