क्या समय के आगे लाइनों की लंबाई को जाने बिना किसी फ़ाइल की read_csv
केवल पहली n
पंक्तियों को पढ़ने के लिए उपयोग करने का एक अंतर्निहित तरीका है ? मेरे पास एक बड़ी फ़ाइल है जिसे पढ़ने में लंबा समय लगता है, और कभी-कभी केवल इसका उपयोग करने के लिए पहली, कहते हैं, 20 पंक्तियों का उपयोग करना चाहते हैं (और पूरी चीज़ को लोड नहीं करना चाहते हैं और इसका सिर लेना पसंद करते हैं)।
अगर मुझे पता था कि कुल पंक्तियाँ हैं, तो मैं कुछ कर सकता हूँ footer_lines = total_lines - n
और skipfooter
खोजशब्द arg को पास कर सकता हूँ । मेरा वर्तमान समाधान है कि मैं पहले से n
ही पंथ और स्ट्रिंग के साथ पहली पंक्तियों को पंडों तक ले जाऊं:
import pandas as pd
from StringIO import StringIO
n = 20
with open('big_file.csv', 'r') as f:
head = ''.join(f.readlines(n))
df = pd.read_csv(StringIO(head))
यह उतना बुरा नहीं है, लेकिन क्या यह एक और अधिक संक्षिप्त, 'पैंडेसिक' (?) तरीका है इसे कीवर्ड या कुछ और करने के लिए?