नैनो के बजाय खाली मान के रूप में खाली मान पढ़ने के लिए pandas.read_csv प्राप्त करें

Question 1

मैं कुछ सीएसवी डेटा में पढ़ने के लिए पांडा लाइब्रेरी का उपयोग कर रहा हूं। मेरे डेटा में, कुछ स्तंभों में तार होते हैं। स्ट्रिंग "nan"एक संभावित मान है, जैसा कि एक रिक्त स्ट्रिंग है। मैं "नान" को एक स्ट्रिंग के रूप में पढ़ने के लिए पांडा प्राप्त करने में कामयाब रहा, लेकिन मैं यह नहीं समझ सकता कि इसे NaN के रूप में एक खाली मान नहीं पढ़ने के लिए कैसे प्राप्त किया जाए। यहाँ नमूना डेटा और आउटपुट है

One,Two,Three
a,1,one
b,2,two
,3,three
d,4,nan
e,5,five
nan,6,
g,7,seven

>>> pandas.read_csv('test.csv', na_values={'One': [], "Three": []})
    One  Two  Three
0    a    1    one
1    b    2    two
2  NaN    3  three
3    d    4    nan
4    e    5   five
5  nan    6    NaN
6    g    7  seven

यह "नान" को स्ट्रिंग "नैन 'के रूप में सही ढंग से पढ़ता है, लेकिन फिर भी खाली कोशिकाओं को NaN के रूप में पढ़ता है। मैंने read_csv (के साथ ) strके convertersतर्क में पास होने की कोशिश की converters={'One': str}), लेकिन यह अभी भी खाली कोशिकाओं को NaN के रूप में पढ़ता है।

मुझे लगता है कि मैं पढ़ने के बाद मूल्यों को भर सकता हूं, फिलना के साथ, लेकिन क्या वास्तव में पांडा को यह बताने का कोई तरीका नहीं है कि एक विशेष सीएसवी कॉलम में एक खाली सेल को NaN के बजाय एक खाली स्ट्रिंग के रूप में पढ़ा जाना चाहिए?

Question 2

मैंने यहाँ किसी प्रकार का एक विकल्प जोड़ने के लिए एक टिकट जोड़ा:

https://github.com/pydata/pandas/issues/1450

इस बीच, result.fillna('')आपको जो चाहिए वो करना चाहिए

EDIT: विकास संस्करण में (0.8.0 अंतिम होने के लिए) यदि आप की एक खाली सूची निर्दिष्ट करते हैं na_values, तो परिणाम में खाली तार खाली रहेंगे।

Question 3

अन्य उत्तरों और टिप्पणियों को पढ़ने के बाद भी मैं उलझन में था। लेकिन जवाब अब सरल लगता है, इसलिए यहां आप जाएं।

पंडों के संस्करण ०.१ (२०१२ से) के बाद, आप अपने सीएसवी को खाली सेटिंग के रूप में व्याख्या की गई खाली कोशिकाओं के साथ पढ़ सकते हैं keep_default_na=False:

pd.read_csv('test.csv', keep_default_na=False)

इस मुद्दे को और अधिक स्पष्ट रूप से समझाया गया है

Read_csv में अधिक सुसंगत na_values हैंडलिंग · समस्या # 1657 · पांडा-देव / पांडा

पांडस संस्करण 0.9 के लिए 19 अगस्त 2012 को तय किया गया था

बग: अधिक सुसंगत na_values # 1657 · पंडों-देव / पंडों @ d9abf68

Question 4

हमारे पास इसके लिए पंडों में एक सरल तर्क है read_csv:

उपयोग:

df = pd.read_csv('test.csv', na_filter= False)

पांडस प्रलेखन स्पष्ट रूप से बताता है कि उपरोक्त तर्क कैसे काम करता है।

संपर्क