मैं कुछ सीएसवी डेटा में पढ़ने के लिए पांडा लाइब्रेरी का उपयोग कर रहा हूं। मेरे डेटा में, कुछ स्तंभों में तार होते हैं। स्ट्रिंग "nan"
एक संभावित मान है, जैसा कि एक रिक्त स्ट्रिंग है। मैं "नान" को एक स्ट्रिंग के रूप में पढ़ने के लिए पांडा प्राप्त करने में कामयाब रहा, लेकिन मैं यह नहीं समझ सकता कि इसे NaN के रूप में एक खाली मान नहीं पढ़ने के लिए कैसे प्राप्त किया जाए। यहाँ नमूना डेटा और आउटपुट है
One,Two,Three
a,1,one
b,2,two
,3,three
d,4,nan
e,5,five
nan,6,
g,7,seven
>>> pandas.read_csv('test.csv', na_values={'One': [], "Three": []})
One Two Three
0 a 1 one
1 b 2 two
2 NaN 3 three
3 d 4 nan
4 e 5 five
5 nan 6 NaN
6 g 7 seven
यह "नान" को स्ट्रिंग "नैन 'के रूप में सही ढंग से पढ़ता है, लेकिन फिर भी खाली कोशिकाओं को NaN के रूप में पढ़ता है। मैंने read_csv (के साथ ) str
के converters
तर्क में पास होने की कोशिश की converters={'One': str})
, लेकिन यह अभी भी खाली कोशिकाओं को NaN के रूप में पढ़ता है।
मुझे लगता है कि मैं पढ़ने के बाद मूल्यों को भर सकता हूं, फिलना के साथ, लेकिन क्या वास्तव में पांडा को यह बताने का कोई तरीका नहीं है कि एक विशेष सीएसवी कॉलम में एक खाली सेल को NaN के बजाय एक खाली स्ट्रिंग के रूप में पढ़ा जाना चाहिए?
keep_default_na
नीचे दिए गए हाल के विकल्प का उपयोग करके उत्तर दें ।