मैं एक PySpark डेटाफ़्रेम को फ़िल्टर करने का प्रयास कर रहा हूं None
जिसमें पंक्ति मूल्य है:
df.select('dt_mvmt').distinct().collect()
[Row(dt_mvmt=u'2016-03-27'),
Row(dt_mvmt=u'2016-03-28'),
Row(dt_mvmt=u'2016-03-29'),
Row(dt_mvmt=None),
Row(dt_mvmt=u'2016-03-30'),
Row(dt_mvmt=u'2016-03-31')]
और मैं एक स्ट्रिंग मान के साथ सही ढंग से फ़िल्टर कर सकता हूं:
df[df.dt_mvmt == '2016-03-31']
# some results here
लेकिन यह विफल रहता है:
df[df.dt_mvmt == None].count()
0
df[df.dt_mvmt != None].count()
0
लेकिन प्रत्येक श्रेणी पर निश्चित रूप से मूल्य हैं। क्या चल रहा है?