मेरे सुन्न सरणियों np.nan
लापता मूल्यों को नामित करने के लिए उपयोग करते हैं। जैसा कि मैंने डेटा सेट पर पुनरावृति की, मुझे ऐसे लापता मूल्यों का पता लगाने और उन्हें विशेष तरीकों से संभालने की आवश्यकता है।
Naively मैंने उपयोग किया numpy.isnan(val)
, जो तब तक अच्छी तरह से काम करता है जब तक val
कि समर्थित प्रकारों के सबसेट के बीच न हो numpy.isnan()
। उदाहरण के लिए, स्ट्रिंग फ़ील्ड में अनुपलब्ध डेटा हो सकता है, जिस स्थिति में मुझे मिलता है:
>>> np.isnan('some_string')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: Not implemented for this type
महंगे रैपर लिखने के अलावा जो अपवाद और रिटर्न को पकड़ता है False
, क्या उसे इस कुशलता से और कुशलता से संभालने का कोई तरीका है?
pandas.isnull()
पूरी तरह से काम करने लगता है। एकमात्र डेटा प्रकार जो मैं वर्तमान में काम कर रहा हूं numpy.isnan()
, जो टूट गया है वह स्ट्रिंग है, और pandas.isnull()
इसे अच्छी तरह से संभालता है। वास्तव में, यह अच्छी तरह से किसी भी मनमानी वस्तु को संभालने के लिए लगता है जो मैंने इसे फेंक दिया था। क्या आप के बारे में कोई विशेष मुद्दे थे? अन्यथा, आप अपनी टिप्पणी को पूर्ण उत्तर के रूप में प्रस्तुत करना चाह सकते हैं, क्योंकि यह विहित उत्तर की तरह लगता है, कम से कम पांडा उपयोगकर्ताओं के लिए।
pandas
हैpandas.isnull()
: मुझे यकीन नहीं है कि अगर यह आपकी आवश्यकताओं को पूरा करता है, तो कुछ उदाहरण डेटा अच्छा हो सकता है।