मैं CSV फ़ाइल से कुछ मशीन लर्निंग डेटा लोड करता हूं। पहले 2 कॉलम अवलोकन हैं और शेष कॉलम विशेषताएं हैं।
वर्तमान में, मैं निम्नलिखित कार्य करता हूं:
data = pandas.read_csv('mydata.csv')
जो कुछ इस तरह देता है:
data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde'))
मैं दो dataframes में इस dataframe काट करना चाहते हैं: एक स्तंभ युक्त a
और b
और एक कॉलम युक्त c
, d
और e
।
कुछ लिखना संभव नहीं है
observations = data[:'c']
features = data['c':]
मुझे यकीन नहीं है कि सबसे अच्छा तरीका क्या है। क्या मुझे एक की आवश्यकता है pd.Panel
?
वैसे, मुझे लगता है कि डेटाफ्रेम इंडेक्सिंग असंगत है: data['a']
की अनुमति है, लेकिन data[0]
नहीं है। दूसरी तरफ, data['a':]
अनुमति नहीं है लेकिन data[0:]
है। क्या इसका कोई व्यावहारिक कारण है? यह वास्तव में भ्रामक है अगर कॉलम Int द्वारा अनुक्रमित किया जाता है, जिसे दिया गया हैdata[0] != data[0:1]
df[5:10]
पंक्तियों के चयन के लिए जोड़ा गया था ( pandas.pydata.org/pandas-docs/stable/... )