मैं CSV फ़ाइल से कुछ मशीन लर्निंग डेटा लोड करता हूं। पहले 2 कॉलम अवलोकन हैं और शेष कॉलम विशेषताएं हैं।
वर्तमान में, मैं निम्नलिखित कार्य करता हूं:
data = pandas.read_csv('mydata.csv')
जो कुछ इस तरह देता है:
data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde'))
मैं दो dataframes में इस dataframe काट करना चाहते हैं: एक स्तंभ युक्त aऔर bऔर एक कॉलम युक्त c, dऔर e।
कुछ लिखना संभव नहीं है
observations = data[:'c']
features = data['c':]
मुझे यकीन नहीं है कि सबसे अच्छा तरीका क्या है। क्या मुझे एक की आवश्यकता है pd.Panel?
वैसे, मुझे लगता है कि डेटाफ्रेम इंडेक्सिंग असंगत है: data['a']की अनुमति है, लेकिन data[0]नहीं है। दूसरी तरफ, data['a':]अनुमति नहीं है लेकिन data[0:]है। क्या इसका कोई व्यावहारिक कारण है? यह वास्तव में भ्रामक है अगर कॉलम Int द्वारा अनुक्रमित किया जाता है, जिसे दिया गया हैdata[0] != data[0:1]
df[5:10]पंक्तियों के चयन के लिए जोड़ा गया था ( pandas.pydata.org/pandas-docs/stable/... )