डेटाफ़्रेम से डुप्लिकेट कॉलम हटाने का सबसे आसान तरीका क्या है?
मैं एक पाठ फ़ाइल पढ़ रहा हूँ जिसमें डुप्लिकेट कॉलम हैं:
import pandas as pd
df=pd.read_table(fname)
स्तंभ नाम हैं:
Time, Time Relative, N2, Time, Time Relative, H2, etc...
सभी समय और समय सापेक्ष कॉलम में समान डेटा होता है। मुझे चाहिए:
Time, Time Relative, N2, H2
मेरे सभी प्रयास छोड़ने, हटाने आदि जैसे:
df=df.T.drop_duplicates().T
विशिष्ट मूल्य सूचकांक त्रुटियों में परिणाम:
Reindexing only valid with uniquely valued index objects
पंडों के नोब होने के लिए क्षमा करें। किसी भी सुझाव की सराहना की जाएगी।
अतिरिक्त जानकारिया
पंडों का संस्करण: 0.9.0
पायथन संस्करण: 2.7.3
विंडोज 7
(पायथनियस 2.7.3.0 के माध्यम से स्थापित)
डेटा फ़ाइल (ध्यान दें: वास्तविक फ़ाइल में, कॉलम टैब द्वारा अलग किए जाते हैं, यहां उन्हें 4 स्थानों से अलग किया जाता है):
Time Time Relative [s] N2[%] Time Time Relative [s] H2[ppm]
2/12/2013 9:20:55 AM 6.177 9.99268e+001 2/12/2013 9:20:55 AM 6.177 3.216293e-005
2/12/2013 9:21:06 AM 17.689 9.99296e+001 2/12/2013 9:21:06 AM 17.689 3.841667e-005
2/12/2013 9:21:18 AM 29.186 9.992954e+001 2/12/2013 9:21:18 AM 29.186 3.880365e-005
... etc ...
2/12/2013 2:12:44 PM 17515.269 9.991756+001 2/12/2013 2:12:44 PM 17515.269 2.800279e-005
2/12/2013 2:12:55 PM 17526.769 9.991754e+001 2/12/2013 2:12:55 PM 17526.769 2.880386e-005
2/12/2013 2:13:07 PM 17538.273 9.991797e+001 2/12/2013 2:13:07 PM 17538.273 3.131447e-005
read_tableबनाए गए उदाहरण के साथ कॉलम को अद्वितीय बनाता है ।
import pandas as pd; pd.__version__)