मैं पंडों में एक समूह के आधार पर एक डेटाफ्रेम में कई तार मिलाना चाहता हूं।
यह मेरा अब तक का कोड है:
import pandas as pd
from io import StringIO
data = StringIO("""
"name1","hej","2014-11-01"
"name1","du","2014-11-02"
"name1","aj","2014-12-01"
"name1","oj","2014-12-02"
"name2","fin","2014-11-01"
"name2","katt","2014-11-02"
"name2","mycket","2014-12-01"
"name2","lite","2014-12-01"
""")
# load string as stream into dataframe
df = pd.read_csv(data,header=0, names=["name","text","date"],parse_dates=[2])
# add column with month
df["month"] = df["date"].apply(lambda x: x.month)
मैं चाहता हूं कि अंतिम परिणाम इस तरह दिखे:
मुझे नहीं पता कि मैं किस तरह से ग्रुपबी का उपयोग कर सकता हूं और कॉलम "टेक्स्ट" में स्ट्रिंग्स के कुछ प्रकार के संयोजन को लागू कर सकता हूं। किसी भी मदद की सराहना की!
pandas < 1.0
,.drop_duplicates()
सूचकांक की उपेक्षा करता है, जो अप्रत्याशित परिणाम दे सकता है। आप.agg(lambda x: ','.join(x))
इसके बजाय का उपयोग करके इससे बच सकते हैं.transform().drop_duplicates()
।