मेरे पास इस तरह एक डेटाफ्रेम है:
A B C
0 1 0.749065 This
1 2 0.301084 is
2 3 0.463468 a
3 4 0.643961 random
4 1 0.866521 string
5 2 0.120737 !
कॉलिंग
In [10]: print df.groupby("A")["B"].sum()
वापस होगा
A
1 1.615586
2 0.421821
3 0.463468
4 0.643961
अब मैं कॉलम "C" के लिए "वही" करना चाहूंगा। क्योंकि उस कॉलम में स्ट्रिंग्स हैं, योग () काम नहीं करता है (हालांकि आप सोच सकते हैं कि यह स्ट्रिंग्स को समाप्त कर देगा)। मैं वास्तव में जो देखना चाहता हूं, वह प्रत्येक समूह के लिए एक सूची या सेट है, अर्थात
A
1 {This, string}
2 {is, !}
3 {a}
4 {random}
मैं ऐसा करने के तरीके खोजने की कोशिश कर रहा हूं।
Series.unique () ( http://pandas.pydata.org/pandas-docs/stable/generated/pandas.Series.unique.html ) हालांकि काम नहीं करता है
df.groupby("A")["B"]
एक है
pandas.core.groupby.SeriesGroupBy object
इसलिए मुझे उम्मीद थी कि कोई भी श्रृंखला विधि काम करेगी। कोई विचार?
applyऔरlambdaरों। मैं यह सोचकर यहाँ आया था किpandasवास्तव में समन क्यों है और समिंग स्ट्रिंग्स पर कोई त्रुटि नहीं है।