मेरे पास कॉलम ए में दोहराए जाने वाले मानों के साथ एक डेटाफ्रेम है। मैं डुप्लिकेट को ड्रॉप करना चाहता हूं, कॉलम बी में उच्चतम मूल्य के साथ पंक्ति रखते हुए।
तो यह:
A B
1 10
1 20
2 30
2 40
3 10
इस में बदलना चाहिए:
A B
1 20
2 40
3 10
डुप्लिकेट को छोड़ने के लिए वेस ने कुछ अच्छी कार्यक्षमता जोड़ी है: http://wesmckinney.com/blog/?p=340 । लेकिन AFAICT, इसे सटीक डुप्लिकेट के लिए डिज़ाइन किया गया है, इसलिए यह चुनने के लिए मापदंड का कोई उल्लेख नहीं है कि कौन सी पंक्तियों को रखा जाए।
मैं अनुमान लगा रहा हूं कि ऐसा करने का एक आसान तरीका है --- शायद डुप्लिकेट को छोड़ने से पहले डेटाफ्रेम को सॉर्ट करना जितना आसान है --- लेकिन मुझे यह पता लगाने के लिए ग्रुपबी के आंतरिक तर्क को अच्छी तरह से पता नहीं है। कोई सुझाव?