मेरे पास उन वस्तुओं की एक सूची है जिनमें कुछ निर्यात की संभावना है। मैं डुप्लिकेट आइटम की एक सूची प्राप्त करना चाहूंगा ताकि मैं मैन्युअल रूप से उनकी तुलना कर सकूं। जब मैं पांडा डुप्लिकेट विधि का उपयोग करने की कोशिश करता हूं , तो यह केवल पहला डुप्लिकेट लौटाता है। वहाँ सभी डुप्लिकेट पाने के लिए एक ही रास्ता है और न केवल पहले एक?
मेरे डेटासेट की एक छोटी उपधारा इस तरह दिखती है:
ID,ENROLLMENT_DATE,TRAINER_MANAGING,TRAINER_OPERATOR,FIRST_VISIT_DATE
1536D,12-Feb-12,"06DA1B3-Lebanon NH",,15-Feb-12
F15D,18-May-12,"06405B2-Lebanon NH",,25-Jul-12
8096,8-Aug-12,"0643D38-Hanover NH","0643D38-Hanover NH",25-Jun-12
A036,1-Apr-12,"06CB8CF-Hanover NH","06CB8CF-Hanover NH",9-Aug-12
8944,19-Feb-12,"06D26AD-Hanover NH",,4-Feb-12
1004E,8-Jun-12,"06388B2-Lebanon NH",,24-Dec-11
11795,3-Jul-12,"0649597-White River VT","0649597-White River VT",30-Mar-12
30D7,11-Nov-12,"06D95A3-Hanover NH","06D95A3-Hanover NH",30-Nov-11
3AE2,21-Feb-12,"06405B2-Lebanon NH",,26-Oct-12
B0FE,17-Feb-12,"06D1B9D-Hartland VT",,16-Feb-12
127A1,11-Dec-11,"064456E-Hanover NH","064456E-Hanover NH",11-Nov-12
161FF,20-Feb-12,"0643D38-Hanover NH","0643D38-Hanover NH",3-Jul-12
A036,30-Nov-11,"063B208-Randolph VT","063B208-Randolph VT",
475B,25-Sep-12,"06D26AD-Hanover NH",,5-Nov-12
151A3,7-Mar-12,"06388B2-Lebanon NH",,16-Nov-12
CA62,3-Jan-12,,,
D31B,18-Dec-11,"06405B2-Lebanon NH",,9-Jan-12
20F5,8-Jul-12,"0669C50-Randolph VT",,3-Feb-12
8096,19-Dec-11,"0649597-White River VT","0649597-White River VT",9-Apr-12
14E48,1-Aug-12,"06D3206-Hanover NH",,
177F8,20-Aug-12,"063B208-Randolph VT","063B208-Randolph VT",5-May-12
553E,11-Oct-12,"06D95A3-Hanover NH","06D95A3-Hanover NH",8-Mar-12
12D5F,18-Jul-12,"0649597-White River VT","0649597-White River VT",2-Nov-12
C6DC,13-Apr-12,"06388B2-Lebanon NH",,
11795,27-Feb-12,"0643D38-Hanover NH","0643D38-Hanover NH",19-Jun-12
17B43,11-Aug-12,,,22-Oct-12
A036,11-Aug-12,"06D3206-Hanover NH",,19-Jun-12
मेरा कोड वर्तमान में इस तरह दिखता है:
df_bigdata_duplicates = df_bigdata[df_bigdata.duplicated(cols='ID')]
वहाँ एक युगल डुप्लिकेट आइटम क्षेत्र। लेकिन, जब मैं उपरोक्त कोड का उपयोग करता हूं, तो मुझे केवल पहला आइटम मिलता है। एपीआई संदर्भ में, मैं देखता हूं कि मैं अंतिम आइटम कैसे प्राप्त कर सकता हूं, लेकिन मैं उन सभी को पसंद करना चाहूंगा, इसलिए मैं नेत्रहीन निरीक्षण कर सकता हूं कि मुझे विसंगति क्यों हो रही है। इसलिए, इस उदाहरण में मैं सभी तीन A036 प्रविष्टियों और दोनों 11795 प्रविष्टियों और किसी भी अन्य दोहराई गई प्रविष्टियों को प्राप्त करना चाहूंगा, केवल पहले वाले के बजाय। कोई मदद सबसे सराहना की है।
IDपर विचार करना चाहते हैं , न कि" कई या सभी कॉलम में समान पंक्तियाँ "।