डेटा सेट से दूसरा फ़ील्ड फ़िल्टर करना और फिर आउटपुट पर यूनीक का उपयोग करना


0

मुझे एक डेटासेट मिला है जो इस प्रकार है:

AAAAA 11111 Data1
AAAAA 11111 Data2
AAAAA 11111 Data3
AAAAA 11112 Data4
AAAAA 11112 Data5
AAAAA 11112 Data6
AAAAA 11112 Data7
AAAAA 11113 Data8
AAAAA 11114 Data9

और इसी तरह। मैं 2nd फ़ील्ड के अनुसार फ़िल्टर करना चाहता हूं और फिर केवल FIRST प्रविष्टि को खींचने के लिए एक uniq चलाते हैं। इस मामले में, मैं चाहता हूं कि आउटपुट हो:

AAAAA 11111 Data1
AAAAA 11112 Data4
AAAAA 11113 Data8
AAAAA 11114 Data9

ऐसा लगता है कि यह बहुत आसान होगा, लेकिन विधि सिर्फ मुझे मार रही है। कोई मदद?

जवाबों:


1

आप उपयोग कर सकते हैं sort काम करने के लिए:

sort -k2,2 -u

-k2,2 साधन केवल 2 कॉलम पर संचालित होते हैं -u अनूठा है।


0

यह करने के लिए awk का एक मुहावरेदार टुकड़ा है:

awk '!seen[$2]++' file

पहली बार केवल 2 कॉलम में मान देखा गया था


0

इसे क्रमबद्ध करने के लिए आप नीचे दिए गए आदेश का उपयोग कर सकते हैं

sort new.txt | rev | uniq -s 6 | rev

फ़ाइल का आउटपुट निम्नानुसार है

enter image description here

उम्मीद है की यह मदद करेगा

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.