इसके लिए जाग का उपयोग करना। परीक्षण फ़ाइलें:
$ cat a.txt
one
two
three
four
four
$ cat b.txt
three
two
one
जाग:
$ awk '
NR==FNR { # process b.txt or the first file
seen[$0] # hash words to hash seen
next # next word in b.txt
} # process a.txt or all files after the first
!($0 in seen)' b.txt a.txt # if word is not hashed to seen, output it
डुप्लिकेट आउटपुट हैं:
four
four
डुप्लिकेट से बचने के लिए, axt में प्रत्येक नए मिले हुए शब्द को seen
हैश में जोड़ें:
$ awk '
NR==FNR {
seen[$0]
next
}
!($0 in seen) { # if word is not hashed to seen
seen[$0] # hash unseen a.txt words to seen to avoid duplicates
print # and output it
}' b.txt a.txt
आउटपुट:
four
यदि शब्द सूचियाँ अल्पविराम से अलग हैं, जैसे:
$ cat a.txt
four,four,three,three,two,one
five,six
$ cat b.txt
one,two,three
आपको कुछ अतिरिक्त अंतराल ( for
लूप) करने होंगे:
awk -F, ' # comma-separated input
NR==FNR {
for(i=1;i<=NF;i++) # loop all comma-separated fields
seen[$i]
next
}
{
for(i=1;i<=NF;i++)
if(!($i in seen)) {
seen[$i] # this time we buffer output (below):
buffer=buffer (buffer==""?"":",") $i
}
if(buffer!="") { # output unempty buffers after each record in a.txt
print buffer
buffer=""
}
}' b.txt a.txt
इस बार आउटपुट:
four
five,six
diff a.txt b.txt
काफी नहीं है?