मेरे पास एक फाइल है जिसमें लगभग लाखों की संख्या में लाइनें हैं। लाइनों में मेरे पास एक फ़ील्ड है transactionid
, जिसमें दोहराए गए मान हैं। मुझे जो करने की जरूरत है, वह है उन्हें विशिष्ट रूप से गिनना।
कोई भी मूल्य कितनी बार दोहराया जाए, यह केवल एक बार ही गिना जाना चाहिए।
... No matter of how many times a value is repeated, it should be counted as 1. ...
cat <file_name> | awk -F"|" '{if ((substr($2,0,8)=='20120110')) print $28}' | sort -u | wc -l
अगर क्लॉज़ डेट की एक और जाँच के लिए था जैसा कि स्पष्ट लगता है :)