मेरे पास FILE_A है जिसमें 300,000 से अधिक लाइनें हैं और FILE_B जिसकी 30 मिलियन से अधिक लाइनें हैं। मैंने एक Bash स्क्रिप्ट बनाई जो FILE_A में FILE_A पर प्रत्येक पंक्ति को greps बनाती है और एक नई फ़ाइल के लिए grep का परिणाम लिखती है।
इस पूरी प्रक्रिया में 5 घंटे का समय लग रहा है।
मैं अपनी स्क्रिप्ट के प्रदर्शन में सुधार कैसे कर सकता हूं?
मैं grep -F -m 1
grep कमांड के रूप में उपयोग कर रहा हूं । FILE_A इस तरह दिखता है:
123456789
123455321
और FILE_B इस तरह है:
123456789,123456789,730025400149993,
123455321,123455321,730025400126097,
तो बैश के साथ मेरे पास एक while
लूप है जो कि FILE_A में अगली पंक्ति को चुनता है और इसे FILE_B में जमा करता है। जब पैटर्न FILE_B में मिलता है, तो मैं इसे result.txt फ़ाइल में लिखता हूं।
while read -r line; do
grep -F -m1 $line 30MFile
done < 300KFile