tar.gz फाइलों में इंडेक्स नहीं होता है। ज़िप या अन्य संग्रह प्रारूपों के विपरीत, यह निहित फ़ाइलों या अन्य मेटाडेटा की सूची प्राप्त करने के लिए न तो तुच्छ है और न ही सस्ता है। आपको यह दिखाने के लिए कि कौन सी फाइलें संग्रह में सम्मिलित हैं, टार को वास्तव में संग्रह को अनकैप करने और फ़ाइलों को निकालने की आवश्यकता है, हालांकि -t
विकल्प के मामले में यह केवल मेमोरी में ऐसा करता है।
यदि आपके उपयोग के मामले में एक सामान्य पैटर्न संग्रह में निहित फ़ाइलों को सूचीबद्ध करने के लिए है, तो आप एक संग्रह प्रारूप का उपयोग करने पर विचार कर सकते हैं जो संपीड़ित फ़ाइल, जैसे ज़िप में फ़ाइल इंडेक्स जोड़ सकता है।
शायद आप अधिक जटिल परिदृश्यों के लिए HDF5 प्रारूप पर एक नज़र डालना चाहते हैं।
माप
मुझे बस अपने उत्तर को साबित करने के लिए कुछ मापन करना था और कुछ फाइलों के साथ कुछ निर्देशिकाएँ बनाईं और उन्हें पैक किया, tar czf files#.tgz files#
और दोनों zip -r files#.zip files#
।
परीक्षणों के लिए मैंने हर बार दो बार अनपैकिंग कमांड को चलाया और डिस्क गति को मापने से बचने के लिए दूसरे रन का परिणाम लिया।
टेस्ट 1
निर्देशिका files1
जिसमें 100,000 खाली फाइलें हैं ।
$ time tar tzf files1.tgz >/dev/null
tar tzf files1.tgz > /dev/null 0,56s user 0,09s system 184% cpu 0,351 total
$ time unzip -l files1.zip >/dev/null
unzip -l files1.zip > /dev/null 0,30s user 0,34s system 99% cpu 0,649 total
ज़िप यहाँ धीमी है।
परीक्षण २
यादृच्छिक डेटा के 512 बाइट्स के साथ 5,000 फ़ाइलोंfiles2
वाली निर्देशिका ।
$ time tar tzf files2.tgz >/dev/null
tar tzf files2.tgz > /dev/null 0,14s user 0,03s system 129% cpu 0,131 total
$ time unzip -l files2.zip >/dev/null
unzip -l files2.zip > /dev/null 0,03s user 0,06s system 98% cpu 0,092 total
अभी भी यकीन नहीं हो रहा है, लेकिन इस बार जिप तेज है।
परीक्षण ३
यादृच्छिक डेटा के 5kB के साथ 5,000 फ़ाइलोंfiles3
वाली निर्देशिका ।
$ time tar tzf files3.tgz >/dev/null
tar tzf files3.tgz > /dev/null 0,42s user 0,03s system 111% cpu 0,402 total
$ time unzip -l files3.zip >/dev/null
unzip -l files3.zip > /dev/null 0,03s user 0,06s system 99% cpu 0,093 total
इस परीक्षण में यह देखा जा सकता है कि फाइलें जितनी बड़ी होंगी, उन्हें सूचीबद्ध करना टार के लिए उतना ही कठिन होगा।
निष्कर्ष
मेरे लिए ऐसा लगता है कि ज़िप थोड़ा ओवरहेड का परिचय देता है जिसे आप केवल बहुत छोटी (लगभग खाली) फ़ाइलों के साथ देखेंगे, जबकि बड़ी फ़ाइलों की बड़ी संख्या के लिए यह संग्रह में निहित फ़ाइलों को सूचीबद्ध करते समय प्रतियोगिता जीतता है।
-z
विकल्प भूल गएtar -tvfz
:। इसी तरह: यदि आप tar tvfz के विपरीत कमांड टार टीवी का उपयोग करते हैं तो क्या होता है?