क्या gzip का उपयोग करके बहुत बड़ी फ़ाइल (~ 30 GB) को संपीड़ित करना संभव है?


17

क्या gzip का उपयोग करके बहुत बड़ी फ़ाइल (~ 30 GB) को संपीड़ित करना संभव है? यदि हां, तो मुझे क्या उपयोग करना चाहिए?

या क्या कोई अन्य प्रोग्राम (अधिमानतः उबंटू वितरण पर उपलब्ध एक) है जिसे मैं बहुत बड़ी फ़ाइलों को संपीड़ित / ज़िप करने के लिए उपयोग कर सकता हूं? क्या आपको इसके साथ कोई अनुभव है?


अधिकांश हार्डकोर कंप्रेसर xz, या इसके समानांतर संस्करण, pxz है। pxz -9ve - <in >out.xzऔर आप अपने पीसी पर एक चिकन सेंकना करेंगे, लेकिन परिणाम लगभग 60% गज़िप परिणाम होगा। इसके लिए आपको लगभग 7 जीबी की आवश्यकता है।
पीटर -

जवाबों:


22

AFAIK के लिए आकार की कोई सीमा नहीं है gzip- कम से कम 30GB नहीं। बेशक, आपको अपने डिस्क पर ज़िपित फ़ाइल के लिए स्थान की आवश्यकता है, दोनों संस्करण एक साथ संपीड़ित करते समय साथ में होंगे।

bzip2 फ़ाइलों को संपीड़ित करता है (न केवल बड़े लोग :-) बेहतर है, लेकिन यह (कभी-कभी बहुत धीमी) है।


4
bzip2 स्रोत कोड (और पसंद) को संपीड़ित करने में विशेष रूप से अच्छा है। यह सामान्य उपयोग के लिए भी gzip करने के लिए एक अच्छा प्रतियोगी है। विभिन्न ऑपरेटिंग सिस्टमों में gzip के लिए उपलब्धता bzip2
jippie

क्या bzip2 दोषरहित संपीड़न है? धन्यवाद।
एंड्रयू

3
@ और हां, gzip / bzip2 / etc ... सभी दोषरहित हैं।
रेनन

1
और वहाँ pbzipभी है - जो एक से अधिक सीपीयू-कोर का उपयोग करेगा। लेकिन अभी भी की तुलना में धीमी तरह से gzip
निल्स

1
@ नील: मेरे उबंटू पर केवलpbzip2
rubo77

8

यदि आपको एक अच्छी खाद दर की आवश्यकता है, तो आप लज़मा आज़मा सकते हैं। यह bzip2 की तुलना में अधिक तेज़ और अधिक कुशल है और gzip से भी तेज़ हो सकता है (मुझे नहीं पता कि यह सुनिश्चित है)

http://www.thegeekstuff.com/2010/06/lzma-better-compression-than-bzip2-on-unix-linux/


4
lzmaxzअब के पक्ष में पदावनत हो गया है । समान एल्गोरिथ्म, कुछ अलग (बेहतर?) फ़ाइल स्वरूप जिसके चारों ओर लिपटा हुआ है। LZMA गज़िप की तुलना में धीमी है, लेकिन अधिकतम गति पर यह अभी भी JSON डेटा की तरह अत्यधिक अनावश्यक सामान पर काफी अच्छा संपीड़न है। ( xz -0)
पीटर कॉर्ड्स

3

यदि आप सीमा में चल रहे हैं, तो पुनर्व्यवस्थित करें। के बजाय:

gzip file

कर:

gzip < file > file.gz

ठीक काम करता है।


2

Gzip प्रारूप इनपुट आकार modulo 2 ^ 32 का प्रतिनिधित्व करता है, इसलिए --listविकल्प गलत असम्पीडित आकारों और संपीडित अनुपातों को असम्पीडित फ़ाइलों 4 GB और बड़े के लिए रिपोर्ट करता है।

तो, bzip2(v1.0.2 और ऊपर) ले या xz


यदि यह ठीक से केवल gzip होना चाहिए, तो आपकी फ़ाइल को प्रत्येक 4 GB तक छोटे भागों में विभाजित किया जाना है।
cuniform

इसके लिए फाइल स्प्लिटर उपलब्ध हैं।
वेरेस

खैर, इसे विभाजित करने की आवश्यकता नहीं है , यह सिर्फ इतना है कि रिपोर्ट किए गए आकार गलत होंगे।
Law29

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.