PDF को कंप्रेस करते समय अधिकतम संपीड़न प्राप्त करने के लिए 7zip फाइल बनाते समय किन सेटिंग्स का उपयोग करना है?


15

अधिकतम संपीड़न प्राप्त करने के लिए 7zip फाइल बनाते समय किन सेटिंग्स का उपयोग करना है? मैं स्कैन की गई छवियों वाले पीडीएफ दस्तावेजों को संपीड़ित कर रहा हूं। मैं LZMA2 का उपयोग करने के बारे में सोच रहा हूं, लेकिन मुझे नहीं पता कि शब्दकोश आकार, शब्द आकार आदि में क्या सेट करना है। इसके अलावा, क्या LZMA या PPMd बेहतर विकल्प होंगे?

मुझे नेट पर कुछ फ़ाइलों (~ 200MiB) को स्थानांतरित करने की आवश्यकता है और यहां अपलोड की गति बहुत धीमी है, इसलिए मैं डेटा को यथासंभव संपीड़ित करना चाहता हूं। सीपीयू समय खपत बहुत महत्वपूर्ण नहीं है।

संपादित करें

यहाँ विभिन्न संपीड़न विधियों का परीक्षण करने के बाद मुझे क्या मिला है:

असम्पीडित आकार था: 25,462,686B

मेरा प्रोसेसर इंटेल कोर 2 ड्यू टी 8100 है और मेरे पास 4 जीबी का रैम है।

पीएक्यू 8 ओ एल्गोरिथ्म का उपयोग करके पीजेड के साथ सर्वश्रेष्ठ संपीड़न था। परिणामी फ़ाइल का आकार 19,994,325B था। उपयोग की गई सेटिंग्स संपीड़न स्तर थीं: अधिकतम। दुर्भाग्य से, संपीड़न की गति लगभग 5KiB / s थी, इसलिए डेटा को संपीड़ित करने में एक घंटे से अधिक समय लगा।

अगला प्रायोगिक PAQ9O कंप्रेसर था। इसका उपयोग करते हुए, मुझे लगभग 3 मिनट के संपीड़न में 20,132,660B मिला। दुर्भाग्य से, प्रोग्राम केवल कमांड लाइन है, और कई अन्य प्रोग्राम उस संपीड़न एल्गोरिदम का उपयोग नहीं करते हैं। यह मेरे द्वारा उपयोग की गई सेटिंग्स (-9 -c) के साथ लगभग 1.5GiB RAM का उपयोग करता है

उसके बाद LZMA2 का उपयोग करके 7-ज़िप 9.15 बीटा (2010-06-20) था। इसका उपयोग करते हुए, मुझे लगभग 3 मिनट में 20,518,802B मिला। उपयोग की जाने वाली सेटिंग्स शब्द आकार 273, शब्दकोश आकार 64 एमबी और मैंने संपीड़न के लिए 2 थ्रेड्स का उपयोग किया।

अब वापस मेरे मूल प्रश्न पर: मेरे मामले में ठोस ब्लॉक आकार ने कोई ध्यान देने योग्य परिणाम नहीं दिया। शब्द आकार बढ़ने से कुछ परिणाम सामने आए। उच्चतम शब्द आकार और सबसे छोटे के बीच अंतर 115,260B था। मेरा मानना ​​है कि इस तरह की बचत दो आवश्यक क्लिक करने और शब्द आकार बदलने के लिए आवश्यक प्रयासों को सही ठहराती है।

मैंने 7zip और PeaZip द्वारा समर्थित अन्य संपीड़न एल्गोरिदम का उपयोग करने की कोशिश की और वे 19.8MiB से 21.5MiB तक के आकारों में फाइलें तैयार करते हैं।

अंत में मेरा निष्कर्ष यह है कि पीडीएफ दस्तावेजों को संपीड़ित करते समय ज्यादातर चित्र शामिल हैं, विदेशी संपीड़न एल्गोरिदम का उपयोग करने के लिए आवश्यक प्रयास उचित नहीं है। 7zip में LZMA2 का उपयोग करने वाले संपीड़न ने कम से कम समय में काफी स्वीकार्य परिणाम उत्पन्न किए।


PeaZip का उपयोग करने के बारे में क्या अलग है? यह सिर्फ GUI रैपर है जो 7zip के आसपास है और कई अन्य उपकरण हैं
Cole Johnson

@Cole "कोल 9" जॉनसन अच्छी तरह से अंतर यह है कि मेरे मामले में मैंने पीजिप से कुछ "अन्य" टूल का इस्तेमाल किया था, जिसमें उस समय जीयूआई नहीं था। अगर मुझे सही तरीके से याद है तो केवल PeaZip ने GUI के साथ PAQ8O एल्गोरिदम की पेशकश की।
आंद्रेजाको

जवाबों:


7

पीडीएफ की सामग्री (पाठ और चित्र) शायद पहले से ही संपीड़ित है - इसलिए उन्हें फिर से संपीड़ित करने की कोशिश करने से बहुत कुछ हासिल होने वाला नहीं है।


3
नहीं। मैंने थोड़ा परीक्षण किया और 24MiB की PDF ली और डिफ़ॉल्ट सेटिंग्स का उपयोग करके उन्हें संपीड़ित किया। परिणाम 19 MiB फ़ाइल थी। मेरे मामले में, मेरे मामले में वे 5 MiB मायने रखते हैं।
आंद्रेजाको

1
लगता है आप ठीक कह रहे हैं। मैं 7zip की तुलना में काफी बेहतर परिणाम नहीं दे सका, चाहे मैंने कुछ भी किया हो। मैं अभी भी आश्वस्त हूं कि कुछ संपीड़न किसी से बेहतर नहीं है।
आंद्रेजाको

3
यदि आप उस स्थान को बचा सकते हैं, तो संभवतः वह काम है जो 7-ज़िप के बिना लगभग उस स्थान को बचाने के लिए स्वयं पीडीएफ के साथ किया जा सकता है। एक्रोबेट के पीडीएफ ऑप्टिमाइज़र के माध्यम से एक यात्रा अद्भुत काम कर सकती है।
पूर्वोतर

Usr का उत्तर देखें - PDF (zlib) में उपयोग किया गया कंप्रेशन उन्हें आगे संपीड़ित करने के लिए वापस लाया जा सकता है (और पुन: उपयोग पर लागू किया जाता है)। इससे अक्सर ~ 50% आकार में कमी आती है
श्नाडर

@ शेन्सर: यह वास्तव में दिलचस्प है। मैंने एक्रोबैट के पीडीएफ ऑप्टिमाइज़र और म्यूपीडीएफ जैसे उपकरणों को देखा है और उन्हें देखने योग्य रखते हुए पीडीएफ को संशोधित करने के लिए उपयोग किया है, लेकिन उन्हें दोषरहित रूप से बदलने में सक्षम होना भी बहुत मूल्यवान है और इसका उपयोग बड़े लाभ के लिए किया जा सकता है।
ब्राज़ील

8

Precomp आज़माएँ - यह पहले से ही आपके PDF के अंदर पहले से संपीड़ित डेटा को डिकम्प्रेस करता है। फिर 7z असम्पीडित डेटा पर अपना जादू कर सकता है।

इसके अलावा nanozip का प्रयास करें जिसे मैंने बहुत प्रभावी होने के लिए सत्यापित किया है, फिर भी बहुत कुशल (PAQ एल्गोरिदम के संपीड़न अनुपात में 400kb / s)।


2

7za a -t7z -mx-9 -mfb = 258 -mpass = 15 फ़ाइल नाम।

पहले शब्द को अपनी कमांड लाइन के निष्पादन योग्य नाम के लिए आवश्यक रूप से समायोजित करें, और अपने फ़ाइलनाम को अनुकूलित करने के लिए "-assass = 15" के बाद भागों को समायोजित करें और इसमें क्या शामिल होना चाहिए।

यह उत्तर पीडीएफ दस्तावेजों के लिए विशिष्ट नहीं है।
यह LZMA का उपयोग करता है, PPM का नहीं। मैं पीपीएम से दूर रहा क्योंकि बहुत अधिक विविधताएं हैं जो अन्य विविधताओं के साथ संगत नहीं हैं। LZMA अधिक स्थिर प्रतीत होता है, जिसमें संगतता अधिक व्यापक रूप से समर्थित है। इसलिए मैं पीपीएम से बिल्कुल दूर रहा क्योंकि मेरी राय थी, जैसा कि आपने कहा है, "विदेशी संपीड़न एल्गोरिदम का उपयोग करने के लिए आवश्यक प्रयास को एकीकृत नहीं किया गया है।"


2
LZMA2 LZMA से काफी बेहतर है लेकिन केवल 64 बिट सिस्टम पर (प्रभावी) उपयोग के लिए है।
OMY

-3

lzma संपीड़न सबसे अच्छा है क्योंकि आप उच्च संपीड़न अनुपात के साथ एक sfx फ़ाइल या एक msi पैकेज बना सकते हैं। आपके मामले में आप एक बड़ी फ़ाइल को संपीड़ित नहीं कर रहे हैं, इसलिए यह विचलन काफी छोटा है, खासकर यदि फ़ाइल संकुचित हो गई है जैसे: एमपी 3 या डीएनजी

कोशिश जीत चाप यह मुफ़्त है और एक ग्रेट संपीड़न अनुपात देता है

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.