बैच आकार और पीडीएफ फाइलों को संपीड़ित करता है


13

मुझे पीडीएफ फाइलों के बैचों को आकार देने और संपीड़ित करने का एक तरीका चाहिए। मैं विंडोज पर ऐसा करना पसंद करूंगा, लेकिन लिनक्स ठीक होगा अगर इसका मतलब एक चिकना वर्कफ़्लो है।

मुझे पता है कि NitroPDF और Acrobat जैसे कार्यक्रम हैं जो आपको इसे पूरा करने की अनुमति देते हैं, लेकिन मुझे डर है कि यह फ़ाइल-दर-फ़ाइल आधार पर किया जाएगा। ये कार्यक्रम भी सस्ते नहीं हैं और मैं इन्हें नहीं खरीदना पसंद करूंगा ताकि मैं एक या दो सुविधाओं का उपयोग कर सकूं।

पृष्ठभूमि की जानकारी: मैं खातों में प्रवेश के लिए प्राप्तियों और चालानों को डिजिटाइज़ करने के लिए कैमस्कैनर का उपयोग करता हूं (फ्रीजेंट)। CamScanner pdfs सभी A4 आकार के हैं और बहु-पृष्ठ वाले अक्सर 2MB अनुलग्नक सीमा से अधिक होते हैं।

जवाबों:


13

मैं यहां एक कमांड लाइन टूल का सुझाव दे रहा हूं, जिसे विंडोज, लिनक्स, ओएस, इत्यादि में अंतर्निहित स्क्रिप्टिंग भाषाओं में आसानी से छोरों के साथ बैच किया जा सकता है।


ImageMagick पीडीएफ का समर्थन करता है और एक है resize इसके साथ विकल्प बदलना उपकरण। मैंने इसे कभी भी व्यक्तिगत रूप से उपयोग नहीं किया है, लेकिन आप इसके साथ खेलने की कोशिश कर सकते हैं।

आप भी उपयोग कर सकते हैं compress विकल्प (एक उदाहरण है यहाँ ):

एक पीडीएफ घुमाएँ

$ convert -rotate 270 -density 300x300 -compress lzw in.pdf out.pdf

यह एक TIFF समर्थित PDF मानता है। घनत्व पैरामीटर महत्वपूर्ण है क्योंकि अन्यथा ImageMagick छवि (किसी कारण से) के नमूने को नीचे कर देता है। संपीड़न विकल्प में जोड़ने से पीडीएफ का समग्र आकार छोटा रखने में मदद मिलती है, जिससे गुणवत्ता में कोई हानि नहीं होती है।

PDF को गुणा करने के लिए, आप उपयोग करना चाह सकते हैं pdftk, तब उपयोग करें mogrify प्रत्येक पृष्ठ को स्थान पर बदलने के लिए ImageMagick से:

$ pdftk in.pdf burst
$ mogrify -rotate 270 -density 300x300 -compress lzw pg_*.pdf
$ pdftk pg*.pdf cat output out.pdf
$ rm pg*.pdf


ImageMagick के साथ पीडीएफ फाइलों को परिवर्तित करने के लिए, आपके पास होना चाहिए GhostScript स्थापित।


ImageMagick मल्टिपल PDF को कन्वर्ट कर सकता है। जबकि mogrify जगह में परिवर्तित हो जाएगा, मैं आपको उपयोग करने की सलाह देता हूं convert तो आप दुर्घटना के मामले में मूल रख सकते हैं।


मैंने आपके प्रदान किए गए नमूना पीडीएफ पर कुछ परीक्षण किए हैं। इसने मेरे लिए काफी अच्छा काम किया:

convert -density 200 -compress jpeg -quality 20 test.pdf test2.pdf

घनत्व में चूक होती है 72 डीपीआई। इसे उच्चतर करके हम एक उच्च संकल्प प्राप्त कर सकते हैं और इसलिए स्वीकार्य गुणवत्ता। यह ठीक लग रहा था 150, और थोड़ा छोटा था, लेकिन अगर आप पीडीएफ की एक श्रृंखला के लिए पूरा करना चाहते हैं 200 कार्य करना चाहिए।

JPEG कम्प्रेशन या तो ऑटो एक स्तर चुनना चाहिए या डिफ़ॉल्ट होना चाहिए 92 पैमाने पर 1 सेवा मेरे 100 साथ में 100 सबसे अच्छा होने के नाते। पर स्थापित करना 20, यह लगभग उतना ही अच्छा लगता है जितना मूल (थोड़ा सा फजीर और नीचे का छोटा पाठ पढ़ने में थोड़ा कठिन है, लेकिन यह मूल रूप से वैसे भी था)।

ये विकल्प आपके लाते हैं 1.7 MB नीचे नमूना 0.5MB , जबकि यह पठनीय रखने के लिए। आप थोड़ा प्रयोग कर सकते हैं।

यदि आप एक छोटे आकार (फ़ाइल और छवि / पीडीएफ दोनों) चाहते हैं, तो आप उपयोग कर सकते हैं -resize #%, उदा। -resize 75%। आपके उदाहरण पीडीएफ पर, यह नीचे छोटे प्रिंट को बहुत ज्यादा अपठनीय बनाता है, हालांकि।

यदि आप अभी भी अंतरिक्ष के लिए तंग हैं, विशेष रूप से मल्टीफ़ील्ड पीडीएफ के लिए, आप फ़ाइलों को एक ज़िप (या अन्य) संग्रह में जोड़कर आगे संकुचित कर सकते हैं। यह फ़ाइल आकार को 0.43MB तक नीचे ले आया, उस परीक्षण पीडीएफ पर (जेपीईजी कम्प्रेशन क्वालिटी को कम करने से बहुत अधिक प्रभाव पड़ता है)। आप PDF फ़ाइल को पृष्ठों के साथ विभाजित भी कर सकते हैं pdftk, जैसा @glallen उनके संपादन में सुझाव दिया गया है, या दूसरे छोर पर संग्रह और पुनर्संयोजन को विभाजित करें।

2MB भी एक छोटी सी लगाव सीमा है, आप अन्य ईमेल प्रदाताओं पर गौर करना चाहते हैं। मेमोरी से, GMail प्रति ईमेल पर 10MB प्रदान करता है।

ये विकल्प, और अधिक, पूरी तरह से प्रलेखित हैं उनकी वेबसाइट पर


यह एक उत्कृष्ट दृष्टिकोण की तरह लगता है, लेकिन मुझे नहीं लगता कि मेरे pdfs TIFF समर्थित हैं। CamScanner पहले JPEG फ़ोटो लेता है और फिर उन्हें निर्यात के लिए PDF में परिवर्तित करता है। इन पीडीएफ को संसाधित करना उन्हें कम करना लगता है जैसे कि ब्लॉग पोस्ट इंगित करता है, कोई फर्क नहीं पड़ता। पीडीएफ से टीआईएफएफ में परिवर्तित करना और फिर पीडीएफ में वापस गुणवत्ता को संरक्षित करना प्रतीत होता है लेकिन फ़ाइल का आकार बढ़ा देता है और पृष्ठ आकार और घनत्व को गड़बड़ कर देता है।
Stan

@paganompu जैसा कि मैं समझता हूं, आप फ़ाइल का आकार कम करना चाहते हैं। कैसे के बारे में compressing के रूप में JPEG? कैसे किया resize उपस्थित होना? क्या आपके पास एक (गैर-संवेदनशील) नमूना फ़ाइल है जिसके साथ हम खेल सकते हैं? क्या डाउन-सैंपलिंग स्वीकार्य है?
Bob

JPEG ठीक होता, लेकिन मुझे बहु-पृष्ठ दस्तावेज़ अपलोड करने की आवश्यकता होती है और मुझे प्रति खाता प्रविष्टि में केवल एक लगाव हो सकता है। डाउनसमलिंग गंभीर है: यह परीक्षण दस्तावेज़ अपठनीय है परिवर्तित करने के बाद दोषरहित संपीड़न के साथ।
Stan

@paganompu मैं अपने आप को एक छोटे से प्रयोग किया है, और मैं एक काम कमान के साथ जवाब अद्यतन किया है। देख यहाँ आपकी फ़ाइल पर परीक्षण के लिए।
Bob

यह कमांड एक आकर्षण की तरह काम करता है। मेरा "डाउनसमलिंग" जैसा लगता है कि यह छोड़ने के कारण था density ... मैं कसम खाता हूं कि मैं निर्देश पढ़ सकता हूं और उनका पालन कर सकता हूं! अब थोड़ा शर्मिंदा: एस मुझे बॉब की मदद करने के लिए समय निकालने के लिए धन्यवाद
Stan

17

इसलिए convert ImageMagick से rasterized PDF का उत्पादन होगा और बहुत से लोग वेक्टर ग्राफिक और टेक्स्ट को अछूता रखने में दिलचस्पी लेंगे ताकि केवल एम्बेडेड इमेज ही संपीड़ित हों। तो संपीड़न बनाने के लिए अच्छा विकल्प उपयोग कर रहा है gs पैकेज से ghostscript उपयोग का उदाहरण:

gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook -dNOPAUSE -dQUIET -dBATCH -sOutputFile=out.pdf in.pdf

उपरोक्त कमांड पैरामीटर में: -dPDFSETTINGS=/ebook महत्वपूर्ण है। इसके 3 मान हो सकते हैं:

-dPDFSETTINGS=/screen   (screen-view-only quality, 72 dpi images)
-dPDFSETTINGS=/ebook    (low quality, 150 dpi images)
-dPDFSETTINGS=/printer  (high quality, 300 dpi images)
-dPDFSETTINGS=/prepress (high quality, color preserving, 300 dpi imgs)
-dPDFSETTINGS=/default  (almost identical to /screen)
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.