मैं स्कैन की गई PDF फ़ाइल का फ़ाइल आकार कैसे कम कर सकता हूं?


372

मेरे पास 72.9MB की पीडीएफ फाइल है जिसे मुझे 500KB के तहत सिकोड़ने की आवश्यकता है।

फ़ाइल एक JPEG छवि थी जिसे मैंने स्कैन किया था, और फिर पीडीएफ में बदल दिया।


1
यह इस बात पर निर्भर करता है कि अंतरिक्ष की खपत क्या है ... बहुत अधिक जानकारी की आवश्यकता है। छवि स्थान को संपीड़ित करने से मदद मिल सकती है, लेकिन यदि आप एक बड़ी फ़ाइल हीप स्प्रे की कोशिश कर रहे हैं, तो यह काम नहीं करेगा। गंभीरता से अधिक जानकारी की आवश्यकता है।
रोबॉटहैंस

1
इसके बजाय असंभव आकार पीडीएफ (स्रोत के अनुसार) को कम करने की कोशिश कर, DjVu में परिवर्तित करें
zetah

फ़ाइल एक jpeg छवि थी जिसे मैंने स्कैन किया था, और फिर पीडीएफ में बदल दिया।
तमीम

यह केवल थोड़ी सी फाइल को मदद करने के लिए लगता है, लेकिन pdfoptइसमें एक सरल वाक्यविन्यास है और iPad युग में लोडिंग और पेज-टर्निंग गति में सुधार करता है। :-)
एर बी। फ्रीडमैन

1
पीडीएफ पीएस स्कैन की गई पीडीएफ फाइल में प्रभावी नहीं है, मैं 56 एमबी पीडीएफ को पीएस फाइल में बदलने की कोशिश करता हूं, लेकिन पीएस फाइल 1.3 जीबी में बदल जाती है और फिर से ps2pdf 45 एमबी फाइल में परिवर्तित हो जाता है

जवाबों:


145

aking1012 सही है। संभव एम्बेडेड छवियों, हाइपरलिंक आदि के बारे में अधिक जानकारी के साथ .. इस प्रश्न का उत्तर देना अधिक आसान होगा!

यहाँ स्क्रिप्ट और कमांड-लाइन समाधानों के एक जोड़े हैं। जैसा आप फिट देखते हैं वैसे ही इस्तेमाल करें।


15
आपके सुझावों के लिए बहुत-बहुत धन्यवाद, भूतों के खोल ने अद्भुत काम किया और इसे 460KB तक हिला दिया :)
tamimym

यह जरूरी नहीं कि सच हो। यदि सामग्री एक छवि से पाठ में चली गई, तो यह व्यवहार्य से अधिक है। [यह मानकर चल रहा है कि पाठ सटीक रूप से सही है]
भिक्षु

2
मैं आपको संकोचन.श्री स्क्रिप्ट की सलाह देता हूं, आप चाहते हैं कि आप जिस पीपीआई वैल्यू (72 बाय डिफॉल्ट) का उपयोग कर कोड को कस्टमाइज कर सकें और उन फाइलों तक पहुंच सकें जिनकी आपको कम से कम गुणवत्ता का त्याग करने की जरूरत है। इसने मुझे अधिकतम 11 एमबी के स्कैन किए गए दस्तावेज़ अपलोड करने में सक्षम बनाया। बहुत सारी गुणवत्ता खोए बिना 3 एमबी का आकार।
सेवेरो रज़

4
संकोचन काम करता है महान!
अमानीस

2
कहाँ Ghostscript खोल कि ओ पी करने के लिए बात कर रहा है है askubuntu.com/questions/113544/... ?
user13107

519

निम्नलिखित घोस्टस्क्रिप्ट कमांड का उपयोग करें :

gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/screen -dNOPAUSE -dQUIET -dBATCH -sOutputFile=output.pdf input.pdf
  • -dPDFSETTINGS=/screenकम गुणवत्ता, छोटे आकार। ( 72 डीपीआई )
  • -dPDFSETTINGS=/ebookबेहतर गुणवत्ता के लिए, लेकिन थोड़ा बड़ा pdfs। ( 150 डीपीआई )
  • -dPDFSETTINGS=/prepressएक्रोबेट डिस्टिलर के समान आउटपुट "प्रेप्स ऑप्टिमाइज़्ड" सेटिंग ( 300 डीपीआई )
  • -dPDFSETTINGS=/printerएक्रोबेट डिस्टिलर के समान आउटपुट का चयन करता है "प्रिंट ऑप्टिमाइज्ड" सेटिंग ( 300 डीपीआई )
  • -dPDFSETTINGS=/default संभवतया बड़े आउटपुट फ़ाइल की कीमत पर, विभिन्न प्रकार के उपयोगों के लिए उपयोगी आउटपुट का चयन करता है

5
यह स्वीकृत उत्तर होना चाहिए। Ghostscript है पीडीएफ, एक्सपीएस और unices के लिए पी एस कार्यान्वयन और अच्छी गुणवत्ता पहुंचाने मूल रूप से सब कुछ कर सकते हैं ...
dom0

7
@Sina:: वहाँ वास्तव में एक सरल Zenity आधारित जीयूआई है कि इस अपने सभी गुणवत्ता स्तर के विकल्पों के साथ आदेश जी एस का इस्तेमाल करता है के साथ एक नॉटिलस स्क्रिप्ट है launchpad.net/compress-pdf
सादी

36
यह इस प्रश्न का एक सही उत्तर है (पीडीएफ को संपीड़ित करना जो कि ज्यादातर बिटमैप डेटा है)। मैंने पाया कि screenसेटिंग मेरे लिए बहुत कम थी, लेकिन ebookअच्छी तरह से काम करते हुए, 33Mb स्कैन-आधारित पीडीएफ को 3.6Mb तक घटा दिया, और इसे बहुत पठनीय रखा। विकल्प के अन्य विकल्प -dPDFSETTINGSयहां सूचीबद्ध हैं: milan.kupcevic.net/ghostscript-ps-pdf , और उन्हें इस उत्तर में शामिल करना एक अच्छा विचार हो सकता है।
n

5
जीएस उपलब्ध विन्यास पैरामीटर: भूत
विज्ञान.com

3
17.10 को इसने 42 mb pdf से 127 mb :(
चौधरी

156

ऐसा करने का मेरा पसंदीदा तरीका पीडीएफ को पीएस और बैक में बदलना है। यह हमेशा काम नहीं करता है, हालांकि, लेकिन जब यह काम करता है तो परिणाम अच्छे होते हैं:

ps2pdf input.pdf output.pdf

यह भी सीधे पीडीएफ पर काम करता है, जैसा कि टिप्पणियों में सुझाया गया है।

कुछ उपयोगकर्ता ईबुक सेटिंग्स का उपयोग करते समय अधिक सफलता की रिपोर्ट करते हैं:

ps2pdf -dPDFSETTINGS=/ebook input.pdf output.pdf 

4
यह एक बहुत ही सरल और प्रभावी तरीका है। मुझे यह देखकर आश्चर्य हुआ कि इस पद्धति ने फाइलों को कितना संकुचित कर दिया। धन्यवाद!
गेब्रियल

16
इस तथ्य के बावजूद कि यह एक दृष्टिकोण पीडीएफ फाइलों को संपीड़ित करने के लिए मेरा पसंदीदा समाधान बन गया, यह उर लिंक को तोड़ता है जो दस्तावेज़ में हो सकता है (जो @Michael D के दृष्टिकोण के साथ नहीं होता है)। इसके अलावा, awesomeness सब मैं इस स्निपेट को चलाने के बारे में सोच सकता हूं! (:
रुबेंस

1
@ रुबेंस आह। इस तथ्य के बारे में नहीं पता था कि यह यूआरएल लिंक को तोड़ता है। उस जोड़ने के लिए धन्यवाद।
don.joey

3
यह पासवर्ड प्रोटेक्शन को बायपास करता है ... सिर्फ Sayin '
jojo

8
ps2pdf इनपुट के रूप में pdfs लेगा, इसलिए आप इसे एक चरण में कर सकते हैं:ps2pdf intput.pdf output.pdf
frabjous

127

यदि आपके पास स्कैन की गई छवियों के साथ एक पीडीएफ है , तो आप जेपीईजी संपीड़न केconvert साथ एक पीडीएफ बनाने के लिए उपयोग कर सकते हैं (आप किसी भी पीडीएफ पर इस पद्धति का उपयोग कर सकते हैं, लेकिन आप सभी पाठ को ढीला कर देंगे)।

उदाहरण के लिए:

convert -density 200x200 -quality 60 -compress jpeg input.pdf output.pdf

अपनी आवश्यकताओं के लिए घनत्व (जैसे 100x100) और गुणवत्ता समायोजित करें।

अपने इनपुट jpeg संपीड़न के आधार पर संपीड़न कलाकृतियों के कारण सबसे अच्छा विकल्प नहीं हो सकता है। आप वैकल्पिक संपीड़न विधियों के रूप में BZip, फैक्स, Group4, JPEG, JPEG2000, दोषरहित, LZW, RLE या ज़िप के बीच विकल्प है (कुछ केवल बी / डब्ल्यू छवियों की अनुमति)। जानकारी के लिए यहां देखें ।

मैं स्कैन किए गए / फोटोग्राफ किए गए दस्तावेजों (सेटिंग्स के आधार पर) के लिए महान संपीड़न अनुपात प्राप्त करने में सक्षम था। दस्तावेज़ स्रोत के आधार पर, आप रंग की गहराई ( -depthतर्क) को कम करना चाह सकते हैं ।


3
एक स्कैन किए गए दस्तावेज़ के लिए, जहां पाठ वह है जो आप में रुचि रखते हैं, फिर चित्र और गहराई को संरक्षित करना कोई समस्या नहीं है, जेपीआर संपीड़न एक अच्छा विचार नहीं है क्योंकि कलाकृतियां बेहद ध्यान देने योग्य हैं। यदि आप pdfimages input.pdf pagespbm फ़ाइलों को निकालने के लिए उपयोग करते हैं , तो आप कुछ ऐसा कर सकते हैं for page in *.pbm; do convert $page -compress Group4 -type bilevel TIFF:- | convert - output.pdf:। कोई ओसीआर खो जाएगा इसलिए मैं आमतौर पर करता हूं pdfsandwich output.pdf, जो आगे भी फ़ाइल आकार को कम करने के लिए लगता है।
ब्रायन जेड

1
@BranZ यकीन है कि jpeg संपीड़न हमेशा सबसे अच्छा विकल्प नहीं है, लेकिन मेरे लिए यह मिश्रित प्रकार के दस्तावेजों के लिए सबसे अच्छा तरीका था। मैंने उत्तर में अन्य संपीड़न विधियों के बारे में कुछ जानकारी जोड़ी।
someonr

2
यह विधि अंततः gsपर्दे के पीछे उपयोग करती है।
alfC

2
मुझे कमांड --density --quality --compressबनाम चलाने के विकल्पों के लिए डबल डैश का उपयोग करना था -density -quality -compress
रोटेरेटी

1
अगर इमेज qaulity सबसे ज्यादा चिंता का विषय नहीं है (और आप बस इतना ही चाहते हैं कि डिटेल ईमेल अटैचमेंट को छोटा भेजा जाए) तो कोई भी जोड़ सकता -resize 50%है, स्कैन करते समय कितना डीपीआई का इस्तेमाल किया गया है, इस पर निर्भर करता है
chrki

41

मुझे एक पीडीएफ को डाउनसाइज़ करने की ज़रूरत थी जिसमें एक दस्तावेज़ का पूर्ण रंग स्कैन शामिल था। जहाँ तक फ़ाइल की बात है, मेरा हर पेज एक पूर्ण रंग की छवि था। वे पाठ और छवियों वाले पृष्ठों की छवियां थीं, लेकिन वे एक छवि को स्कैन करके बनाए गए थे।

मैंने नीचे दिए गए घोस्टस्क्रिप्ट कमांड के संयोजन का उपयोग किया और एक दूसरे धागे से।

gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dDownsampleColorImages=true \
-dColorImageResolution=150 -dNOPAUSE  -dBATCH -sOutputFile=output.pdf input.pdf

इसने छवि के रिज़ॉल्यूशन को घटाकर 150dpi कर दिया, जिससे मेरी फ़ाइल का आकार आधा हो गया। दस्तावेज़ को देखते हुए, छवि गुणवत्ता का लगभग कोई ध्यान देने योग्य नुकसान नहीं था। मेरे 2012 Nexus7 पर पाठ अभी भी पूरी तरह से पठनीय है।


3
+1 नमूना छवियों के लिए लेकिन वैक्टर के रूप में पाठ रखते हुए। मेरे पाठ को पिक्सेल किए बिना पक्ष में बहुत बड़ा अंतर लाया।
जेसन ओ'नील

बढ़िया है कि एक कर सकते हैं धुन इस आदेश के साथ संकल्प - यह मेरे dPDFSETTINGS = \ स्क्रीन बस का उपयोग करने से बेहतर परिणाम दे दी है
विनिमय

29

यहाँ पुन: स्कैन किए गए पीडीएफ़ के लिए एक स्क्रिप्ट है :

#!/bin/sh

gs  -q -dNOPAUSE -dBATCH -dSAFER \
    -sDEVICE=pdfwrite \
    -dCompatibilityLevel=1.3 \
    -dPDFSETTINGS=/screen \
    -dEmbedAllFonts=true \
    -dSubsetFonts=true \
    -dColorImageDownsampleType=/Bicubic \
    -dColorImageResolution=72 \
    -dGrayImageDownsampleType=/Bicubic \
    -dGrayImageResolution=72 \
    -dMonoImageDownsampleType=/Bicubic \
    -dMonoImageResolution=72 \
    -sOutputFile=out.pdf \
     $1

आप इसे और अधिक पुन: प्रयोज्य बनाने के लिए इसे थोड़ा अनुकूलित कर सकते हैं लेकिन यदि आपके पास केवल एक पीडीएफ है, तो आप बस $1अपने पीडीएफ फाइलनाम के साथ बदल सकते हैं और इसे एक टर्मिनल में बांध सकते हैं।


1
एक उपचार का काम करता है, धन्यवाद ओली। आपने यहाँ अब तक जो कुछ भी पूछा है, उसका आपने बहुत अधिक उत्तर दिया है :-D
रोब कॉवेल

यह एक अच्छा जवाब है, लेकिन मेरे मामले में कम से कम कुछ हद तक बड़ी (> 10Mb) पीडीएफ फाइल (एक मिनट से अधिक) में बदलने में बहुत समय लगता है ।
गेब्रियल

मुझे यकीन नहीं है कि क्या होता है, लेकिन एक 30 एमबी पीडीएफ एक 68 एमबी फ़ाइल का परिणाम है। कम करने के बजाय, यह विस्तार करता है। समान उत्पादन अगर अगले उत्तर में बताए अनुसार सीधे ps2pdf का उपयोग कर रहा है।
एड विलेगस

@EdVillegas केवल एक चीज जो मैं सोच सकता हूं (उस तरह की वृद्धि को समझाने के लिए) यह है कि छवियां उत्पन्न होने (72dpi) की तुलना में कम रिज़ॉल्यूशन की हैं। या किसी भी तरह फोंट एम्बेड करने में चूसने है सभी फोंट।
ओली

21

मैं आमतौर पर ऐसा करने के लिए ps2pdf का उपयोग करता हूं (आसान सिंटैक्स), कुछ इस तरह से:

ps2pdf -dPDFSETTINGS=/ebook BiggerPdf SmallerPDF

मैं एक उत्पादन सर्वर (8.04) में एक डीआईआर में सभी पीडीएफ फाइलों के आकार को कम करने के लिए निम्नलिखित पायथन स्क्रिप्ट का उपयोग करता हूं। तो यह काम करना चाहिए।

#!/usr/bin/python

import os

for fich in os.listdir('.'):
        if fich[-3:]=="pdf":
                os.system("ps2pdf -dPDFSETTINGS=/ebook %s reduc/%s" % (fich,fich))

वैकल्पिक समाधान के लिए धन्यवाद। मैंने ओली की पहली कोशिश की और इसने मुझे वह परिणाम दिया जिसकी मुझे आवश्यकता थी, लेकिन मैं इसे भविष्य के संदर्भ के लिए भी रखूंगा।
रोब काउल

1
-dPDFSETTINGS = / प्रिंटर विकल्प 50% का आकार परिवर्तन करते हैं। ईबुक 90% का आकार परिवर्तन करता है।
नेउघुर

17
  1. मैं पीडीएफ खोलने के लिए लिब्रे ऑफिस ड्रा का उपयोग करता हूं ।
  2. मैं तो "पीडीएफ के रूप में निर्यात"
  3. और "jpeg संपीड़न गुणवत्ता" को 50% और "छवि रिज़ॉल्यूशन" को 150 डीपीआई पर सेट करें

इसका अच्छा परिणाम होगा।


समस्या का सबसे खराब संभव समाधान! यह पूरी तरह से मेरी फ़ाइल गड़बड़!

9

मेरे लिए बेस्ट था

convert -compress Zip -density 150x150 input.pdf output.pdf

दूसरा तरीका:

#### gs
gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook -dNOPAUSE -dQUIET -dBATCH -sOutputFile=output.pdf $INPUTFILE

### pdf2ps && ps2pdf
pdf2ps input.pdf output.ps && ps2pdf output.ps output.pdf

### Webservice
http://compress.smallpdf.com/de

सादर


महान समाधान। याद रखने में आसान है और इसने मेरे पीडीएफ को 32 से 3.5 एमबी तक पठनीयता में समझदार नुकसान के बिना लाया है।
इमैनुएल वेइनाचटेन

मुझे दूसरा तरीका पसंद आया pdf2ps input.pdf temp.ps && ps2pdf14 temp.ps output.pdf && rm temp.ps
मैकपीपर

5

मुझे सिर्फ इस समस्या का सामना करना पड़ा। यदि साधारण स्कैन का उपयोग करते हैं, तो कम रिज़ॉल्यूशन स्कैन के लिए टेक्स्ट मोड का चयन करें और आपको कमांड लाइन के सामान के बारे में चिंता करने की आवश्यकता नहीं होगी। बस केह रहा हू।


1
इस सूत्र में यही एक उत्तर है जिसने मेरी समस्या को हल किया। मैंने सिम्प्स्कैन को हटा दिया, लेकिन यह वास्तव में मेरे लिए जवाब था, बजाय एक अंतहीन सद्भाव के लगने वाले एक्ससेन के खिलाफ लड़ने के बजाय।
छंद

4

संपीड़न गुणवत्ता को नियंत्रित करें:

#!/bin/sh
INPUT=$1; shift
OUTPUT=$1; shift
GS_BIN=/usr/bin/gs
QFACTOR="0.40"

# Image Compression Quality
#
# Quality HSamples VSamples QFactor
# Minimum [2 1 1 2] [2 1 1 2] 2.40
# Low     [2 1 1 2] [2 1 1 2] 1.30
# Medium  [2 1 1 2] [2 1 1 2] 0.76
# High    [1 1 1 1] [1 1 1 1] 0.40
# Maximum [1 1 1 1] [1 1 1 1] 0.15 

${GS_BIN} -dBATCH -dSAFER -DNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile=${OUTPUT} -c "<< /ColorImageDict << /QFactor ${QFACTOR} /Blend 1 /HSample [1 1 1 1] /VSample [1 1 1 1] >> >> setdistillerparams" -f ${INPUT}

... तो INPUT और OUTPUT दोनों एक ही तर्क हैं? आप उपयोग दिशानिर्देश जोड़ना चाह सकते हैं।
mikewhatever

2
ध्यान दें shift। पहला पैरामीटर इनपुट फ़ाइल है, दूसरा आउटपुट फ़ाइल है और बाकी पैरामीटर को उसी gsरूप में पास किया जाएगा ।
मिको रानाल्टेन

मुझे लगता है कि आप चाहते हैं / HSample s और / VSample s , न कि / HSample और / VSample। उदाहरण के लिए ps2pdf डॉक्स या पोस्टस्क्रिप्ट भाषा संदर्भ मैनुअल देखें। शायद यह भी ध्यान देने योग्य है कि अनुमत QFactor रेंज 0 से 1,000,000 है और कम मूल्य उच्च गुणवत्ता का उत्पादन करते हैं।
पॉन्ट

3

चूंकि यह लिंक मेरे लिए पहली बार था जब मैंने Google में खोज की थी, मैंने सोचा था कि मैं एक और संभावना जोड़ूंगा। ऊपर दिए गए समाधानों में से कोई भी मेरे लिए इंकस्केप (15 एमबी) से निर्यात किए गए एक पीडीएफ पर काम नहीं कर रहा था, लेकिन मैं इसे जीआईएमपी में खोलकर और फिर से पीडीएफ के रूप में निर्यात करके इसे 1 एमबी तक नीचे करने में सक्षम था।

एक अन्य विकल्प जो करीब आया (लेकिन पाठ थोड़ा अस्पष्ट था) ImageMagick की कन्वर्ट यूटिलिटी थी:

convert -compress Zip input.pdf output.pdf

मुझे लगता है कि यह आपका मतलब है "थोड़ा फजी", लेकिन सिर्फ स्पष्ट करने के लिए, convert -compress Zipसभी वैक्टर को रोकना दिखाई दिया।
गौरव

3

अंत में मैंने इसे हल करने के लिए अपनी स्वयं की बैश स्क्रिप्ट लिखी, यह उपयोग करता है mogrify, convertऔर gsपीएनजी के रूप में पीडीएफ पृष्ठों को निकालने के लिए, उनका आकार बदलें, उन्हें 1-बिट बीएमपी में बदलें और फिर उन्हें पीडीएफ के रूप में पुनर्निर्माण करें। फ़ाइल आकार में कमी 90% से अधिक हो सकती है। Http://www.timedicer.co.uk/programs/help/pdf-compress.sh.php पर उपलब्ध है ।


3

मैं दृढ़ता से pdfsizeopt की सलाह देता हूं

यह पिछले CLI और जीयूआई सॉफ़्टवेयर के किसी भी है कि मैं कोशिश की है की तुलना में आकार में कमी (सहित के मामले में और अधिक कुशल है convert, gs, pdftkहालांकि संभवतः के साथ धीमी -, आदि) pngoutसक्रिय -, और उनके मुद्दों में से कुछ (कोई भारी नहीं है पिक्सेलयुक्त / अपमानित चित्र, बुकमार्क का कोई नुकसान नहीं, आदि)।

अब, यदि आपको एक निश्चित आकार प्राप्त करने की आवश्यकता है, तो परिणाम जो भी हो (अप्रभावितता के एक बिंदु पर छवि को अपमानित करना), यह आपके लिए आवश्यक उपकरण नहीं हो सकता है, लेकिन हमेशा की तरह काम करने वाले समाधान के रूप में, अनावश्यक बड़े आकारों को कम करने के लिए पीडीएफ में पठनीयता, जानकारी और स्वीकार्य छवि गुणवत्ता में कमी के बिना, मुझे लगता है कि यह सबसे अच्छा विकल्प है। (नोट: Adobe Acrobat [फ़ंक्शन को "CleanScan" कहा जाता था], जिसमें कुछ स्कैन किए गए टेक्स्ट दस्तावेज़ों पर एक नाटकीय आकार का प्रभाव हो सकता है।


मैं सामान्य यूनिक्स स्थापित करने की सलाह देता हूं :

  1. सभी आवश्यक निर्भरताएं स्थापित करें:

  2. डाउनलोड करें और निष्पादन योग्य स्थापित करें:

    curl -L -o https://raw.githubusercontent.com/pts/pdfsizeopt/master/pdfsizeopt.single
    cp pdfsizeopt.single /usr/local/bin/pdfsizeopt
    

उपयोग:

pdfsizeopt original.pdf [compressed.pdf]

इस पोस्ट को खोजने वाले मैक उपयोगकर्ताओं के लिए ध्यान दें (या लिनक्सब्रेव यूजर्स): एक होमब्रे इंस्टॉल फॉर्मूला है:

brew install --HEAD pts/utils/pdfsizeopt

2

मैं उसी समस्या का सामना कर रहा था, और मुझे इस धागे को पाकर खुशी हुई। विशेष रूप से मेरे पास स्कैन की गई छवियों से उत्पन्न एक पीडीएफ था, और 6 के कारक द्वारा इसके बाइट के आकार को कम करने की आवश्यकता थी।

दुर्भाग्य से, ऊपर दिए गए समाधानों में से किसी ने भी काम नहीं किया :( लेकिन पीडीएफ का आकार था

identify -verbose doc_orig.pdf | grep "Print size"
 Print size: 35.4167x48.7222

मुझे अंततः एक "कन्वर्ट" कमांड के साथ वांछित परिणाम मिला, जो दोनों के आकार बदलने के साथ-साथ एक में संपीड़न कदम भी था:

convert -density 135x135 -quality 70 -compress jpeg -resize 22.588% doc_orig.pdf doc_lowres.pdf

ध्यान दें कि doc_orig का घनत्व 72x72 dpi था।


1

यदि djvu में परिवर्तित करना भी ठीक होगा और यदि कोई रंग शामिल नहीं हैं, तो आप निम्नलिखित प्रयास कर सकते हैं:

पीडीएफ का उपयोग कर jpg फ़ाइलों में कनवर्ट करें pdfimages -j

यदि आपको इसके बजाय pbm फाइलें मिलती हैं, तो आपको मध्यवर्ती चरण करना चाहिए:

for FILENAME in $(ls *.pbm); do convert $FILENAME ${FILENAME%.*}.jpg ;done

कन्वर्ट कमांड इमेजमैजिक पैकेज से है।

फिर इससे बाहर निकालने के लिए scantailor का उपयोग करें ।

एक अंतिम चरण में आप direcory (जहां tif स्थित हैं) के बाहर जाते हैं और उस निर्देशिका में djvubind लागू करते हैं

इससे पाठ की बड़ी गुणवत्ता के नुकसान के बिना फ़ाइलों को काफी कम करना चाहिए। यदि आप ocr-backend पर महीन नियंत्रण चाहते हैं, तो आप कोशिश कर सकते हैं djvubind --no-ocrऔर बाद में ocr परत को जोड़ने के लिए ocrodjvu का उपयोग कर सकते हैं ।

यदि आपके रंग में रंग है तो चीजें थोड़ी और जटिल हो जाती हैं। इसके बजाय djvubind आप इस्तेमाल कर सकते हैं didjvu और scantailor में आप मिश्रित मोड को बदल सकते हैं और मैन्युअल रूप से कभी कभी रंग-छवियों का चयन करने के लिए है।


1

लोड छवि या यहां तक ​​कि पीडीएफ फाइल को इंकस्केप में।

इंकस्केप से: वेक्टर फॉर्मेट में (मूल .svg के रूप में) सेव करें।

वेक्टर फ़ाइलों को स्क्रिबस में आयात करें, लेआउट संपादित करें और वहां से .pdf के रूप में निर्यात / सहेजें


0

सुपर सरल पीडीएफ सेक उपकरण: GitHub पेज।

उबंटू पर स्थापना:

sudo add-apt-repository ppa:jfswitz/released

sudo apt-get update

sudo apt-get install pdf-compressor

यह भूत-प्रेत का उपयोग करता है।


0

आप यह कोशिश कर सकते हैं:

$ time pdftk myFile.pdf output myFile__SMALLER.pdf compress
GC Warning: Repeated allocation of very large block (appr. size 16764928):
    May lead to memory leak and poor performance.
GC Warning: Repeated allocation of very large block (appr. size 8384512):
    May lead to memory leak and poor performance.
GC Warning: Repeated allocation of very large block (appr. size 11837440):
    May lead to memory leak and poor performance.
GC Warning: Repeated allocation of very large block (appr. size 8384512):
    May lead to memory leak and poor performance.
GC Warning: Repeated allocation of very large block (appr. size 33525760):
    May lead to memory leak and poor performance.
GC Warning: Repeated allocation of very large block (appr. size 7254016):
    May lead to memory leak and poor performance.
GC Warning: Repeated allocation of very large block (appr. size 34041856):
    May lead to memory leak and poor performance.
GC Warning: Repeated allocation of very large block (appr. size 33525760):
    May lead to memory leak and poor performance.

real    0m23.677s
user    0m23.142s
sys     0m0.540s
$ du myFile*.pdf
108M    myFile.pdf
74M     myFile__SMALLER.pdf

यह gs107.5MiB इनपुट फ़ाइल के लिए इस मामले में 30% तक की तुलना में अधिक तेज़ है ।


0

मेरे लिए gs screenविकल्प बहुत बुरा था, और ebookएक बहुत बड़ा था।

मेरे मूल दस्तावेज़ में रंग और काले और सफेद चित्र (पृष्ठ के आधार पर) के रूप में पाठ था।

सबसे अच्छा समाधान जो मैं आया था वह है:

gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dDownsampleColorImages=true -dDownsampleGrayImages=true -dDownsampleMonoImages=true -dColorImageResolution=130 -dGrayImageResolution=130 -dMonoImageResolution=130 -r130 -dNOPAUSE  -dBATCH -sOutputFile=output_lr.pdf input.pdf

ध्यान दें कि संपीड़न स्तर रैखिक नहीं है .. अगर मैं 135 को निर्दिष्ट कर रहा था तो यह संपीड़ित नहीं हुआ, मैंने 130 (मेरे मामले में) अधिकतम रिज़ॉल्यूशन पाया जो संपीड़न प्राप्त करता है।


-1

मैं नीचे दिए गए आदेशों का उपयोग करता था, लेकिन यह मेरी पीडीएफ फाइल को पर्याप्त रूप से संपीड़ित नहीं करता था। कुछ समय संपीड़न के बाद कुछ हिस्से को काला कर दिया गया था।

  1. gs -sDEVICE=pdfwrite -dCompatibilityLevel=1.4 -dPDFSETTINGS=/ebook -dNOPAUSE -dQUIET -dBATCH -sOutputFile=output.pdf $INPUTFILE

  2. "ps2pdf -dPDFSETTINGS=/ebook %s %s" % (input_file_path, out_file_path)

वेब पर बहुत ज्यादा भटकने के बाद मुझे सही कंप्रेशन लाइब्रेरी नहीं मिली। मैं भर आया pdfcompressor.com। यह सिर्फ कमाल की वेबसाइट है। यह 95% (फ़ाइलों की 15 एमबी) पीडीएफ को संपीड़ित करता है। इसलिए मैंने सम्पीडन को स्वचालित करने के लिए सेलेनियम और टॉर का उपयोग किया। मेरे गितुब रिपोजिटरी को चेकआउट करें। [GITHUB] ( https://github.com/gugli28/PdfCompressor )

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.