संक्षेप में:
यह जानने के लिए कि क्या यह पहले से संपीड़ित है:
strings your.pdf | grep /Filter
(एक) एक पीडीएफ सेक करने के लिए, QPDF का उपयोग करें
qpdf --stream-data=compress your.pdf compressed.pdf
qpdf --stream-data=uncompress compressed.pdf uncompressed.pdf
स्पष्टीकरण:
एक पीडीएफ फाइल के अंदर "फ़िल्टर" कीवर्ड उपयोग की गई संपीड़न विधि का एक संकेतक है। उनमें से कुछ हैं:
CCITT G3 / जी -4 - के लिए मोनोक्रोम छवियों का इस्तेमाल
एक हानिपूर्ण एल्गोरिथ्म है कि छवियों के लिए प्रयोग किया जाता है - जेपीईजी
JPEG2000 - जेपीईजी करने के लिए एक और अधिक आधुनिक विकल्प है, जो भी संपीड़ित छवियों के लिए प्रयोग किया जाता है
Flate - साथ ही चित्रों के रूप में पाठ को संपीड़ित करने के लिए इस्तेमाल किया
के लिए एक विकल्प - JBIG2 मोनोक्रोम छवियों
LZW के लिए CCITT संपीड़न - पाठ के साथ-साथ चित्रों को संपीड़ित करने के लिए उपयोग किया जाता है, लेकिन फ्लेट
RLE द्वारा प्रतिस्थापित किया जा रहा है - मोनोक्रोम छवियों के
ज़िप के लिए उपयोग किया जाता है - ग्रेस्केल या रंग छवियों के लिए उपयोग किया जाता है
( यहां से कॉपी की गई )।
हालाँकि, पीडीएफ कॉम्प्लेक्स फ़ाइल संरचना को देखते हुए, पीडीएफ के कुछ भाग (या "स्ट्रीम") में से अधिकांश को पहले से ही किसी तरह से संपीड़ित किया जाएगा (और grepping / फ़िल्टर करते समय दिखाई देगा) जबकि कुछ अन्य हिस्सा नहीं होगा, इसलिए इस सवाल का कोई YES / NO उत्तर नहीं है कि क्या PDF संपीड़ित है।
इसे दूर करने का एक तरीका यह होगा कि -c
विकल्प को grep में जोड़ा जाए , जो घटनाओं की संख्या लौटाता है, इसलिए आप अपेक्षाकृत देख सकते हैं कि यह कितनी अच्छी तरह से संपीड़ित है। उदाहरण के लिए, यदि कम रिटर्न देता है तो 10 यह बहुत गैर-संपीड़ित है।strings
"large
.pdf" | grep -c /Filter
पीडीएफ में आकार से संबंधित एक और संपत्ति यह है कि क्या वे त्वरित पहुंच के लिए अनुकूलित किए गए हैं, "अनुकूलित" पीडीएफ आकार में बड़ा होने के साथ, विकिपीडिया से उद्धृत करने के लिए :
पीडीएफ फाइलों के दो लेआउट हैं- नॉन-लीनियर ("ऑप्टिमाइज़्ड") और लीनियर ("ऑप्टिमाइज़्ड")। गैर-रेखीय पीडीएफ फाइलें अपने रैखिक समकक्षों की तुलना में कम डिस्क स्थान का उपभोग करती हैं, हालांकि वे उपयोग करने के लिए धीमी हैं क्योंकि दस्तावेज़ के पृष्ठों को इकट्ठा करने के लिए आवश्यक डेटा के कुछ अंश पूरे पीडीएफ फाइल में बिखरे हुए हैं। रैखिक पीडीएफ फाइलें (जिसे "अनुकूलित" या "वेब अनुकूलित" पीडीएफ फाइलें भी कहा जाता है) का निर्माण ऐसे तरीके से किया जाता है जो उन्हें पूरी फाइल डाउनलोड करने के लिए इंतजार किए बिना वेब ब्राउज़र प्लगइन में पढ़ने में सक्षम बनाता है, क्योंकि वे डिस्क में लिखे जाते हैं रैखिक (पृष्ठ क्रम में) फैशन। पीडीएफ फाइलें एडोब एक्रोबेट सॉफ्टवेयर या क्यूपीडीएफ का उपयोग करके अनुकूलित की जा सकती हैं।
आप जांच सकते हैं कि पीडीएफ का उपयोग करके अनुकूलित किया गया है या नहीं pdfinfo your.pdf
।
file
। यह दिखाना चाहिए कि फ़ाइल संपीड़ित है या नहीं।