एक पीडीएफ फाइल से एक विशिष्ट पृष्ठ हड़पने के लिए कन्वर्ट का उपयोग करें?


21

मुझे पता है कि मैंने पहले भी ऐसा किया है, इसलिए मुझे यकीन है कि यह संभव है, मैं इसे कैसे करना भूल सकता हूं। पीडीएफ के एक विशिष्ट पृष्ठ को हथियाने के लिए कन्वर्ट बताने का एक तरीका है, और मैं उस पृष्ठ के प्रारूप को पीडीएफ के रूप में रखना चाहूंगा।

जवाबों:


24

ImageMagick बिटमैप छवियों के लिए एक उपकरण है, जो अधिकांश PDF नहीं हैं। यदि आप इसका उपयोग करते हैं, तो यह डेटा को अस्थिर करेगा , जो अक्सर वांछनीय नहीं होता है।

Pdftk एक पीडीएफ फाइल से एक या अधिक पेज निकाल सकते हैं।

pdftk A=input.pdf cat A42 A43 output pages_42_43.pdf

यदि आपके पास PDFLaTeX के साथ एक LaTeX इंस्टॉलेशन है, तो आप pdfpages का उपयोग कर सकते हैं । Pdfpages, pdfjam के लिए एक शेल आवरण है ।

pdfjam -o pages_42_43.pdf input.pdf 42,43

एक अन्य संभावना (यहां ओवरकिल, लेकिन आवश्यकताओं के लिए उपयोगी है और अधिक जटिल है कि एक पृष्ठ) PyPdf पुस्तकालय के साथ पायथन है ।

#!/usr/bin/env python
import copy, sys
from pyPdf import PdfFileWriter, PdfFileReader
input = PdfFileReader(sys.stdin)
output = PdfFileWriter()
for i in [42, 43]:
    output.addPage(input.getPage(i))
output.write(sys.stdout)

मैं भी सिफारिश करने वाला था pdftk। आप इसका उपयोग करना चाहेंगे।
सेबस्टियन

pdfjamएक आकर्षण की तरह काम करता है, और पहले से ही मेरे LaTeX वितरण के साथ स्थापित किया गया था। यह इस्तेमाल में बहुत आसान है।
एचडीएल

बहुत बहुत धन्यवाद। निकाला गया पृष्ठ पूर्ण पीडीएफ से बड़ा था, pdftkइसलिए यह केवल एक पृष्ठ को निकालने के लिए प्रतीत नहीं होता है। परिणाम अन्यथा ठीक था।
एरिक डुमिनील

25

आप convert(1)एक पीडीएफ में "इंडेक्स" के साथ सबस्क्रिप्ट नोटेशन का उपयोग कर सकते हैं :

$ convert source.pdf[1] dest.pdf 

सूचकांक मान इस बात पर निर्भर करता है कि पीडीएफ निर्यातक ने पृष्ठों की संख्या कैसे तय की है। यहां फाइलों पर परीक्षणों में, संख्याएं शून्य-आधारित लगती हैं, इसलिए उपरोक्त उदाहरण आपको दस्तावेज़ में दूसरा पृष्ठ मिलता है। मैंने उदाहरणों को ऑनलाइन देखा है जहां वे इसके बजाय पत्र अनुक्रमणिका दिखाते हैं, क्योंकि स्पष्ट रूप से पीडीएफ निर्माता उस दस्तावेज़ के पृष्ठों को "क्रमांकित" करते हैं बजाय इसके कि इस तरह से।

दुर्भाग्य से, यह बहुत अच्छा परिणाम नहीं देता है, क्योंकि ImageMagick सब कुछ पिक्सेल-आधारित है, और इसलिए वेक्टर इमेजरी को रेखापुंज करता है, जैसे कि एक ठेठ पीडीएफ में टाइपोग्राफी।

नौकरी के लिए एक बेहतर उपकरण घोस्टस्क्रिप्ट है , जिसे आपने शायद पहले ही स्थापित कर लिया है:

$ gs -dNOPAUSE -dBATCH -dFirstPage=2 -dLastPage=2 -sDEVICE=pdfwrite \
    -sOutputFile=dest.pdf -f src.pdf

यह PDF डेटा अपरिवर्तित के माध्यम से गुजरता है, क्योंकि घोस्टस्क्रिप्ट पीडीएफ (पोस्टस्क्रिप्ट व्युत्पन्न) को इमेजमैगिक की तुलना में बहुत गहरे स्तर तक समझता है।


2
वास्तव में यह इमेजमैगिक के बारे में सच नहीं है, अगर आप -density पैरामीटर को 300-400 के आसपास किसी चीज़ में सेट करते हैं, तो पीएनजी में पीडीएफ से आउटपुट टेक्स्ट ठीक लगेगा।
बगेडकॉम

2
यह निश्चित रूप से स्क्रीन पर ठीक लगेगा, लेकिन यदि आप प्रिंट करने के लिए जाते हैं, तो आप घनत्व को और भी अधिक सेट करना चाहेंगे। और फिर, आप इस बात से मुश्किल में पड़ सकते हैं कि आपके प्रिंटर का RIP इमेज एंटीमैजिकिंग पिक्सल्स के साथ ImageMagick द्वारा कैसे कॉपी करता है। तो आप अपने प्रिंटर के मूल रिज़ॉल्यूशन पर 1-बिट B & W के आउटपुट के बजाय चुन सकते हैं, जो 1,200 डीपीआई, या 1,440 डीपीआई या कुछ और हो सकता है, और आपको यह जानना होगा कि तेज आउटपुट प्राप्त करने के लिए अग्रिम में। नहीं, मैं अपने बयान से खड़ा होता हूं: पीडीएफ डेटा को यथासंभव वेक्टर रूप में रखना।
वॉरेन यंग

@buggedcom मैंने पाया -density 300है कि मीठा स्थान है। कुछ भी बड़ा और आप बहुत बड़ी अस्थायी फ़ाइलें बना रहे हैं - जो आप शायद वैसे भी थंबनेल के लिए नीचे जा रहे हैं
माइक कॉसर

2
आप पृष्ठों की एक श्रृंखला का चयन भी कर सकते हैं (जैसे कि source.pdf[3-6]
जिफ़
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.