कमांड लाइन का उपयोग करके एक पीडीएफ में एक छवि बदलें


11

मुझे कुछ पीडीएफ फाइलों को संसाधित करने की आवश्यकता है। कार्य में किसी अन्य द्वारा दी गई छवि फ़ाइल का आदान-प्रदान होता है। मेरी पहली समस्या यह है कि एक बैच प्रक्रिया में कमांड लाइन से एक पीडीएफ छवि कैसे बदलें। आगे मैं अन्य समस्याओं को हल करने की कोशिश करूँगा जैसे कि कैसे पहचानें कि मुझे कौन सी छवि बदलने की आवश्यकता है (क्योंकि पीडीएफ फाइलों में एक से अधिक चित्र हो सकते हैं)। लेकिन पहले मैं पहली समस्या को हल करना चाहता हूं: पीडीएफ में एक छवि को दूसरे द्वारा कैसे बदला जाए।

मैंने poppler-utils और pdftk के बारे में पढ़ा है लेकिन जहाँ तक मुझे पता है, इनमें से कोई भी टूल छवियों को PDF में बदलने की अनुमति नहीं देता है।


1
यदि आप एक उत्तर पाते हैं तो यह जानना वास्तव में दिलचस्प होगा। : "समस्या पेज" को अलग करने के बाद आप एक और में छवि डालने और फिर इसे वापस कन्वर्ट पीडीएफ करने के लिए करने के लिए ImageMagick इस्तेमाल कर सकते हैं imagemagick.org/Usage/layers इसके अलावा: superuser.com/questions/614784/...
कोन्सटान्टीनोस

धन्यवाद @pidosaurus मैं इस विकल्प को रोक रहा था, लेकिन इसमें एक बड़ी समस्या है: इसका अर्थ है पीडीएफ (या हस्ताक्षर पृष्ठ) को छवियों में बदलना। यह एक समस्या है क्योंकि परिणामस्वरूप पीडीएफ आकार में बहुत बड़ा होगा और उपयोगकर्ता उदाहरण के लिए कॉपी और पेस्ट करने के लिए पाठ के एक टुकड़े का चयन नहीं कर सकता है।
इवान

लुकअप इमेजमेगिक से रूपांतरित होता है, और भी बहुत कुछ, जो कि ओपनऑफ़िस (अब लिबरेऑफ़िस, वास्तव में) से ऑकवोव प्रदान करते हैं - मैंने एक बार किसी को पीपीटी को पीडीएफ कनवर्टर लिखने के लिए काम पर रखा था और ये उपयोग किए गए उपकरण थे।
गणित

पीडीएफ टूल्स में से कोई भी मुझे नहीं पता है कि ऐसा करने में सक्षम है, लेकिन उस कार्यक्षमता के साथ पीडीएफ लाइब्रेरी का उपयोग करके एक नया टूल लिखना बहुत मुश्किल नहीं होगा। एक समस्या आपको हल करनी होगी कि एक पीडीएफ में किसी विशेष छवि को कैसे निर्दिष्ट किया जाए
दिनांक

जवाबों:


1

ठीक है ... मुझे लगता pdflatexहै कि यहाँ लापता टुकड़ा है।

ओपी ने कहा कि उन्होंने poppler-utilsऔर देखा है pdftk। मुझे इसमें शामिल होने दें pdfimages। ये, एक साथ pdflatexएक समाधान के टुकड़े हैं।

pdfimages -f 4 -l 20 -j -png target.pdf imageroot

ऊपर दिए गए उदाहरण कोड में, pdfimages 20 के माध्यम से पेज 4 के माध्यम से दिखता है target.pdfऔर शुरुआत के नाम वाली सभी छवियों को फ़ाइलों में निकालता है imageroot

poppler-utilsप्रदान करता है pdftotext। मैं उस -layoutविकल्प की सिफारिश करता हूं जो दस्तावेज़ को मानव को पढ़ने योग्य रखने में बहुत अच्छा काम करता है।

pdftotext -layout $1.pdf $1.txt

पिडोसॉरसimagemagick द्वारा प्रस्तुत समाधान के लिए ओपी की आपत्ति यह है कि एक छवि में निकालने योग्य पाठ नहीं है। मेरे द्वारा उल्लिखित उपयोगिताओं के साथ, ओपी में अब सभी छवियां और साथ ही सभी निकाले गए पाठ होंगे, और पृष्ठ संख्या और सामग्री विकल्प द्वारा रखी गई हैं । ओपी पाठ के सही पृष्ठ की पहचान कर सकता है और इसे एक फ़ाइल में चक सकता है जो एक निर्देश के साथ समाप्त होता है और फ़ाइल नाम से प्रतिस्थापन चित्र को संदर्भित करता है। आप इसके बाद और अपने दस्तावेज़ के बाकी हिस्सों में सम्मिलित करने के लिए एक नए सिंगल-पेज .pdf के साथ समाप्त होते हैं । यदि आप जानते हैं कि मूल पृष्ठ के पाठ में छवि कहाँ स्थित है, तो आप चित्र को सही स्थान पर प्राप्त कर सकते हैं ।-layout.tex%includegraphicspdflatexpdftk%includegraphics [h]

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.