कमांड लाइन का उपयोग करके एक पीडीएफ में एक छवि बदलें

मुझे कुछ पीडीएफ फाइलों को संसाधित करने की आवश्यकता है। कार्य में किसी अन्य द्वारा दी गई छवि फ़ाइल का आदान-प्रदान होता है। मेरी पहली समस्या यह है कि एक बैच प्रक्रिया में कमांड लाइन से एक पीडीएफ छवि कैसे बदलें। आगे मैं अन्य समस्याओं को हल करने की कोशिश करूँगा जैसे कि कैसे पहचानें कि मुझे कौन सी छवि बदलने की आवश्यकता है (क्योंकि पीडीएफ फाइलों में एक से अधिक चित्र हो सकते हैं)। लेकिन पहले मैं पहली समस्या को हल करना चाहता हूं: पीडीएफ में एक छवि को दूसरे द्वारा कैसे बदला जाए।

मैंने poppler-utils और pdftk के बारे में पढ़ा है लेकिन जहाँ तक मुझे पता है, इनमें से कोई भी टूल छवियों को PDF में बदलने की अनुमति नहीं देता है।

command-line pdf images

— इवान
स्रोत

यदि आप एक उत्तर पाते हैं तो यह जानना वास्तव में दिलचस्प होगा। : "समस्या पेज" को अलग करने के बाद आप एक और में छवि डालने और फिर इसे वापस कन्वर्ट पीडीएफ करने के लिए करने के लिए ImageMagick इस्तेमाल कर सकते हैं imagemagick.org/Usage/layers इसके अलावा: superuser.com/questions/614784/...

— कोन्सटान्टीनोस

धन्यवाद @pidosaurus मैं इस विकल्प को रोक रहा था, लेकिन इसमें एक बड़ी समस्या है: इसका अर्थ है पीडीएफ (या हस्ताक्षर पृष्ठ) को छवियों में बदलना। यह एक समस्या है क्योंकि परिणामस्वरूप पीडीएफ आकार में बहुत बड़ा होगा और उपयोगकर्ता उदाहरण के लिए कॉपी और पेस्ट करने के लिए पाठ के एक टुकड़े का चयन नहीं कर सकता है।

— इवान

लुकअप इमेजमेगिक से रूपांतरित होता है, और भी बहुत कुछ, जो कि ओपनऑफ़िस (अब लिबरेऑफ़िस, वास्तव में) से ऑकवोव प्रदान करते हैं - मैंने एक बार किसी को पीपीटी को पीडीएफ कनवर्टर लिखने के लिए काम पर रखा था और ये उपयोग किए गए उपकरण थे।

— गणित

पीडीएफ टूल्स में से कोई भी मुझे नहीं पता है कि ऐसा करने में सक्षम है, लेकिन उस कार्यक्षमता के साथ पीडीएफ लाइब्रेरी का उपयोग करके एक नया टूल लिखना बहुत मुश्किल नहीं होगा। एक समस्या आपको हल करनी होगी कि एक पीडीएफ में किसी विशेष छवि को कैसे निर्दिष्ट किया जाए ।

— दिनांक

ठीक है ... मुझे लगता pdflatexहै कि यहाँ लापता टुकड़ा है।

ओपी ने कहा कि उन्होंने poppler-utilsऔर देखा है pdftk। मुझे इसमें शामिल होने दें pdfimages। ये, एक साथ pdflatexएक समाधान के टुकड़े हैं।

pdfimages -f 4 -l 20 -j -png target.pdf imageroot

ऊपर दिए गए उदाहरण कोड में, pdfimages 20 के माध्यम से पेज 4 के माध्यम से दिखता है target.pdfऔर शुरुआत के नाम वाली सभी छवियों को फ़ाइलों में निकालता है imageroot।

poppler-utilsप्रदान करता है pdftotext। मैं उस -layoutविकल्प की सिफारिश करता हूं जो दस्तावेज़ को मानव को पढ़ने योग्य रखने में बहुत अच्छा काम करता है।

pdftotext -layout $1.pdf $1.txt

पिडोसॉरसimagemagick द्वारा प्रस्तुत समाधान के लिए ओपी की आपत्ति यह है कि एक छवि में निकालने योग्य पाठ नहीं है। मेरे द्वारा उल्लिखित उपयोगिताओं के साथ, ओपी में अब सभी छवियां और साथ ही सभी निकाले गए पाठ होंगे, और पृष्ठ संख्या और सामग्री विकल्प द्वारा रखी गई हैं । ओपी पाठ के सही पृष्ठ की पहचान कर सकता है और इसे एक फ़ाइल में चक सकता है जो एक निर्देश के साथ समाप्त होता है और फ़ाइल नाम से प्रतिस्थापन चित्र को संदर्भित करता है। आप इसके बाद और अपने दस्तावेज़ के बाकी हिस्सों में सम्मिलित करने के लिए एक नए सिंगल-पेज .pdf के साथ समाप्त होते हैं । यदि आप जानते हैं कि मूल पृष्ठ के पाठ में छवि कहाँ स्थित है, तो आप चित्र को सही स्थान पर प्राप्त कर सकते हैं ।-layout.tex%includegraphicspdflatexpdftk%includegraphics [h]

— रिचर्ड सोननफेल्ड
स्रोत