एक पीडीएफ से एम्बेडेड छवियों को निकालना


165

इससे पहले कि मैं उबंटू का उपयोग करना शुरू करूं, मैंने पीडीएफ फाइलों से छवियों को स्वचालित रूप से निकालने के लिए नाइट्रो पीडीएफ रीडर का उपयोग किया। क्या लिनक्स के लिए एक पीडीएफ रीडर है जो ऐसा करता है?

मैं स्नैपशॉट लेते समय की तुलना में तेज़ी से / आसान चित्र निकालने में सक्षम होना चाहूंगा।


क्या आप याद कर सकते हैं कि NitroPDF वेक्टर इमेज के साथ कितना अच्छा कर सकता है? क्या pdfimagesयह NitroPDF से बेहतर / वर्जन कर सकता है?
लेओ लेपोल्ड हर्ट्ज़ '


2
@ कायरता-भविष्य स्पष्ट रूप से दो प्रश्न डुप्लिकेट हैं, लेकिन आपके डुप्लिकेट लक्ष्य के केवल दो उत्तर हैं और इन दो उत्तरों में से एक एक स्पैम उत्तर है, इसलिए इस प्रश्न को डूप हथौड़ा द्वारा अंकित होने से बचाने के लिए दोहराव की दिशा को उलट दिया जाना चाहिए।
कारेल

जवाबों:


196

उपयोग pdfimages

pdfimages एक पीडीएफ इमेज एक्सट्रैक्टर टूल है जो छवियों को पीपीएम, पीबीएम, जेपीईजी या जेपीईजी 2000 फाइल (एस) प्रारूप में एक पीडीएफ फाइल में बचाता है।

यह poppler-utilsपैकेज का एक हिस्सा है , जिसे आपको इंस्टॉल करना होगा।

उपयोग: pdfimages [options] <PDF-file> <image-root>

उदाहरण: निम्नलिखित सभी छवियों को एक पीडीएफ फाइल से निकालता है, उन्हें जेपीईजी प्रारूप में सहेजता है।

pdfimages -j in.pdf /tmp/out

in.pdfफाइलों में पीडीएफ फाइल से छवियों को बचाएगा /tmp/out-000.jpg(या /tmp/out-000.pbm; नीचे देखें) /tmp/out-001.jpg, आदि।


Pdfimages मैन पेज बताते हैं:

-j:  Normally, all images are written as PBM (for monochrome images) or PPM for
     non-monochrome images) files. With this option,  images in DCT format are
     saved as JPEG files. All non-DCT images are saved in PBM/PPM format as usual.

8
एक समाधान करना अच्छा होगा जो छवियों को अपने मूल प्रारूप में निकालता है। जेपीईजी पुन: एन्कोडिंग वास्तव में आदर्श नहीं है।
क्रिश्चियन

32
@ मैन पेज से -all Write JPEG, JPEG2000, JBIG2, and CCITT images in their native format. CMYK files are written as TIFF files. All other images are written as PNG files. This is equivalent to specifying the options -png -tiff -j -jp2 -jbig2 -ccitt.
क्रिसियन

2
कृपया ध्यान दें कि -allस्विच केवल हाल ही के पॉपलर-यूटिलिटी रिविजन में समर्थित है। उदाहरण के लिए, यदि आप अभी भी 12.04 पर हैं तो आप इस विकल्प तक नहीं पहुँच पाएंगे
Glutanimate

1
यदि आप -allPNM प्रारूप के लिए नहीं जा सकते हैं। वे दोषरहित हैं, और आप छवियों को पीएनजी में पोस्टप्रोसेस कर सकते हैं।
टॉमस गैंडर

1
@ क्रिसियन, $ pdfimages -list <PDF-file>"एनकाउंटर" कॉलम में मूल प्रारूप की जांच करने के लिए उपयोग करें, ताकि आपको छवि को दूसरे प्रारूप में फिर से एनकोड न करना पड़े।
जोस बराकैट

24

मैं अक्सर इसके लिए इंकस्केप का उपयोग करता हूं। पृष्ठ लोड करें, और अन्य सभी सामग्री हटा दें। लाभ यह है कि आप एसवीजी में वेक्टर चित्र प्राप्त कर सकते हैं और जैसे ही आप चुनते हैं, उन्हें संशोधित कर सकते हैं।


कुछ PDF को केवल Inkscape आंतरिक आयात (poppler / cairo आयात या PDFimage ठीक से पार्स नहीं कर सकता) के साथ ठीक से आयात किया जा सकता है। आयात होने के बाद, एक नई फ़ाइल में कॉपी और पेस्ट छवि और करने के लिए चयन पृष्ठ का आकार बदलने के graphicdesign.stackexchange.com/a/21638/95041
sdaffa23fdsf

मेरे लिए कोई समस्या नहीं, यह सबसे अच्छा समाधान था, ध्यान दें कि आपको एक समय में एक पृष्ठ चुनना होगा!
जिमी ओलानो

5

मेरे पास एक डबल-कॉलम पीडीएफ फाइल है जिसमें एलएटीएक्स के साथ बनाई गई एम्बेडेड छवियां हैं जहां मूल छवियां ईपीएस के रूप में प्रदान की गई थीं। मैंने प्रस्तावित समाधान के आधार पर प्रयास किया pdfimages, लेकिन दुर्भाग्य से, इसने किसी भी चित्र को वापस नहीं किया। मैंने तब Inkscape का उपयोग करने की कोशिश की, लेकिन इसके द्वारा बनाई गई SVG छवियां विकृत थीं और मेरे पास उन्हें EPS के रूप में निर्यात करने का कोई सौभाग्य नहीं था।

सॉफ्टवेयर है कि हम के लिए काम किया MasterPdfEditor था ।

यहाँ प्रक्रिया है

  • मास्टर पीडीएफ संपादक का उपयोग करके अपनी फ़ाइल खोलें
  • उस छवि का चयन करने के लिए संपादन टूल (Alt + 1) का उपयोग करें जिसे आपको निकालने की आवश्यकता है
  • आंकड़ा कॉपी करें (Ctrl + C)
  • छवि के चारों ओर स्थित धराशायी फ्रेम पर क्लिक करें और दाईं साइडबार (ऑब्जेक्ट इंस्पेक्टर) की जांच करें और "जियोमार्टी" पर क्लिक करें। वहां आप अपने चयन का आकार देख सकते हैं
  • एक नई फ़ाइल बनाएँ (Ctrl + N)। यह आपको पृष्ठ आकार प्रदान करने के लिए संकेत देगा। अपनी छवि का सटीक आकार प्रदान करें और नई फ़ाइल बनाएं
  • अब यह थोड़ा मुश्किल है: छवि पेस्ट करें (Ctrl + V)। छवि नई फ़ाइल में नहीं दिख सकती है। इसे स्थानांतरित करने के लिए तीर का उपयोग करें जब तक आप इसे ट्रेस करने में सक्षम न हों।
  • नए पृष्ठ में छवि को केंद्रित करने के लिए तीरों का उपयोग करें
  • PDF के रूप में सहेजें

परिणाम बहुत उच्च गुणवत्ता का है, लेकिन सॉफ्टवेयर नि: शुल्क नहीं है। एक डेमो संस्करण है जो "आपको सभी सुविधाओं को आज़माने की अनुमति देता है," लेकिन "आउटपुट फ़ाइल पर वॉटरमार्क के अतिरिक्त" के साथ आता है। फ्रैंक होने के लिए, मैंने उत्पादित पीडीएफ में कोई वॉटरमार्क नहीं देखा।


यह पूछें उबंटू है ... हमें यहां खुला स्रोत पसंद है और आपका समाधान एक बंद-स्रोत वाणिज्यिक समाधान है ... यह कैसे बेहतर है फिर पहले से ही उत्कीर्ण उत्तर? (
-अर्थात

3
@ फैबी आपकी प्रतिक्रिया के लिए धन्यवाद। मैं इसके बारे में नहीं जानता था। क्या askubuntu.com पर ऐसा कोई नियम है? हालांकि, जैसे ही आप उबंटू सॉफ्टवेयर सेंटर खोलते हैं , आपको गैर-मुक्त अनुप्रयोगों के लिए सुझाव मिलते हैं।
पैंतालिस सोपाकिसिस

नहीं, कोई "नियम" नहीं है और यही कारण है कि मैंने इस उत्तर को हटाने के लिए मतदान नहीं किया, लेकिन ऐसे बेहतर उपकरण हैं जो मुफ़्त हैं (जैसा कि मुफ्त बीयर और मुफ्त भाषण में) इसलिए यह केवल एक राय है।
फाबबी

1
+1। मैंने ImageMagick कमांड-लाइन का उपयोग किया है, लेकिन यह किसी GUI की तलाश करने वाले व्यक्ति के लिए एक दिलचस्प समाधान है।
rpmcruz

2
यह कुछ लोगों के लिए काम करता है, यह काफी अच्छा है। नाज़ी मत बनो .... मैं नहीं जानता कि "हम" कौन हैं। आप सिर्फ अपने लिए बोल सकते हैं। उत्तर के लिए +1
sdaffa23fdsf

4

आप pdfmod भी आज़मा सकते हैं। यह एक जीयूआई (ग्राफिकल इंटरफ़ेस) है जो छवियों को निकाल सकता है और अन्य बुनियादी पीडीएफ हेरफेर कर सकता है।


हम्म, मुझे लगता है कि छोटी गाड़ी है। मुख्य रूप से वायलेट छवियों के साथ एक पीडीएफ डाला और हरे रंग की छवियों को मिला।
DBX12

2

यदि आपको पीडीएफ / ईपीएस प्रारूप में एक फसली छवि की आवश्यकता है, तो छवि का उपयोग करके एक पृष्ठ निकालें pdfmod(जैसा कि डू से सुझाव दिया गया है)।

फिर pdfcropआप परीक्षण और त्रुटि के द्वारा मार्जिन को ठीक से सेट करके इसका उपयोग कर सकते हैं:

pdfcrop --margins "-15 -50 0 -140" extracted_page.pdf

1

मैं pdfimages का उपयोग करता हूं जो एक कमांड लाइन टूल है और यह मेरे लिए बहुत अच्छा काम करता है। इसका उपयोग करना बहुत आसान है और इसके उपयोग के बारे में अधिक जानने के लिए आप --help विकल्प का उपयोग कर सकते हैं। मैं Ubuntu का उपयोग करता हूं और यह पहले से इंस्टॉल आता है। यदि आपकी पीडीएफ फाइलें एन्क्रिप्ट की गई हैं या पासवर्ड संरक्षित है तो उसके लिए विकल्प हैं, इसलिए यह टूल बहुत अच्छा काम करता है। आप यहाँ pdfimages के बारे में अधिक पढ़ सकते हैं


4
अपना पोस्ट करने से पहले कृपया अन्य उत्तर पढ़ें। सूचना वहाँ है जो इसे कवर करती है।
एडविन

ओके, सॉरी :) मुझे मेरा पोस्ट करना अच्छा लगा क्योंकि इसमें पासवर्ड प्रोटेक्टेड पीडीएफ फाइलों के बारे में कुछ जानकारी है और मैं समझाता हूं कि इस टूल में यह विकल्प हैं, साथ ही मैंने एक लिंक पोस्ट किया है जो इस टूल के बारे में एक ट्यूटोरियल है।
जेटबर्ड

यदि आप पर्याप्त प्रतिष्ठा हासिल करते हैं, तो आप दूसरे के उत्तरों पर टिप्पणी कर सकते हैं या उन्हें आगे बढ़ा सकते हैं।
एडविन

1

Pdfimages के साथ निकाली गई छवि दो या अधिक भागों में हो सकती है। निकाले गए स्वरूपों के बारे में कोई चिंता नहीं के साथ उन्हें फिर से एक साथ रखने का एक सरल तरीका है, लिबर ऑफिस ड्रा में भागों को आयात करना, छवि फसल संवाद के साथ फसल, भागों की स्थिति, पृष्ठ का आकार समायोजित करना और जो भी प्रारूप आपको पसंद है उसमें निर्यात करना।


1

यदि आप एक पीडीएफ से एक छवि को PDFviewer से क्रॉप करना चाहते हैं, तो आप ओकुलर ट्राई कर सकते हैं। यह कुछ भी (ग्रंथों या चित्रों) को पीएनजी या जेपीईजी प्रारूप में काट सकता है। यदि आप pdf से png प्रारूप में चित्र निकालना चाहते हैं, तो आप इसे pdftohtml के साथ न्यूनतम कमांड के साथ कर सकते हैं। यह pdf को html plus images में कनवर्ट करता है। यहां आप एक उदाहरण पा सकते हैं - https://www.youtube.com/watch?v=CG1rf7k3xo8 । यदि आप एक पीडीएफ से कई छवियां निकालना चाहते हैं, तो मैं आपको यह कोशिश करने का सुझाव देता हूं।


0

सॉफ्टवेयर का इस्तेमाल किया: एक्स्रीडर ओएस: एन्टरगोस

कदम:

  1. पीडीएफ खोलें
  2. छवि पर राइट क्लिक करें
  3. सहेजें छवि के रूप में चुनें ..
  4. इनपुट फ़ाइल का नाम और एक्सटेंशन।
  5. सहेजें।
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.