पीडीएफ फाइल से इमेज कैसे निकाले


49

मैं वर्तमान में फॉक्सिट के पीडीएफ रीडर का उपयोग करता हूं, और मैंने हाल ही में इंटरनेट से एक छवि डाउनलोड की है, लेकिन यह एक पीडीएफ फाइल के अंदर है। मैं इस छवि को कैसे निकालूं?

ऑपरेटिंग सिस्टम विंडोज 7 है।


आपका उच्चतम गुणवत्ता निष्कर्षण उस प्रारूप में निकालने के लिए होगा जो छवि पीडीएफ में पहले से ही संग्रहीत है। (कम से कम मुझे लगता है कि कैसे छवियों में pdfs काम है।)
क्वैक क्विक्सोट

जवाबों:


4

यदि आपको चित्र के मूल पिक्सेल रिज़ॉल्यूशन की आवश्यकता नहीं है तो त्वरित तरीका केवल ALT और Print स्क्रीन बटन दबाना है। फिर पेस्ट चुनें जहां आप कभी भी छवि चाहते हैं।

रिज़ॉल्यूशन को संरक्षित करने का दूसरा तरीका यह है कि आप इमेज एडिटिंग प्रोग्राम जैसे एडोब फोटोशॉप में पीडीएफ खोलें और उसके साथ काम करें।


1
फ़ोटोशॉप में एक पीडीएफ डॉक्यूमेंट खोलने से 'Rasterize Generic PDF Format' डायलॉग दिखाई देता है, इसलिए रिज़ॉल्यूशन को संरक्षित नहीं किया जा सकता। PS7 के साथ परीक्षण किया गया। क्या फ़ोटोशॉप के नए संस्करण अलग हैं?
AffineMesh

1
जैसा कि आपने कहा, [alt] + [prnscr] मूल पिक्सेल रिज़ॉल्यूशन को संरक्षित नहीं करता है (यह जो भी रिज़ॉल्यूशन आपकी वर्तमान स्क्रीन / मॉनिटर का उपयोग करता है) करता है।
बजे कर्ट फ़िफेले

1
@studiohack, @UserSuUserDo: यदि आप [alt] + [prnscr] का उपयोग करते हैं, तो न केवल आप मूल रिज़ॉल्यूशन को याद करेंगे, बल्कि आपको चित्र के रूप में संपूर्ण PDF दर्शक विंडो मिलेगी। यह कई उपयोग मामलों के लिए 'काफी अच्छा' हो सकता है। लेकिन कभी-कभी आप चाहते हैं कि ग्राफिक केवल पीडीएफ पेज में एम्बेडेड हो। यहाँ pdfimages.exeकाम आता है।
बजे कर्ट फ़िफेले

1
या इच्छित क्षेत्र पर कब्जा करने के लिए W7 में निर्मित स्निपिंग टूल का उपयोग करें।
Moab

70

यदि आप Windows ( यहां ) के लिए XPDF डाउनलोड करते हैं , तो आपको कुछ .exe फ़ाइलें अंदर मिलेंगी। आप उन्हें "इंस्टॉलेशन" के बिना चला सकते हैं। pdfimages.exeइस तरह का उपयोग करें:

pdfimages.exe -help

यह मदद स्क्रीन प्रदर्शित करता है।

pdfimages.exe ^
    -j ^
    c:\path\to\your.pdf ^
    c:\path\to\where\you\want\images\prefix\

यह सभी JPEGs को उपसर्ग -00N.jpg, और अन्य सभी छवियों को उपसर्ग -00N.ppm (पोर्टेबल पिक्सपैम) के रूप में निकालता है।

[ ComFreek द्वारा संपादित करें: कृपया गंतव्य पथ में अनुगामी स्लैश पर ध्यान दें, जो महत्वपूर्ण है यदि आप सभी चित्रों को इसके मूल निर्देशिका में नहीं निकालना चाहते हैं।] -
{ KurtPfeifle द्वारा संपादित करें: मैं ComFreek की टिप्पणी से सहमत नहीं हूं, लेकिन छोड़ें यह पाठकों को स्वयं परिणामों में अंतरों का परीक्षण करने और पता लगाने के लिए है। मेरा मूल पैरामीटर, अनुगामी स्लैश का उपयोग नहीं कर रहा है, जैसा कि निकाले गए फ़ाइलों के लिए उपयोग किए जाने ..\prefixवाले छवि नामों को उपसर्ग करेगा ।}

pdfimages.exe ^
    -j ^
    -f 11 ^
    -l 13 ^
    c:\path\to\your.pdf ^
    c:\path\to\where\you\want\images\prefix\

पहले जैसा ही है, लेकिन छवि निष्कर्षण को 11 पेज ('एफ' = प्रथम) से 13 ('एल' = अंतिम) तक सीमित करता है।


अपडेट करें:

इस बीच मैं पॉपलर के संस्करण कोpdfimages पसंद करता हूं - विशेष रूप से जब से उसने यह नई सुविधा प्राप्त की है: -listकमांडलाइन में पीडीएफ में निहित छवियों (केवल कुछ नहीं) को सूचीबद्ध करने के लिए, साथ ही साथ उनके कुछ गुणों को भी जोड़ें। उदाहरण:

pdfimages -list -f 7 -l 8 ct-magazin-14-2012.pdf

  पृष्ठ संख्या प्रकार चौड़ाई ऊंचाई रंग COMP बीपीसी एनजी वस्तु आईडी
  -------------------------------------------------- -------------------
     ० छवि ५ no१ r३ 5 आरजीबी ३ image जेपीपी ३ ९ ०
     7 1 छवि 4 4 आरजीबी 3 8 छवि संख्या 40 0
     7 2 छवि 314 332 आरजीबी 3 8 जेपीएक्स नं 44 0
     7 3 छवि 358 430 आरजीबी 3 8 जेपीएक्स नं 45 0
     7 4 छवि 4 4 आरजीबी 3 8 छवि संख्या 46 0
     ५ छवि ४ ४ आरजीबी ३ no छवि संख्या ४ image ०
     7 6 छवि 4 6 आरजीबी 3 8 छवि संख्या 48 0
     7 7 छवि 596 462 आरजीबी 3 8 जेपीएक्स नं 49 0
     7 8 छवि 4 6 आरजीबी 3 8 छवि संख्या 50 0
     ९ छवि ४ ४ आरजीबी ३ no छवि संख्या ५१ ०
     7 10 छवि 8 10 आरजीबी 3 8 छवि संख्या 41 0
     7 11 छवि 6 6 आरजीबी 3 8 छवि संख्या 42 0
     7 12 छवि 113 27 आरजीबी 3 8 जेपीएक्स नं 43 0
     8 13 छवि 582 839 ग्रे 1 8 जेपीईजी कोई 2080 0
     8 14 छवि 344 364 ग्रे 1 8 jpx कोई 2079 0

फिर से ध्यान दें : यह संस्करण pdfimagesपॉप्लर से एक है (XPDF से एक व्यक्ति इस नई सुविधा का समर्थन नहीं करता है (अभी तक?), और संस्करण v0.20.2 या नया होना चाहिए।


1
@harlev: के लिए गूगल ImageMagick । इसमें एक कमांडलाइन टूल होता है, जो किसी भी चीज़ को कही जाने वाली चीज़ में बदल सकता है convert। लिनक्स, विंडोज, मैकओएस एक्स के लिए उपलब्ध है और आपके पास क्या है। आपके लिए सबसे आसान उपयोग मामला convert some.ppm some.jpeg:।
कर्ट फ़िफ़ेल

3
नोट: XPDF को पॉपलर लाइब्रेरी के रूप में सक्रिय रूप से बनाए नहीं रखा गया है, जो कुछ समय पहले इससे लिया गया था। पॉप्लर भी प्रदान करता है pdfimages, और कुछ लोग इसका उपयोग करना पसंद कर सकते हैं।
MvG

1
@BurhanKhalid: पूर्व-निर्मित बायनेरिज़ यहाँ हैं: sourceforge.net/projects/poppler-win32
कर्ट फ़िफ़ेल

2
@ कर्टपाइफ़ल दुर्भाग्य से उन लोगों के पास कोई भी exe फाइलें नहीं हैं।
क्रिस

3
मुझे पता है कि यह पुराना है, लेकिन अगर आप विंडोज़ बायनेरी की तलाश में हैं तो कोई भी इसे साझा करना चाहता है। आप इसे यहाँ पा
Aivan Monceller

8

आप PDF को Inkscape में आयात करने का प्रयास कर सकते हैं , और वहां से काम कर सकते हैं। Inkscape समय पर केवल एक पृष्ठ खोलेगा, लेकिन आपको पृष्ठ सामग्री पर पूर्ण नियंत्रण प्रदान करेगा। आप पीडीएफ से वेक्टर ग्राफिक्स को आसानी से निकालने और हेरफेर करने में सक्षम होंगे।

हालाँकि, यदि आप पीडीएफ से रेखापुंज छवियों को निकालना चाहते हैं, मुझे यकीन है कि pdfimagesXPDF से आसान है (लेकिन आप SVG फ़ाइलों से एम्बेडेड छवियों को निकालने के लिए सीखने के बाद भी Inkscape का उपयोग करने की कोशिश कर सकते हैं )।


GIMP ( gimp.org ) एक अन्य ग्राफिक डिज़ाइन टूल है जो PDFs को आयात और हेरफेर कर सकता है। हालांकि यह सुनिश्चित नहीं है कि GIMPs की क्षमता इनकस्केप के साथ कैसे विपरीत है।
कोडरवर्क्स

@ कोडक: जीआईएमपी एक निश्चित रिज़ॉल्यूशन में आयातित पीडीएफ पेज को फिर से व्यवस्थित करेगा। दूसरे शब्दों में, यह "प्रिंट स्क्रीन" का उपयोग करने से थोड़ा बेहतर है। दूसरी ओर इंकस्केप, मूल वेक्टर डेटा के साथ-साथ मूल रेखापुंज छवियों को संरक्षित करेगा।
डेनीलसन सा मैया

5

किसी भी सॉफ़्टवेयर को स्थापित किए बिना, आप पीडीएफ-एक्सचेंज व्यूअर (चुनिंदा पोर्टेबल संस्करण ) पर स्विच कर सकते हैं जिसमें यह क्षमता पहले से ही अंतर्निहित है

  • छवि के रूप में सभी या चयनित पृष्ठों का निर्यात करता है
  • आउटपुट स्वरूप: पीएनजी, जेपीजी, टीआईएफएफ, बीएमपी
  • DPI, कम्प्रेशन लेवल, ग्रे-स्केल चुनें
  • बहु-पृष्ठ TIFF के रूप में कई पृष्ठों को सहेज सकते हैं

    यहाँ छवि विवरण दर्ज करें

    यहाँ छवि विवरण दर्ज करें
    बड़ा करने के लिए क्लिक करें


कृपया ध्यान रखें कि यह विधि पूरे पीडीएफ पृष्ठों को छवियों में परिवर्तित करती है, सुमात्रा पीडीएफ का उपयोग करके @ लॉरेंज से समझाया गया तरीका बेहतर है यदि आप केवल सामग्री प्राप्त करने के लिए मिश्रित सामग्री (छवि + पाठ) के साथ पीडीएफ पृष्ठ से चित्र निकालना चाहते हैं।


2
@MarkSeemann मैं अनुसरण नहीं कर सकता। "किसी भी सॉफ़्टवेयर को स्थापित किए बिना" इस संदर्भ में इसका मतलब है कि एक पोर्टेबल संस्करण उपलब्ध है। पोर्टेबल सॉफ्टवेयर प्रति परिभाषा "इंस्टॉल" नहीं किया जा सकता है। आप बस डाउनलोड करें, निकालें और इसे शुरू करें।
निक्शा

3
तथ्य यह है कि आपको "डीपीआई को चुनो" उद्देश्य को हरा देता है। आप रेखापुंज छवियों (पिक्सेल की सरणी) का आकार बदल रहे हैं, और रास्टर छवि के किसी भी आकार में गुणवत्ता और जानकारी का नुकसान होता है।
एंथोनी

PPM फ़ाइलों को png या jpeg में बदलें?
किकेनेट

4

सुमात्रा पीडीएफ एक तेज़ और हल्का खुला स्रोत पीडीएफ रीडर है जो छवियों को सीधे क्लिपबोर्ड पर कॉपी कर सकता है, बिना किसी पुनर्संयोजन के।


3

MuPDF एक नया (2006 में बनाया गया) मल्टीप्लायर (डेस्कटॉप और मोबाइल) पीडीएफ दर्शक है जिसे AGPL लाइसेंस के तहत जारी किया गया है। इसे घोस्टस्क्रिप्ट के ही लोगों द्वारा बनाए रखा गया है।

इसमें PDF से चित्र निकालने के लिए एक कमांड-लाइन टूल है:

mutool extract [options] file.pdf [object numbers]

एक्सट्रैक्ट कमांड का इस्तेमाल पीडीएफ से इमेज और फॉन्ट फाइल निकालने के लिए किया जा सकता है। यदि कमांड लाइन पर कोई ऑब्जेक्ट नंबर नहीं दिए गए हैं, तो सभी चित्र और फोंट निकाले जाएंगे।

-p password
       Use the specified password if the file is encrypted.

-r     Convert images to RGB when extracting them.

2

का उपयोग pdftocairoसे poppler toolkit। यह पीडीएफ की छवियों को किसी भी वांछित प्रारूप में निकाल और बदल सकता है। यह हमेशा छवियों को उत्पन्न करता है और कभी भी पीपीएम या इस तरह के कुछ क्रेप उत्पन्न नहीं करता है। निम्नलिखित कमांड पीडीएफ पृष्ठों को jpg छवियों के लिए कवर करती है:

pdftocairo.exe -jpeg "my.pdf" "my"

आप इसे विंडोज़ के लिए यहाँ से प्राप्त कर सकते हैं: http://blog.alivate.com.au/poppler-windows/

यह लिनक्स पर भी उपलब्ध है।


यह आदेश एक पीडीएफ में एम्बेडेड छवियों के रूप में नहीं है (जैसा कि ओपी ने पूछा है)। इसके बजाय यह छवि प्रारूपों के लिए पूर्ण पीडीएफ पृष्ठों को परिवर्तित करता है। यह उत्तर पूछे गए प्रश्न के अनुकूल नहीं है।
कुर्ट फ़ेफ़ेले

1

http://www.sumnotes.net/ नोटों, हाइलाइट्स और छवियों को निकालने के लिए एक ऑनलाइन उपकरण है। मैंने इसे अपने शोध के लिए विश्वविद्यालय में बड़े पैमाने पर इस्तेमाल किया और मैं वास्तव में संतुष्ट था।


सीमित नि: शुल्क परीक्षण के साथ वाणिज्यिक। यह ऑनलाइन भी है, जिसका अर्थ गोपनीयता की गारंटी नहीं हो सकता है!
एंथनी

-1

आम तौर पर मैं मूल रिज़ॉल्यूशन में 'pdfimages' के साथ एम्बेडेड छवि को निकालता हूं, फिर ImageMagick के कन्वर्ट को आवश्यक प्रारूप में उपयोग करें:

$ pdfimages -list fileName.pdf
$ pdfimages fileName.pdf fileName   # save in .ppm format
$ convert fileName-000.ppm fileName-000.png

यह सबसे अच्छा और सबसे छोटा परिणाम फ़ाइल उत्पन्न करता है।

नोट: हानिपूर्ण JPG एम्बेडेड छवियों के लिए, आपको -j का उपयोग करना होगा:

$ pdfimages -j fileName.pdf fileName   # save in .jpg format

थोड़ा प्रदान किए गए विन प्लेटफॉर्म पर आपको हाल ही में (0.37, 2015) 'poppler-use' बाइनरी डाउनलोड करना होगा: http://blog.alivate.com.au/poppler-windows/

अद्यतन: हाल ही में "पॉपलर-उपयोग" 0.50+ (2016) पर, पीडीएफ़नाइट के पास दोषरहित संपीड़ित बिटमैप को निकालने के लिए "-all" एक विकल्प है। .Png और हानिपूर्ण संपीड़ित बिटमैप को .jpg के रूप में, एक सरल।

$ pdfimages -all fileName.pdf फ़ाइल नाम

पीडीएफ से हमेशा सर्वोत्तम संभव गुणवत्ता वाली सामग्री निकालें


पहले कर्ट फैफेल के जवाब में था।
daniel.neumann
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.