एक पीडीएफ फाइल से पृष्ठभूमि छवियों को निकालने?


8

मेरे पास एक पीडीएफ फाइल है जिसमें मैं यहां काम करने वाले भवन के नक्शे रखता हूं:

http://www.libsys.und.edu/dev/FloorPlans_All.pdf

मूल स्रोत फ़ाइलों को खो दिया गया है, और मुझे मानचित्र छवियों को निकालने के लिए कहा गया है, अधिमानतः पाठ और आइकन के बिना जो उनके शीर्ष पर मढ़ा गया है। यह कष्टप्रद रूप से कठिन साबित हुआ है।

अब तक, मैंने निम्नलिखित जीयूआई कार्यक्रमों की कोशिश की है:

  • एडोब रीडर: मुझे पाठ का चयन करने देता है, लेकिन पृष्ठभूमि छवियों को नहीं
  • फॉक्स इट पीडीएफ व्यूअर: मुझे टेक्स्ट का चयन करने देता है, लेकिन बैकग्राउंड इमेज को नहीं
  • Ubuntu 10.10 पर XPDF: मेस को चुनिंदा टेक्स्ट देता है, लेकिन बैकग्राउंड इमेज को नहीं

और निम्न कमांड-लाइन प्रोग्राम भी:

  • pdfimages: केवल बाथरूम को इंगित करने वाले आइकन को ठीक करता है, लेकिन पृष्ठभूमि की छवियां नहीं
  • pdftohtml: pdfimages के समान, साथ ही यह HTML दस्तावेज़ को खराब तरीके से चिह्नित करता है
  • pdfextract: pdfimages के समान
  • रूपांतरित करें: सफलतापूर्वक सहेजी गई छवियां, लेकिन उनमें पाठ जलने के साथ

मैं भी एक पाठ संपादक में मैन्युअल रूप से पीडीएफ खोलने की कोशिश की है और एक नई फ़ाइल में चिपकाकर और .jpg, .png, या .bmp एक्सटेंशन (प्रत्येक बारी में) के साथ इसे सहेजकर स्ट्रीम ऑब्जेक्ट निकाल रहा हूं। पीडीएफ फाइलों की आंतरिक संरचना के बारे में मुझे कितना कम पता है, यह देखते हुए, यह कोई आश्चर्य की बात नहीं है कि यह काम नहीं किया।

तो ... क्या कोई ऐसा तरीका है जिससे मैं बिना टेक्स्ट और आइकन के भी इस चीज़ से मैप की छवियों को पुनः प्राप्त कर सकता हूँ?


जिस तरह से मैं आमतौर पर इस तरह के कार्य को हल करता हूं: (1) qpdfजहां तक ​​संभव हो बाइनरी भागों को एएससीआईआई में परिवर्तित करने के लिए उपयोग करें । (2) सभी टेक्स्ट को अदृश्य बनाने के लिए एक टेक्स्ट एडिटर का उपयोग करें जिसे मैं स्क्रीन पर या प्रिंटआउट में नहीं देखना चाहता हूं ( अदृश्य ध्वज को टॉगल करके एक्सरेफ टेबल को नुकसान पहुंचाए बिना आसानी से और प्राप्त किया जा सकता है )। (3) जितना संभव हो उतना इसके आकार को उबालने के लिए घोस्टस्क्रिप्ट के साथ परिणाम को फिर से आसवन करें। - दुर्भाग्य से, आपकी फ़ाइल अब प्रक्रिया को प्रदर्शित करने के लिए डाउनलोड करने योग्य नहीं है ...
कर्ट फ़िफ़ेल

जवाबों:


7

आप XPDF लाइब्रेरी को लिनक्स और विंडोज के लिए http://www.foolabs.com/xpdf/download.html से डाउनलोड कर सकते हैं । फिर से चलाने के pdfimages -j input.pdf outputलिए और आप मिलना चाहिए output-000.jpg, output-001.jpgआदि इसके अलावा, बाहर की जाँच http://linuxcommand.org/man_pages/pdfimages1.html अधिक उपयोग विकल्प के लिए।


1
सुधार, ऐसा लगता है जैसे छवि एक वेक्टर ग्राफिक है जो सीधे पीडीएफ में एम्बेडेड है। इसे इंक्सस्केप या एडोब इलस्ट्रेटर जैसी किसी चीज़ में खोलने की कोशिश करें जो वेक्टर ग्राफिक्स को हैंडल करता है।
मायब्लूवन

आह हा! नक्शे वेक्टर ग्राफिक्स हैं - कोई आश्चर्य नहीं कि मुझे ऐसी परेशानी हो रही है! Inkscape ने इसे ठीक ही खोला है, और मैं इसे अपने दिल की सामग्री में संपादित कर सकता हूं। धन्यवाद!
विल मार्टिन

2

ठीक है, 5 मिनट के लिए इसके साथ खिलवाड़ करने के बाद, मेरा विश्लेषण यह है कि पीडीएफ मूल रूप से सोचा की तुलना में भी अजीब है, और वह कुछ कह रहा है।

सुनिश्चित नहीं है कि आपका बजट क्या है, लेकिन एक्रोबेट प्रो विस्तारित 9 के साथ, आप उपयोग कर सकते हैं:

ए उपकरण, उन्नत संपादन, टचअप पाठ उपकरण

-Select All
-Right click, Properties
-Text tab
-Select a standard font (e.g. Arial), close
-Hit Delete

B. उपकरण, उन्नत संपादन, टचअप ऑब्जेक्ट टूल

ऑब्जेक्ट का चयन करें (आप सबसे मिल सकते हैं, लेकिन सभी नहीं, उनमें से (जैसे छात्र कंप्यूटर आइकन चयनित नहीं किए जा सकते), फिर हटाएं

यहाँ एक त्वरित सफाई के बाद पेज 1 कैसा दिखता है: http://dl.dropbox.com/u/7434256/p1tn.pdf


अजीब है ख़ामोशी। मैं इस फ़ाइल का इतिहास नहीं जानता, लेकिन एक्रोबेट प्रो 8 ने हमें परेशानी दी। इंकस्केप ने चाल चली, हालांकि, अच्छाई का धन्यवाद। अब इसे सभी कुछ उचित एसवीजी में परिवर्तित करने के लिए, जिनसे हम रेखापुंज ग्राफिक्स उत्पन्न कर सकते हैं ...
विल मार्टिन

1
मूल पीडीएफ पर आपने जो काम किया है (जो, दुर्भाग्य से, अब मेरे लिए उपलब्ध नहीं है) सबसे अच्छा नहीं है। आपकी फ़ाइल अभी भी ~ 3 MByte है। इसमें बहुत सारे + बहुत सारे अन-यूज्ड ऑब्जेक्ट शामिल हैं। यहां तक ​​कि इसमें /AAऑपरेटर का एक उदाहरण भी होता है ( स्वचालित कार्रवाई के लिए ) यह एक संभावित खतरनाक पीडीएफ फाइल बनाता है। घोस्टस्क्रिप्ट अपनी किसी भी दृश्य सामग्री को खोए बिना इसे 60 kByte तक उबालने में सक्षम था। (फ़ाइल में निहित मेटाडेटा 17 अलग-अलग ऑब्जेक्ट्स में फैली हुई है। मेटाडेटा एएलस सुझाव देते हैं कि 2011-01-18 को इसके निर्माण के बाद से उस फ़ाइल के 17 अलग-अलग संशोधन / संशोधन हैं।)
कर्ट फ़िफ़ेल

@ पिपिटास मुझे खुशी है कि मैंने इसे फिर से जांचा, यह पता चला कि अपाचे उस सर्वर पर नीचे था। मूल पीडीएफ फिर से उपलब्ध है। हालांकि यह अभी भी कष्टप्रद है। जब से मुझे पता चला है कि नक्शे ऑटोकैड डीएक्सएफ फाइलों से उत्पन्न हुए थे, जो गंभीरता से बदसूरत वेक्टर ग्राफिक्स के लिए बनाते हैं। प्रत्येक नक्शे में सैकड़ों अलग-अलग पथ होते हैं, प्रत्येक में दो छोरों के साथ एक एक पंक्ति होती है। यह शायद एक वास्तुकार के लिए दीवार के व्यक्तिगत वर्गों या जो कुछ भी बदलना आसान बनाता है, लेकिन यह किसी और चीज के लिए बट में दर्द है।
विल मार्टिन

@Will मार्टिन: आउच !, यह एक बड़ी पीडीएफ फाइल है जिसमें बहुत सारी आंतरिक, छिपी हुई फ़ाइल अपडेट (और इसके बाद: उपयोगकर्ता के दृष्टिकोण से कचरा) होती है। - 16 MBytes पर 16 पृष्ठ बल्कि सरल दिखने वाले वेक्टर ग्राफिक्स के लिए "भारी" हैं। प्रत्येक पृष्ठ के लिए कम से कम 16 अलग-अलग परतें (पीडीएफ वैकल्पिक में "वैकल्पिक सामग्री")। मैं केवल एक पाठ संपादक के साथ इस गड़बड़ के माध्यम से नहीं
जागा था

2
@ पिपिटास: धन्यवाद - उचित बिंदु। यद्यपि मैं वर्णन नहीं करता कि मैंने "नौकरी" के रूप में क्या किया है - मैं बस प्रदर्शन कर रहा था (कुछ मिनट के आसपास खेलने के बाद) कि यह एक्रोबेट के साथ संभव था। मनी बैक गारंटी और वह सब। ;)
क्रेग एच

1

पीडीएफ लें जो क्रेग एच द्वारा बनाया गया था और इसे घोस्टस्क्रिप्ट के माध्यम से चलाकर इसे थोड़ा अनुकूलित करें। विंडोज पर कमांडलाइन है:

gswin32c.exe ^
   -o p1test-gs-optimized.pdf ^
   -sDEVICE=pdfwrite ^
   -dPDFSETTIINGS=/prepress ^
    p1test.pdf

लिनक्स / यूनिक्स / मैक ओएस एक्स पर:

gs \
   -o p1test-gs-optimized.pdf \
   -sDEVICE=pdfwrite \
   -dPDFSETTIINGS=/prepress \
    p1test.pdf

यह फ़ाइल के आकार को 3.000 kByte से लगभग 60 kByte को बिना सामग्री खोए नीचे लाएगा। फिर इसे इंक्सस्केप (या इनडिज़ाइन, इलस्ट्रेटर, ...) में आयात करना बहुत तेज़ होना चाहिए ...।


1

... आप फ़ोटोशॉप की कोशिश कर सकते हैं। यह पीडीएफ को पढ़ता है, और यह 'संभव' है यह पीएस में उत्पन्न हुआ है और संभवतः अभी भी परतें हैं ... लेकिन यह एक बहुत लंबा-शॉट है।


0

एक लिनक्स वातावरण में मैंने एक ही बार में सभी छवियों को निकालने के लिए pdfmod का उपयोग किया है । Https://wiki.gnome.org/Apps/PdfMod देखें या, Ubuntu उपयोगकर्ताओं के लिए, https://apps.ubuntu.com/cat/applications/pdfmod/

इसे उबंटू में डाउनलोड और इंस्टॉल करने के लिए, यह टाइप करने के लिए पर्याप्त है sudo apt-get install pdfmod

  • PDFmod GUI प्रारंभ करें ( pdfmodडैशबोर्ड या कमांड-लाइन टर्मिनल में टाइप करें )
  • पीडीएफ दस्तावेज़ खोलें
  • उन सभी पृष्ठों (या कोई भी जिसे आप चित्र निकालना चाहते हैं) चुनें
  • एडिट मेनू आइटम में उतनी ही छवियां निकालने का विकल्प होगा, जितनी कि वे चयनित सीमा के भीतर निकाली जा सकती हैं (और export n images, उपयुक्त संख्या के साथ)। आप अपने माउस के साथ चयन और स्थानीय मेनू को सक्रिय करके (दाएं हाथ के लिए दायाँ क्लिक करें) इस कमांड का उपयोग कर सकते हैं।
  • एक बार जब आप इसके साथ आगे बढ़ते हैं, तो एक नई विंडो खुल जाएगी जहां आप छवियों को सहेजने के लिए स्थान का चयन करेंगे।

उम्मीद है की यह मदद करेगा।


कृपया पढ़ें कि मैं कुछ युक्तियों के लिए सॉफ्टवेयर की सिफारिश कैसे करूं कि आपको सॉफ्टवेयर की सिफारिश करने के बारे में कैसे जाना चाहिए। उदाहरण के लिए, केवल एक लिंक से अधिक प्रदान करें, साथ ही सॉफ़्टवेयर के बारे में कुछ अतिरिक्त जानकारी और प्रश्न में समस्या को हल करने के लिए इसका उपयोग कैसे किया जा सकता है। आप कुछ उदाहरण कमांड लाइन भी शामिल कर सकते हैं।
DavidPostill

@DavidPostill। इस पर ध्यान दिलाने के लिए धन्यवाद। हो गया, मुझे विश्वास है।
XavierStuvw

बहुत बेहतर ...;)
DavidPostill

अब मुझे पता है कि मैं अपने पोस्ट के जवाबों से क्या मांग कर सकता हूं :-)
XavierStuvw

-1

अपनी स्क्रीन पर दस्तावेज़ खोलें, इसे जितना संभव हो उतना बड़ा बनाने के लिए चित्र पर ज़ूम इन करें लेकिन यह सब अभी भी दिखाई दे रहा है। प्रेस alt + prnt scrn (या आपके ऑपरेटिंग सिस्टम पर समतुल्य) और इसे प्रोग्राम का स्क्रीन शॉट लेना चाहिए। अब चित्र या अपने पसंदीदा चित्र संपादक (फोटोशॉप, जिम्प, आदि) को चित्र में पेस्ट करें और जो कुछ भी आप नहीं चाहते हैं उसे बाहर निकाल दें।


इसमें स्क्रीनशोटेड छवियों में पृष्ठभूमि छवि पर मौजूद आइकन भी शामिल हैं, साथ ही यह स्क्रीन के रिज़ॉल्यूशन का उपयोग करता है। इसके लिए अवश्य ही एक बेहतर तरीका होना चाहिए। '
ज़चिएल
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.