मेरे पास एक पीडीएफ फाइल है जिसमें मैं यहां काम करने वाले भवन के नक्शे रखता हूं:
http://www.libsys.und.edu/dev/FloorPlans_All.pdf
मूल स्रोत फ़ाइलों को खो दिया गया है, और मुझे मानचित्र छवियों को निकालने के लिए कहा गया है, अधिमानतः पाठ और आइकन के बिना जो उनके शीर्ष पर मढ़ा गया है। यह कष्टप्रद रूप से कठिन साबित हुआ है।
अब तक, मैंने निम्नलिखित जीयूआई कार्यक्रमों की कोशिश की है:
- एडोब रीडर: मुझे पाठ का चयन करने देता है, लेकिन पृष्ठभूमि छवियों को नहीं
- फॉक्स इट पीडीएफ व्यूअर: मुझे टेक्स्ट का चयन करने देता है, लेकिन बैकग्राउंड इमेज को नहीं
- Ubuntu 10.10 पर XPDF: मेस को चुनिंदा टेक्स्ट देता है, लेकिन बैकग्राउंड इमेज को नहीं
और निम्न कमांड-लाइन प्रोग्राम भी:
- pdfimages: केवल बाथरूम को इंगित करने वाले आइकन को ठीक करता है, लेकिन पृष्ठभूमि की छवियां नहीं
- pdftohtml: pdfimages के समान, साथ ही यह HTML दस्तावेज़ को खराब तरीके से चिह्नित करता है
- pdfextract: pdfimages के समान
- रूपांतरित करें: सफलतापूर्वक सहेजी गई छवियां, लेकिन उनमें पाठ जलने के साथ
मैं भी एक पाठ संपादक में मैन्युअल रूप से पीडीएफ खोलने की कोशिश की है और एक नई फ़ाइल में चिपकाकर और .jpg, .png, या .bmp एक्सटेंशन (प्रत्येक बारी में) के साथ इसे सहेजकर स्ट्रीम ऑब्जेक्ट निकाल रहा हूं। पीडीएफ फाइलों की आंतरिक संरचना के बारे में मुझे कितना कम पता है, यह देखते हुए, यह कोई आश्चर्य की बात नहीं है कि यह काम नहीं किया।
तो ... क्या कोई ऐसा तरीका है जिससे मैं बिना टेक्स्ट और आइकन के भी इस चीज़ से मैप की छवियों को पुनः प्राप्त कर सकता हूँ?
qpdf
जहां तक संभव हो बाइनरी भागों को एएससीआईआई में परिवर्तित करने के लिए उपयोग करें । (2) सभी टेक्स्ट को अदृश्य बनाने के लिए एक टेक्स्ट एडिटर का उपयोग करें जिसे मैं स्क्रीन पर या प्रिंटआउट में नहीं देखना चाहता हूं ( अदृश्य ध्वज को टॉगल करके एक्सरेफ टेबल को नुकसान पहुंचाए बिना आसानी से और प्राप्त किया जा सकता है )। (3) जितना संभव हो उतना इसके आकार को उबालने के लिए घोस्टस्क्रिप्ट के साथ परिणाम को फिर से आसवन करें। - दुर्भाग्य से, आपकी फ़ाइल अब प्रक्रिया को प्रदर्शित करने के लिए डाउनलोड करने योग्य नहीं है ...