पीडीएफ फाइल में इमेज के रेजोल्यूशन को ढूंडना।


15

मुझे कुछ उपयोगकर्ताओं को बहुत बड़ी पीडीएफ बनाने की समस्या है। दूसरी ओर मेरे पास हमारे फैक्स मशीनों से भेजे गए पीडीएफ हैं जो वास्तव में आकार में छोटे हैं और पूरी तरह से प्रिंट करने योग्य हैं। मेरा सवाल यह है कि

  • क्या कोई तरीका है जिससे मैं पीडीएफ का रिज़ॉल्यूशन (डीपीआई) पा सकता हूं। मैंने इंटरनेट पर सर्च किया, कोई जवाब नहीं मिला। फ़ाइल के गुणों की जांच की, यह जानकारी वहां संग्रहीत नहीं की गई थी, कम से कम मेरे मामले में।
  • टेक्स्ट फाइल को इमेज पीडीएफ में बदलने का इष्टतम रिज़ॉल्यूशन क्या है। 96 डीपीआई, 300 डीपीआई या अधिक?
  • मजेदार सवाल। क्या मैं एक पीडीएफ का आकार बदल सकता हूं जिसे उच्च डीपीआई के साथ छोटे डीपीआई में स्कैन किया गया था?

मुझे पता है कि कुछ उत्तर उपलब्ध नहीं हो सकते हैं क्योंकि मैंने पहले ही इंटरनेट खोज लिया है और मुझे उत्तर नहीं मिल रहे हैं।

नोट: मेरा पीडीएफ पूरी तरह से छवियों, छवियों के लिए पाठ है। मैं भी आप के साथ प्रयोग कर सकते हैं primoPDF (मुक्त) के साथ परिचित हूँ

जवाबों:


18

slhck का उत्तर और 'टिप्पणी' अपडेट किए जाने के लायक है: pdfimagesअब (कम से कम संस्करण 0.26.5 के बाद) विस्फोटक सूचियों x-ppiको y-ppi। यहाँ एक नमूना आउटपुट है:

$ pdfimages -list example.pdf 
page   num  type   width height color comp bpc  enc interp  object ID x-ppi y-ppi size ratio
--------------------------------------------------------------------------------------------
   1     0 image    2244  2244  cmyk    4   8  image  no       215  0   301   301  418K 2.1%
   2     1 image     900   600  rgb     3   8  image  no       324  0  1524  1525 35.5K 2.2%

डेबियन (व्हीजी) और फेडोरा (23) पर, पैकेज pdfimagesका हिस्सा poppler-utilsहै।


मेरा सब खाली है
theonlygusti

8

मुझे पता है कि आप छवि डेटा नहीं निकालना चाहते हैं, लेकिन मूल संकल्प का पता लगाने का यह एकमात्र तरीका है।


* Nix पर, यदि आपके पास ImageMagick है identifyऔर Xpdf 1 स्थापित है :

pdfimages -j test.pdf test && for file in $(find . -name "test*.jpg"); do identify "$file"; done

test.pdfआपका इनपुट PDF कहाँ है उत्पादन फ़ाइलों के लिए लिखा जाता test-000.jpg, test-001.jpg, वगैरह। यह आपको उस पीडीएफ 2 के सभी निहित चित्रों का मूल आकार देगा ।

एक पीडीएफ फाइल के लिए उदाहरण आउटपुट जिसमें केवल एक बड़ी छवि है:

./test-000.jpg JPEG 2500x1961 2500x1961+0+0 8-bit DirectClass 1.022MB 0.000u 0:00.000

1) विंडोज में ये भी हैं, लेकिन स्क्रिप्ट बिल्कुल अलग होगी।
2) ध्यान दें कि छवियाँ वास्तव में DPI जानकारी नहीं लेती हैं। सीधे शब्दों में कहें: मुद्रण और छवियों के लिए उपयोग की जाने वाली कुछ चीज़ों को डीपीआई के एक अंतर्निहित माप की आवश्यकता नहीं है।


टेक्स्ट फाइल को इमेज पीडीएफ में बदलने का इष्टतम रिज़ॉल्यूशन क्या है। 96 डीपीआई, 300 डीपीआई या अधिक?

आम तौर पर, आप जो भी प्रिंट करना चाहते हैं वह 300 डीपीआई या अधिक होना चाहिए। अधिकांश प्रिंटर एक उच्च रिज़ॉल्यूशन भी संभाल लेंगे।


2
(शायद अधिक मूल प्रश्न से हाल ही में) pdfimages का एक संस्करण poppler परियोजना से कहते हैं -List विकल्प: pdfimages -list test.pdf। फ़ाइलों को आउटपुट करने के बजाय, यह आकार और छवि प्रकार को सूचीबद्ध करता है। अभी भी स्पष्ट रूप से आपको संकल्प नहीं देता है, लेकिन आउटपुट फाइल बनाने से बचता है।
स्क्रू

1
@scruss संस्करण ०.३४.० के रूप में, और साथ ही कई अन्य informations pdfimages -listप्रदान करता है । x-ppiy-ppi
स्किप्पी ले ग्रैंड गौरू

वास्तव में यह अब करता है, @SkippyleGrandGourou: सवाल पूछे जाने के लगभग पांच साल बाद। PDFimages अभी भी उस रिज़ॉल्यूशन / साइज़ को इमेज के लिए लागू नहीं करता है, हालाँकि यह अर्क है।
स्क्रू

@ क्रिस वास्तव में, ऐसा लगता है कि द्वारा दिया गया संकल्प pdfimagesकाफी हद तक बंद हो सकता है (उदाहरण के लिए जब छवि अपने दृश्य क्षेत्र से बड़ी होती है, तो पीडीएफ द्वारा निर्मित scribus)। (दुर्भाग्य से मेरे पास अब बग रिपोर्ट दर्ज करने का समय नहीं है।)
स्किप्पी ले ग्रैंड गौरौ

4

किसी कारण के लिए, मैं अपने CentOS में अपग्रेड कर सकने वाला pdfimages का नवीनतम संस्करण 3.04 संस्करण है।

इसलिए, मेरे पास सूची नहीं है, जैसा कि पिछले उत्तरों द्वारा बताया गया है। हालाँकि, स्किम के उत्तर के आधार पर पीडीएम्जीज से बनाई गई टेस्ट इमेज में वांछित उत्तर होता है!

Ident -verbose test-0000.jpg | अधिक

Image: test-0000.jpg  
Format: JPEG (Joint Photographic Experts Group JFIF format)  
Mime type: image/jpeg  
Class: DirectClass  
Geometry: 6600x5100+0+0  
Resolution: 600x600  
Print size: 11x8.5

तो डीपीआई को स्पष्ट रूप से पहचान आदेश में -verbose विकल्प का उपयोग करके 6 वीं पंक्ति पर दिखाया गया है।

तो, slhck का उत्तर निम्नलिखित में संशोधित किया जा सकता है।

pdfimages -j test.pdf $ में फ़ाइल के लिए परीक्षण && (ढूँढें। -नाम "परीक्षण * .jpg"); do -verbose "$ फ़ाइल" की पहचान करें | awk 'NR == 6'; किया हुआ

एक और नोट पर, मैंने दौड़ने की कोशिश की

पहचान -verbose test.pdf

Format: PDF (Portable Document Format)  
Mime type: application/pdf  
Class: DirectClass  
Geometry: 792x612+0+0  
Resolution: 72x72  
Print size: 11x8.5  

ऐसा लगता है कि Imagemagick हमेशा एक 72dpi मानती है और इसलिए यहां छपी जानकारी गलत प्रतीत होती है।


1

एक पीडीएफ फाइल में एक अंतर्निहित रिज़ॉल्यूशन नहीं होता है, इसके भीतर प्रत्येक रेखापुंज-छवि (यदि कोई हो) का स्वयं का रिज़ॉल्यूशन होगा। मैं एम्बेडेड छवि XObjects के माध्य / मोडल रिज़ॉल्यूशन के लिए एक एकल संख्या निकालने का एक सरल तरीका नहीं जानता।


वैसे मुझे पीडीएफ से एक छवि डेटा निकालने में कोई दिलचस्पी नहीं है, मैं सिर्फ यह जानना चाहता हूं कि स्कैन रिज़ॉल्यूशन क्या था और अगर यह बहुत अधिक है तो भविष्य में इससे बचना चाहेंगे।
hk_

@ डव: वास्तव में मेरा मतलब था कि एंबेडेड इमेज के बारे में जानकारी एक्सट्रैक्ट न करना इमेज को एक्सेप्ट करता है। लेकिन स्लॉक के जवाब से आपकी समस्या हल हो सकती है।
RedGrittyBrick

1

यह एक Kyocera mfp से उत्पन्न पीडीएफ के साथ काम करता है ... यह संभवतः स्कैन जैसे पूर्ण-पृष्ठ छवियों के लिए मान्य है।

  1. पीडीएफ को खोलें w / रीडर-
  2. फ़ाइल> गुण -Description टैब -पेज आकार। मेरे उदाहरण में 8.5x11.0 कहा गया है।

  3. एक टेक्स्ट एडिटर (नोटपैड) के साथ पीडीएफ खोलें, देखें /widthऔर/height

  4. ऊँचाई और चौड़ाई लें और उन्हें पृष्ठ ऊँचाई और चौड़ाई से विभाजित करें (इंच में)

उदाहरण:

5100/8.5=600
6600/11.0=600

मेरा पीडीएफ एक 600x600 संकल्प पर स्कैन किया गया था।

यदि आप दस्तावेज़ का आकार जानते हैं तो आप पहले 2 चरणों को छोड़ सकते हैं (आमतौर पर A4 8.27x11.69 है)।


0

प्रिंटर डीपीआई के बारे में @slhck के उल्लेख के अलावा, आपके दूसरे बिंदु का जवाब देने के लिए, 300dpi OCR के लिए 10 + pt के फ़ॉन्ट-आकार के साथ विशिष्ट न्यूनतम अनुशंसित संख्या भी है।

इसके अलावा, एक आधुनिक 15 "4K लैपटॉप स्क्रीन में भी लगभग 280PPi है, इसलिए यदि आप स्क्रीन (परिदृश्य) पर पूरे A4 को देखना चाहते हैं, तो ~ 320 डीपीआई से अधिक पर कोई बिंदु स्कैनिंग नहीं है, क्योंकि इससे अधिक कोई भी दस्तावेज़ होगा नीचे स्केल किया गया। बेशक, इससे कोई फर्क नहीं पड़ता कि आप ज़ूम इन करने की योजना बनाते हैं, तो आपको उच्च डीपीआई की आवश्यकता हो सकती है।

अपने अन्य दो बिंदुओं का जवाब देने के लिए, आजकल आप कम से कम एक्रोबेट प्रो का उपयोग छवि डीपीआई और रिज़ॉल्यूशन की जांच करने के लिए कर सकते हैं, और आप इसे संपादित भी कर सकते हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.