मैं स्कैन किए गए पृष्ठों से स्वचालित रूप से * * डेस्क और फसल पीडीएफ कैसे बना सकता हूं? [डुप्लिकेट]


13

संभव डुप्लिकेट:
मैं कौन से मुफ्त सॉफ्टवेयर स्कैन की गई छवियों का उपयोग कर सकता हूं

मेरे पास किताबों के स्कैन से बने कई पीडीएफ हैं। स्कैन को एक बार में दो पृष्ठों से बनाया जाता है और इनमें से कुछ स्कैन तिरछे होते हैं, जिससे पाठ थोड़ा झुका हुआ दिखाई देता है।

मैं एक ऐसे उपकरण की तलाश कर रहा हूं जो मुझे पठनीयता खोए बिना स्कैन को डेस्क करके एक स्वचालित अनुकूलन करने की अनुमति दे सके। मैं जीपीएल सॉफ्टवेयर पाया है Briss 2 के बजाय 1 पृष्ठ अनुपात:: आदेश में एक 1 पाने के लिए स्कैन फसल के लिए 1, लेकिन मैं पृष्ठों deskew के लिए किसी भी उपकरण नहीं है।

मैं unpaper पर ठोकर खाई , एक और खुला स्रोत उपकरण जो मुझे करना चाहते हैं के लिए एकदम सही लगता है, लेकिन यह उपकरण केवल लिनक्स है और यह पीडीएफ फाइलों पर सीधे काम नहीं करता है।

किसी भी संकेत की सराहना की जाती है।


1
@ आरेख: यह सवाल क्यों बंद कर दिया गया है ?? इस विषय को 'बहस, तर्क, मतदान या विस्तारित चर्चा' क्यों करना चाहिए?
कर्ट फ़ेफ़ेले

1
"एक उपकरण की तलाश में" नहीं रचनात्मक बंद करने के कारण @kur सेवाओं सुराग के लिए काफी मतदान है
यादृच्छिक

1
@ आरेख: इस प्रश्न ने मुझे विषय के बारे में कुछ शोध करने के लिए प्रेरित किया, और मुझे मनाने के लिए कुछ दिलचस्प विकल्प मिले। सबसे दिलचस्प एक इसके लिए ImageMagick का उपयोग कर रहा है, और यह आश्चर्यजनक रूप से सरल लगता है। दुर्भाग्य से आपका यह समापन मुझे अपना उत्तर पोस्ट करने की अनुमति नहीं देता है।
कर्ट फ़ेफ़ेले जूल

@ आरेख: मैं अब प्रश्न को थोड़ा संपादित कर रहा हूँ। उम्मीद है कि अब यह आपके 'निर्माण' की भावना के अनुरूप है।
बजे कर्ट फ़ेफ़ेले जूल

@ आयामी: ठीक है, 'नकल के रूप में बंद' इस मामले में मेरे लिए बेहतर स्वीकार्य है।
कर्ट फ़ेफ़ेले

जवाबों:


9

डेस्कव्यू पर एक नजर । यह एक कमांडलाइन टूल है। डाउनलोड * ज़िप विंडोज, मैकओएसएक्स और लिनक्स के लिए बायनेरिज़ को शामिल करता है।

लाइसेंस एमपीएल (मोज़िला) या एलपीजीएल (जीएनयू) है, जो भी आप चाहें।

आपके लिए एकमात्र दोष यह है कि यह PDF, केवल PNG और TIFF छवियों (AFAICS) का उपभोग नहीं करता है। इसका मतलब है कि आपको s.th का वर्कफ़्लो सेट करना होगा। पसंद:

 PDF.orig -> PNG.orig -> PNG.deskewed -> PDF.deskewed

मैंने इसे स्वयं (अभी तक) परीक्षण नहीं किया है, मैं अभी हाल ही में वेबसाइट पर आया और इसे बुकमार्क किया।


deskewमेरे टेस्ट रन में रोटेशन से संबंधित विकृति को ठीक करने का प्रबंधन किया लेकिन दुर्भाग्य से इसने मूल छवि सीमा की स्थिति में एक पतली ग्रे लाइन पेश की। ग्रे बॉर्डर से छुटकारा पाने के लिए मैंने छवियों को -extentविकल्प के साथ क्रॉप किया mogrify। मैंने केवल ओएस एक्स पर परीक्षण किया, शायद यह दुर्व्यवहार मंच-विशिष्ट है।
स्टीफन श्मिट

deskewवास्तव में अच्छी तरह से काम करता है। मेरा वर्कफ़्लो इस तरह है: pdfimages -all <pdf> my_imagesjbig2 -s -p -v my_images* > outputpdf.py output > deskewed.pdfअगर ब्लैक बॉर्डर्स (डेस्कटॉप ऑपरेशन का परिणाम) आपको परेशान करता है, तो इमेजमैजिक के साथ कुछ प्रोसेसिंग आवश्यक हो सकती है, जैसे @StefanSchmidt
श्री ताओ

5

ओह, मुझे एक और उत्तर जोड़ना है। मुझे बस नेटपब याद था । यह वर्षों में इस्तेमाल नहीं किया है, लेकिन मुझे लगता है कि मुझे एक नया रूप लेना चाहिए ...

netpbm ग्राफिक चित्रों के हेरफेर के लिए कमांडलाइन के लिए एक बहुत शक्तिशाली टूलकिट है। यह लगभग 300 अलग-अलग उपकरणों को जहाज करता है। इसमें लगभग 100 ग्राफिक्स प्रारूपों के लिए कन्वर्टर्स शामिल हैं।

और इसमें एक कमांडलाइन टूल भी है जो छवियों को घुमा सकता है:

pnmrotate

और इसके पास एक और उपकरण है जो घुमाए गए चित्रों के कोण की खोज करने की कोशिश करता है:

pamtilt

pamtiltछवि रोटेशन के अपने अनुमान के एक अस्थायी संख्या देता है। तो छवियों का स्वत: de-skewing पहुंच के भीतर होना चाहिए। ऐसा करने के लिए एक शेल स्क्रिप्ट लिखी जा सकती है। इसके लिए विभिन्न चरणों की आवश्यकता होगी:

  1. घोस्टस्क्रिप्ट की मदद से पीडीएफ पेज को एक नेटपॉम्ब-उपयुक्त छवि प्रारूप में बदलें।
  2. pamtiltछवि के तिरछा कोण को ऑटो-डिस्कवर करने के लिए उपयोग करें ।
  3. pnmrotateछवि को तिरछा करने के लिए उपयोग करें ।
  4. छवि को पीडीएफ में फिर से बदलें।

यदि आप मुझे अपनी पीडीएफ फाइलों के एक छोटे से नमूने तक पहुंच प्रदान करते हैं, तो मैं एक शेल स्क्रिप्ट के साथ कोशिश कर सकता हूं और उपलब्धि हासिल कर सकता हूं।


(मैं बहुत सोच रहा हूँ कि [netpbm] सुपरसुअर + स्टैकओवरफ़्लो पर यहाँ टैग लगाने के लिए नहीं है।)

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.