मैं छवियों से पाठ कैसे निकाल सकता हूं?


25

मैं छवियों से पाठ कैसे निकाल सकता हूं?

मैं स्कैन की गई फ़ाइलों के बारे में बात नहीं कर रहा हूं, लेकिन बगीचे की विविधता वाली छवियां, जैसे कि जब आप कक्षा में ब्लैकबोर्ड की उच्च-डीफ़ तस्वीर लेते हैं, और यह अच्छी तरह से हस्तलिखित होता है; या जब आप किसी रेसिपी बुक से पेज की तस्वीर खींचते हैं और टेक्स्ट फॉर्मेट में रेसिपी चाहते हैं।

उसके लिए कोई मुफ्त और खुला सॉफ्टवेयर?

मैंने तपस्या की कोशिश की, और परिणाम भयानक थे।


मुझे एक ओसीआर की आवश्यकता है जो बंगाली और अंग्रेजी का एक साथ समर्थन करता है ।
अल्हलाल al ’

जवाबों:


26

छवियों से पाठ निकालने के कार्य को कहा जाता है OCRऔर उबंटू में एक विकी पृष्ठ है जो OCR को समर्पित है । उस पेज से:

उपलब्ध ओसीआर उपकरण

Ubuntu यूनिवर्स रिपॉजिटरी में निम्नलिखित OCR उपकरण होते हैं:

  1. gocr - एक कमांड लाइन OCR
  2. fuzzyocr - छवि अनुलग्नकों की जांच करने के लिए स्पैमसैसिन प्लगइन
  3. libhocr0 - हिब्रू ओसीआर
  4. ओकराड - ऑप्टिकल कैरेक्टर रिकग्निशन प्रोग्राम
  5. ocrfeeder - दस्तावेज़ लेआउट विश्लेषण और ऑप्टिकल चरित्र पहचान प्रणाली
  6. ओक्रोपस - दस्तावेज़ विश्लेषण और ओसीआर प्रणाली
  7. Tesseract-ओसीआर

उबंटू मल्टीवर्स रेस्पिरेटरी में भी शामिल हैं:

  1. क्यूनिफॉर्म - बहु-भाषा ओसीआर प्रणाली

कुछ पैकेज पुराने हैं, लेकिन अनौपचारिक ताजे वाले एलेक्स_पी पीपीए (पीपीए कोडिंग कोड: ppa: alex-p / notesalexp) में पाए जा सकते हैं । यदि आपने कभी PPA चेक का उपयोग नहीं किया है तो PPA से सॉफ़्टवेयर कैसे जोड़ें

संपादित करें: जैसा कि टिप्पणी में दिखाया गया है क्लारा ओसीआर मौजूद है, लेकिन यह हार्डी पर अटक गया और उनकी वेबसाइट 2009 में अंतिम अद्यतन के रूप में है।


क्या आपके पास मेरे द्वारा वर्णित उदाहरणों में से किसी का उपयोग करने का अनुभव है? मैं उनके लिए नियमित रूप से ocr साधनों से थोड़ा सशंकित हुआ। सूची में नंबर 7 वह है जो मैंने कोशिश की थी और स्पष्ट रूप से भयानक था।
स्ट्रैपकोव्स्की

अगर मुझे याद है, तो मैंने भीषण परिणामों के साथ, भीषण कोशिश की। यदि आपने उनमें से किसी भी सफलता के साथ प्रयास किया, तो आपने कौन सी वाक्य रचना का उपयोग किया? धन्यवाद।
स्ट्रैपकोव्स्की

कोई भी नहीं, कुछ भी नहीं! ) (; D Freshmeat खोज से पता चलता है क्लारा ओसीआर और Tesseract-ओसीआर: मैं ओसीआर से परेशान कभी नहीं freshmeat.net/search/... )
Rinzwind

क्या मैं गलत हूं अगर मैं कहता हूं कि ओसीआर के सफल उपयोग के लिए प्रक्रिया का ज्ञान और विशेष छवि को स्कैन करने के लिए एक सावधान सेटअप की आवश्यकता है? इस प्रकार, यदि मैं सही हूं, तो खराब परिणाम उपयोगकर्ता के कारण हो सकते हैं और सॉफ्टवेयर के नहीं।
NN

OCRसबसे अच्छा काम करता है अगर आप जानते हैं कि छवि कैसे बनाई गई है और आप उस सॉफ़्टवेयर का उपयोग करने में बहुत अच्छी तरह से वाकिफ हैं जो आप उपयोग करते हैं (उत्तरार्द्ध कारण है जो मुझे इसके उपयोग के लिए कभी नहीं मिला)।
रिनजविंड

18

tesseract-ocrअन्य सभी की तुलना में महान एक होगा। स्थापना के लिए, कमांड चलाएँ sudo apt-get install tesseract-ocr

उपयोग है tesseract filename.jpg output.txt

ऊपर कमांड उत्पन्न होगा output.txt

आप उपयुक्त भाषा का चयन करने पर विचार कर सकते हैं। उस स्थिति में आपको tesseract-ocr-LANGपैकेज स्थापित करने की आवश्यकता होगी , जहां LANGतीन अक्षर आईएसओ 639-2 भाषा कोड है । अभी आपके पास 18.04 रेपो पर 123 भाषाएँ हैं। फिर उदाहरण के लिए उपयोग करें :

tesseract mySpanishText.jpg output -l spa

अरे, तो यह काम करता है, लेकिन सटीक नहीं है या मैं कहूंगा कि 80-85% सटीक है। उदाहरण के लिए इस छवि के लिए: pbs.twimg.com/media/DJs6_pcXkAA2VrN.jpg , इसने $ साइन को गड़बड़ कर दिया और अधिकांश कोष्ठक भी। स्क्वायर, गोल, घुंघराले, सभी कोष्ठक एक समस्या है, वे कभी भी ठीक से नहीं निकाले जाते हैं। क्या आपको किसी फिक्स का पता है?
मिलन छेदा
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.