गलतियों को सुधारने के लिए GUI के साथ अच्छा मुफ्त OCR? (विंडोज के लिए)


9

मैंने SimpleOCR का उपयोग किया है , जिसमें गलतियों को सुधारने के लिए एक अच्छा GUI है। दुर्भाग्य से यह बहुत सारी गलतियाँ करता है! (और अन्य बग्स और सीमाओं से ग्रस्त है)

दूसरी ओर Tesseract अधिक सटीक है, लेकिन इसमें कोई GUI नहीं है।

मेरा सवाल है, क्या विंडोज के लिए एक मुफ्त ओसीआर कार्यक्रम है जिसमें एक अच्छा जीयूआई और कम त्रुटि दर है? मैं चाहता हूं कि यह संदिग्ध शब्दों को उजागर करे (OCR अनिश्चितता से, न कि केवल वर्तनी की जाँच करें) और मूल (बिटमैप) शब्द को दिखाए, जबकि मैं OCRed शब्द का संपादन कर रहा हूँ जैसा कि SimpleOCR करता है।

ओपन-सोर्स सबसे अच्छा होगा, इसके बाद फ्रीवेयर, फिर ट्रायल / डेमो / क्रिप्पलवेयर एक लंबा रास्ता तय करेगा।

SimpleOCR स्क्रीनशॉट त्रुटियों को सही करने के लिए GUI दिखा रहा है


के संभावित डुप्लिकेट नि: शुल्क ओसीआर सॉफ्टवेयर
Sathyajith भट्ट

2
@ सत्य: मेरी विशिष्ट आवश्यकताएं इसे उस प्रश्न से अलग करती हैं।
ह्यूग एलन

बिल्कुल मुफ्त नहीं, लेकिन क्या आपने माइक्रोसॉफ्ट ऑफिस में देखा है? यह OCR के साथ आता है। (सेटअप में "माइक्रोसॉफ्ट ऑफिस डॉक्यूमेंट इमेजिंग" सुविधा देखें।)
विवलिन

@horsedrowner: मैंने अभी इसकी कोशिश की। इसकी सटीकता Tesseract के बराबर है, लेकिन इसके लिए उपयुक्त DPI सेटिंग के साथ TIFF फ़ाइल की आवश्यकता है या यह काम नहीं करता है, और OCR गलतियों को सुधारने के लिए इसका कोई इंटरफ़ेस नहीं है।
ह्यूग एलन

@ ह्यूग एलन: क्या यह? जब मैंने OneNote 2007 में संदर्भ मेनू फ़ंक्शन पर ठोकर खाई, तो यह बहुत अच्छी तरह से काम किया। और मैं एक वेबसाइट से एक यादृच्छिक छवि फ़ाइल कॉपी-पेस्ट का उपयोग कर रहा था ...
Vivelin

जवाबों:


2

क्या आपने गिमेजर , टेसरैक्ट के लिए एक गिनी फ्रंट की कोशिश की है ?


मैंने इसे केवल (विंडोज़ के तहत) आज़माया और यह मेरे लिए नहीं चलता - प्रक्रिया बिना किसी त्रुटि संदेश के तुरंत बाहर निकल जाती है :( वैसे भी स्क्रीनशॉट को देखने से यह प्रतीत नहीं होता है कि वास्तव में आपके द्वारा संपादित किए जा रहे शब्द पर प्रकाश डाला गया है। क्या आपने कोशिश की है। यह?
ह्यूग एलन

2

OCRopus :

सॉफ्टवेयर आंशिक रूप से टेसरैक्ट पर आधारित है, जो अब तक का सबसे अच्छा ओपन सोर्स ओसीआर इंजन है। हालांकि यह परियोजना अगले साल के अंत में जारी होने की उम्मीद है और इसका उपयोग Google की पुस्तक स्कैनिंग परियोजना के लिए किया जाएगा, टीम के पास कुछ दिलचस्प अनुप्रयोग हैं:

  • एक वेब सेवा इंटरफ़ेस
  • पीडीएफ, कैमरा, और स्क्रीन OCR
  • डेस्कटॉप खोज टूल के साथ एकीकरण: बीगल, स्पॉटलाइट, Google डेस्कटॉप

OCRopus (tm) एक अत्याधुनिक दस्तावेज़ विश्लेषण और OCR प्रणाली है, जिसमें प्लग करने योग्य लेआउट विश्लेषण, प्लग करने योग्य चरित्र पहचान, सांख्यिकीय प्राकृतिक भाषा मॉडलिंग और बहुभाषी क्षमताओं की विशेषता है।

OCRopus इंजन दो शोध परियोजनाओं पर आधारित है: 90 के दशक के मध्य में विकसित और यूएस जनगणना ब्यूरो, और उपन्यास उच्च प्रदर्शन लेआउट विश्लेषण विधियों द्वारा विकसित एक उच्च प्रदर्शन लिखावट पहचानकर्ता।

OCRopus विकास Google द्वारा प्रायोजित है और शुरू में उच्च-थ्रूपुट, उच्च-वॉल्यूम दस्तावेज़ रूपांतरण प्रयासों के लिए लक्षित है। हम उम्मीद करते हैं कि यह कई अन्य अनुप्रयोगों के लिए एक उत्कृष्ट ओसीआर प्रणाली भी होगी। वैकल्पिक शब्द लिंक:


GOCR

GOCR एक OCR (ऑप्टिकल कैरेक्टर रिकॉग्निशन) प्रोग्राम है, जो GNU पब्लिक लाइसेंस के तहत विकसित किया गया है। यह पाठ की स्कैन की गई छवियों को पाठ फ़ाइलों में परिवर्तित करता है। जोर्ग शुल्लेन ने कार्यक्रम शुरू किया, और अब डेवलपर्स की एक टीम का नेतृत्व किया। GOCR का उपयोग विभिन्न फ्रंट-एंड के साथ किया जा सकता है, जिससे विभिन्न OS और आर्किटेक्चर को पोर्ट करना बहुत आसान हो जाता है। यह कई अलग-अलग छवि प्रारूप खोल सकता है, और इसकी गुणवत्ता में दैनिक आधार पर सुधार हुआ है। वैकल्पिक शब्द वैकल्पिक शब्द

लिंक:



क्या उन दोनों में से किसी के पास जाने के लिए एक अच्छा GUI है?
ह्यूग एलन

1
संपादित आपके प्रश्न का उत्तर देते हैं .... लेकिन मैं कहूंगा: "नहीं, वे नहीं हैं", लेकिन मैंने सुना है कि शब्द OCRopus ( arstechnica.com/open-source/news/2007/08/… ) का समर्थन करता है
Krazy_Kaver

1
उत्तर देने के लिए स्क्रीनशॉट जोड़ने के लिए और दो प्रस्तावित कार्यक्रमों की लघु-समीक्षा के लिए भी ...
कर्ट फ़िफ़ेल

0

वहाँ भी है TOPOCR , (SnapReader उर्फ) के बाद के प्रसंस्करण के लिए 11 भाषाएँ वर्तनी परीक्षक युक्त

SnapReader का उपयोग लगभग किसी भी दस्तावेज़ छवि से अपने खोजे गए नोट्स बनाने के लिए किया जा सकता है। या आप इसे एक संलेखन उपकरण के रूप में उपयोग कर सकते हैं और अपने स्कैनर या कैमरे का उपयोग करके अपनी खुद की संपादन योग्य सामग्री बना सकते हैं और परिणाम को HTML या PDF के रूप में सहेज सकते हैं। SnapReader ऑड्रे का उपयोग करके टेक्स्ट को बहुत उच्च गुणवत्ता वाले ऑडियो में भी बदल सकता है। इसलिए न केवल आप दस्तावेजों को पकड़ने के लिए अपने स्कैनर या कैमरे का उपयोग कर सकते हैं, अब आप अपने पोर्टेबल संगीत खिलाड़ी या स्मार्टफोन का उपयोग उन्हें "पढ़ने" के लिए भी कर सकते हैं।

छवि

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.