OCR प्रसंस्करण के लिए थोड़े "आधा-टोंड" छवि को छानना

10

मेरे पास एक स्कैन की गई पीडीएफ सामग्री है जिसमें मैं छिपी हुई पाठ परत जोड़ना चाहता हूं, इसलिए मैं दस्तावेज़ को अनुक्रमित कर सकता हूं। मैंने भूतों के काले और सफेद टिफ़ आउटपुट डिवाइस (tiffg4) का उपयोग करके टिफ़ छवियों के रूप में पृष्ठों को निकाला, और यहाँ उदाहरण है कि वे क्या दिखते हैं:

यहाँ छवि विवरण दर्ज करें

इस छवि को टेसरैक्ट के साथ संसाधित करना, अच्छे परिणाम नहीं देता है।
घोस्टस्क्रिप्ट आउटपुट डीपीआई (600, 300, 150, 96) को बदलने से पता चलता है कि 96 डीपीआई में छवि तनाव से सबसे अच्छा परिणाम देती है लेकिन यह अभी भी संतोषजनक नहीं है।

अब मैंने सलाह के लिए पूछा कि कौन सा फ़िल्टर ओसीआर प्रसंस्करण के लिए इस छवि को बढ़ाएगा।

मैं imagemagick, या numpy / scipy / ndimage का उपयोग कर सकता हूं

image-processing ocr

— zetah
स्रोत

9

क्या आप वास्तव में आवश्यकता होती है शायद कटाव के बाद फैलाव की तरह कुछ रूपात्मक ऑपरेशन है। इसे क्लोजिंग ऑपरेशन कहा जाता है । आपके मामले में हो सकता है- सिर्फ फैलाव ही अच्छा हो सकता है।

इसी तरह का एक सवाल पहले पूछा गया था - जो अन्य पहलुओं के साथ मदद कर सकता है।

मोनोक्रोम (1-बिट ब्लैक-एंड-व्हाइट) छवि रूपांतरण

मैं केवल रूपात्मक ऑपरेशनों का उपयोग करके एक छवि से पाठ का पुनर्निर्माण कैसे करूं?

— दीपन मेहता
स्रोत

2

आप इसे कम-पास फ़िल्टर का उपयोग करके निकाल सकते हैं। यह या तो फ़्रीक्वेंसी स्पेस में किया जाता है, या केवल इमेज का (अंतर) गॉसियन लेते हैं।

— क्रिस्टोफ रैकविट्ज
स्रोत