OCR प्रसंस्करण के लिए थोड़े "आधा-टोंड" छवि को छानना


10

मेरे पास एक स्कैन की गई पीडीएफ सामग्री है जिसमें मैं छिपी हुई पाठ परत जोड़ना चाहता हूं, इसलिए मैं दस्तावेज़ को अनुक्रमित कर सकता हूं। मैंने भूतों के काले और सफेद टिफ़ आउटपुट डिवाइस (tiffg4) का उपयोग करके टिफ़ छवियों के रूप में पृष्ठों को निकाला, और यहाँ उदाहरण है कि वे क्या दिखते हैं:

यहाँ छवि विवरण दर्ज करें

इस छवि को टेसरैक्ट के साथ संसाधित करना, अच्छे परिणाम नहीं देता है।
घोस्टस्क्रिप्ट आउटपुट डीपीआई (600, 300, 150, 96) को बदलने से पता चलता है कि 96 डीपीआई में छवि तनाव से सबसे अच्छा परिणाम देती है लेकिन यह अभी भी संतोषजनक नहीं है।

अब मैंने सलाह के लिए पूछा कि कौन सा फ़िल्टर ओसीआर प्रसंस्करण के लिए इस छवि को बढ़ाएगा।

मैं imagemagick, या numpy / scipy / ndimage का उपयोग कर सकता हूं

जवाबों:


9

क्या आप वास्तव में आवश्यकता होती है शायद कटाव के बाद फैलाव की तरह कुछ रूपात्मक ऑपरेशन है। इसे क्लोजिंग ऑपरेशन कहा जाता है । आपके मामले में हो सकता है- सिर्फ फैलाव ही अच्छा हो सकता है।

इसी तरह का एक सवाल पहले पूछा गया था - जो अन्य पहलुओं के साथ मदद कर सकता है।

मोनोक्रोम (1-बिट ब्लैक-एंड-व्हाइट) छवि रूपांतरण

मैं केवल रूपात्मक ऑपरेशनों का उपयोग करके एक छवि से पाठ का पुनर्निर्माण कैसे करूं?


2

आप इसे कम-पास फ़िल्टर का उपयोग करके निकाल सकते हैं। यह या तो फ़्रीक्वेंसी स्पेस में किया जाता है, या केवल इमेज का (अंतर) गॉसियन लेते हैं।

गाऊसी कम-पास, फिर तेज करने के लिए गाऊसी का अंतर

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.