हस्तलिखित नोट्स के लिए ओसीआर सॉफ्टवेयर


10

मैं स्कैन किए गए नोटों की लिखावट (पीडीएफ प्रारूप में) को पहचानने का तरीका ढूंढ रहा हूं ।

यह बिल्कुल सही नहीं है, और इसे मुक्त करने की ज़रूरत नहीं है, लेकिन भुगतान करने से पहले मैं इसे आज़माना चाहूंगा (केवल एक पृष्ठ के साथ भी)।

यह जरूरी नहीं कि एक देशी मैक ओएस एक्स एप्लिकेशन हो। मैं एक ऑनलाइन आवेदन, या एक यूनिक्स एप्लिकेशन को स्थापित या संकलित करने के लिए ठीक होगा। दूसरे शब्दों में, जो कुछ भी शालीनता से काम करता है वह ठीक होगा।

मैं भी एक आदर्श परिणाम के लिए जरूरी नहीं देख रहा हूँ। यहां तक ​​कि मेरे नोटों को एक खोज योग्य पीडीएफ में बदलने के साथ ही कुछ मान्यता प्राप्त पाठ भी कुछ नहीं से बेहतर होगा।


1
दुर्भाग्य से, मुझे यह महसूस हुआ है कि आप लिखावट की मान्यता के साथ संघर्ष कर सकते हैं। उदाहरण के लिए, विकिपीडिया की लिखावट मान्यता लेख में कहा गया है कि " ऑफ-लाइन हस्तलिपि मान्यता तुलनात्मक रूप से कठिन है, क्योंकि विभिन्न लोगों की लिखावट शैली है। और, आज के रूप में, ओसीआर इंजन मुख्य रूप से मशीन मुद्रित पाठ और आईसीआर के लिए हाथ 'मुद्रित' पर केंद्रित हैं। बड़े अक्षरों में लिखा गया) पाठ। कोई OCR / ICR इंजन नहीं है जो आज की लिखावट की मान्यता का समर्थन करता है। "
बाइनरीबॉब

जवाबों:


4

यदि आप किसी भी प्रोग्रामिंग भाषा से परिचित नहीं हैं, तो @ ocrsdk.com को देखें, यह एक वेबसाइट है जो आपको वेब एपीआई के माध्यम से चित्र अपलोड करने देती है और आपको ओसीआर डेटा वापस भेजती है। यहाँ लिखावट मान्यता पर प्रलेखन है: http://ocrsdk.com/documentation/quick-start/text-fields/ और यहाँ कुछ कोडनेम @ github हैं: https://github.com/abbyysdk/ocrsdk.com वहाँ एक अच्छा 50 है पृष्ठ बिना किसी अग्रिम शुल्क के नि: शुल्क परीक्षण।


4

एवरनोट के पास लिखावट की मान्यता है, लेकिन दुर्भाग्य से अभी इसे जेपीजी प्रारूप की आवश्यकता है । यह PDF को हैंडल नहीं कर सकता है। तो आपका काम आसपास के पीडीएफ -> JPG पूर्वावलोकन, आदि का उपयोग करने और फिर मान्यता के लिए Evernote में आयात करने पर विचार करने के लिए हो सकता है। FYI करें, JPG के लिए एवरनोट में लिखावट की पहचान सभ्य है, लेकिन मेरे अनुभवों से लगभग OCR-level नहीं है।

साथ ही, यह पोस्ट हस्तलिखित नोट्स को पहचानने के लिए एवरनोट का उपयोग करने के लिए एक अच्छे वर्कफ़्लो का वर्णन करता है।


4

आप इसके लिए एवरनोट (फ्री) का उपयोग कर सकते हैं । बस अपने सभी PDF को नोट्स के रूप में आयात करें और कुछ समय बाद (आप इसे भुगतान किए गए खाते में अपग्रेड कर सकते हैं), यह स्वचालित रूप से उन्हें संसाधित करेगा और लिखावट को पहचान लेगा। आप नोट्स से OCR टेक्स्ट नहीं निकाल पाएंगे, लेकिन आप इसे खोज सकते हैं।


मैंने कोशिश की लेकिन अभी तक कुछ नहीं हुआ (लगभग दो दिनों के बाद)। क्या मुझे किसी भी तरह से ओसीआर को ट्रिगर करना है?
मट्टियो

1
एक महीने के बाद भी कुछ नहीं किया। मुझे लगता है कि मैं एवरनोट को एक संभावना के रूप में छोड़ दूंगा :-)
मैटियो

हम्म, क्या आपके पीडीएफ में कोई मान्यता प्राप्त पाठ है? (यानी आप टाइप किए गए टेक्स्ट को हाइलाइट कर सकते हैं और उसे कॉपी कर सकते हैं?) यदि हां, तो इसका मतलब है कि दस्तावेज़ पहले से ही संसाधित माना जाता है और एवरनोट सर्वर उस पर ओसीआर चलाने की कोशिश नहीं करेंगे। पाठ (कम से कम परीक्षण उद्देश्यों के लिए) को पहचानने की एक गारंटीकृत विधि कुछ पृष्ठों को छवियों (जैसे पीएनजी) में परिवर्तित करने और फिर उन्हें नोट्स के रूप में जोड़ने के लिए है; फिर देखें कि क्या थोड़ी देर के बाद आप इन चित्रों में लिखावट खोज सकते हैं। आप हमेशा एवरनोट के समर्थन में भी बात कर सकते हैं, वे आमतौर पर बहुत सहायक होते हैं।
सेंसफुल

एवरनोट एक उचित काम करता है जब तक कि आपका लेखन स्पष्ट और सामान्य तरीके से लिखा गया हो। यह फोंट के साथ सबसे अच्छा करता है, जब तक कि आप प्रोसेसर को सूट करने के लिए अपनी लिखावट को अनुकूलित नहीं करना चाहते। मेरी लिखावट बहुत साफ-सुथरी है, लेकिन एवरनोट को मेरी अनोखी शैली (बहुत सारे लिगचर और "पुरानी शैली" संख्या) से परेशानी है। मैं ऐप के लिए स्वाभाविक रूप से जो भी आता है उसे बदलना नहीं पसंद करता हूं।
प्लेक्कलोथ्स

3

मुझे पता है कि आप एक मैक ओएस एप्लिकेशन की तलाश कर रहे हैं, लेकिन हस्तलिपि पहचान के लिए खोज द्वारा इस विषय के लिए तैयार पाठकों के लाभ के लिए, मैं आईओएस पर MyScript मेमो और नोट्स प्लस का उल्लेख करना चाहूंगा। वे एक हस्तलिपि पहचान इंजन साझा करते हैं जो मेरे हाथों में बहुत अच्छा काम करता है। MyScript मेमो का एक मुफ़्त संस्करण है जिसे कोई भी iOS डिवाइस के साथ आज़मा सकता है।

(मैं यह भी देखता हूं कि आप कागज से स्कैन किए गए हस्तलिखित नोटों को पहचानना चाहते हैं, जो ये ऐप नहीं करेंगे। वे सीधे iOS डिवाइस पर लिखे गए हस्तलिखित नोटों को पहचानते हैं।)


1

क्या आपने कैद की जाँच की है ? यह वेब-आधारित है, और उनके पास एक मोबाइल ऐप भी है। वे कंप्यूटर एल्गोरिदम और मानव बुद्धि के संयोजन का उपयोग करते हैं, इसलिए वे वहां किसी भी सीधे ओसीआर सॉफ़्टवेयर की तुलना में लिखावट के साथ बहुत बेहतर करते हैं। यह बहुत तेज़ है (कुछ दर्जन या सौ पृष्ठों के लिए एक या दो घंटे के आदेश पर), और जबकि यह मुफ़्त नहीं है, बस एक प्रति पृष्ठ मूल्य है।

जब मैंने इसकी कोशिश की, तो यह एक खाता स्थापित करने के लिए स्वतंत्र था (मुझे लगभग 15 सेकंड लग गए), और मुझे अपने पहले 25 पृष्ठ मुफ्त मिले। ऐसा लगता है कि वे अभी भी पहले 25 पेज मुफ्त दे रहे हैं। मुझे इसका उपयोग करना बहुत आसान लगा। मैंने कुछ फॉर्म के स्कैन अपलोड किए, जो हाथ में भरे हुए थे, कैप्ट्रिकिटी को बताते हुए एक टेम्प्लेट को चिह्नित किया जहां डेटा था कि मैं चाहता था, फिर स्कैन का एक पूरा बैच अपलोड किया। मैंने सुना है कि तस्वीरें भी अच्छी तरह से काम करती हैं।

कैद ने मुझे इलेक्ट्रॉनिक, मशीन-पठनीय डेटा वापस दिया। सबसे अच्छी बात जो मैंने लिखावट के लिए अब तक पाई है, और मैंने बहुत देखी है।


3
क्या आप किसी तरह कंपनी या सिर्फ एक खुश ग्राहक से संबंधित हैं?
nohillside

1
कैद केवल सरल रूपों के साथ काम करती है। मैंने 25 पृष्ठों के साथ कोशिश की और कुछ भी नहीं पहचाना गया। मुझे निम्नलिखित के साथ एक ईमेल मिला: "फिलहाल, हम केवल अलग-अलग डेटा फ़ील्ड के साथ संरचित पाठ को संभाल सकते हैं, जिसे एक स्प्रेडशीट में निकाला जा सकता है। उदाहरण के लिए, हम एक सर्वेक्षण या कर के रूप में अच्छी तरह से संभाल सकते हैं, लेकिन लंबे समय तक नहीं। पत्र या नोट्स के पृष्ठ। हम चाहते हैं कि एक बेहतर समाधान था। हमारे ज्ञान के अनुसार, OCR बहुत अच्छा प्रदर्शन नहीं करता है। हम एक दिन इस तरह से पाठ को संभालने की योजना बनाते हैं, लेकिन फिलहाल मुझे डर है कि हम नहीं कर सकते। "
मट्टियो

0

http://www.VelOCRaptor.com/ OS X के लिए एक सस्ती (मुफ़्त!) समाधान लगता है। इसमें एक बहुत ही सरल ड्रैग-एंड-ड्रॉप उपयोगकर्ता इंटरफ़ेस है। यह Google की OCR तकनीक पर आधारित है ताकि आप निश्चिंत रहें कि यह ठीक से काम करेगा।

उम्मीद है की यह मदद करेगा!


1
वास्तव में स्वतंत्र नहीं है (29 $ जो एक समस्या नहीं होगी) लायन पर काम नहीं करता है (एक समस्या है) और केवल मुद्रित पाठ का समर्थन करता है (जैसा कि प्रश्न में मैं लिखावट की पहचान के लिए देख रहा हूं)।
मत्तेओ

0

ब्रेनवेयर ... बाजार, अवधि पर कोई बेहतर उत्पाद नहीं है!


4
क्या आप बता सकते हैं कि इस उत्पाद के बारे में क्या बात है? आप इसे कैसे उपयोगी पाते हैं?
डैनियल

1
आपको अधिक जानकारी, एक लिंक, एक विवरण, एक उत्पाद के नाम के अलावा कुछ और प्रदान करने की आवश्यकता है।
स्टफ

ब्रेनवेयर को हाइलैंड द्वारा अधिग्रहित किया गया था और यह एक उपयोगकर्ता के लिए एक उत्पाद उपलब्ध नहीं है।
अपरान्ह001

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.