एवरनोट से ओसीआर टेक्स्ट निकालें


13

एवरनोट आपके द्वारा सहेजे गए चित्रों पर ओसीआर करता है। क्या एवरनोट में एक छवि के लिए पूर्ण पाठ के बराबर रास्ता है, या ओसीआर केवल खोज के लिए है?

जवाबों:


15

एवरनोट एपीआई में टेक्स्ट और आयत प्राप्त करने के लिए कार्यक्षमता होती है जहां यह टेक्स्ट छवि के अंदर मौजूद होता है। Http://evernote.com/about/developer/api/evernote-api.htm देखें , "एवरनोट रिकॉग्निशन इंडेक्स XML फॉर्मेट" देखें और इसे पुनः प्राप्त करने के लिए कार्य करें। समस्या यह है कि वे पारंपरिक ओसीआर नहीं करते हैं ... उनके ओसीआर एल्गोरिथ्म छवि पर एकल "शब्द" के लिए अलग-अलग शब्द उत्पन्न कर सकते हैं। वे सभी इसका उपयोग खोज के लिए करते हैं, इसलिए यह उनके लिए ठीक है, लेकिन एक मान्यता इंजन के रूप में उपयोग करने के लिए ठीक नहीं है। (हालांकि वे आपको प्रत्येक शब्द विकल्प के लिए वजन देते हैं, इसलिए शायद आप इसका उपयोग कर सकते हैं)


11

इसके अलावा, एवरनोट स्पष्ट रूप से तय नहीं करता है कि एक विशेष छवि बिल्कुल एक शब्द के बराबर है - उदाहरण के लिए, एवरनोट यह निर्धारित नहीं करता है कि एक विशेष छवि "सुराग" है और "कारण" नहीं है। बल्कि, यह दोनों को ट्रैक करेगा, और या तो एक खोज एक ही छवि को लौटाएगा। इसलिए, एक पूर्ण-पाठ समकक्ष प्राप्त करने का कोई तरीका नहीं है क्योंकि एवरनोट यह तय नहीं कर रहा है कि पूर्ण पाठ वास्तव में क्या है, केवल यह क्या हो सकता है।


5

एवरनोट-सामान के निर्माता को एवरनोट एक सभ्य राशि का भुगतान करता है या साथ में काम करने के लिए कुछ करने के लिए एक सभ्य राशि का भुगतान करता है। इस प्रकार, मुझे वास्तव में संदेह है कि वे आपको निकाले गए पाठ (छवि पर स्थिति) प्राप्त करने देंगे।

(एक व्यवसाय मॉडल हो सकता है, अन्य लोगों की छवियों को स्कैन करने और अच्छा ocr :) प्रदान करने के लिए)

तो उत्तर नहीं है।


3
यह सच नहीं है। यह जानकारी प्राप्त करने के लिए एपीआई है। मेरा जवाब देखिए।
पीटर

2

मुझे यकीन नहीं है कि आपको कितने परिष्कार की आवश्यकता है, लेकिन चूंकि मैं एडोब एक्रोबैट का भी उपयोग करता हूं, इसलिए मैं एक्रोबैट के साथ खोलने के लिए अपने एवरनोट अटैचमेंट पर सही क्लिक करता हूं।

फिर एक्रोबेट के भीतर से मैं "दस्तावेज़ | ओसीआर पाठ मान्यता" का चयन करता हूं, फिर दस्तावेज़ को सादे पाठ के रूप में सहेजें।

यह मेरे लिए अच्छी तरह से काम करता है क्योंकि मुझे केवल एक सामयिक ओसीआर रूपांतरण की आवश्यकता है।


1

यदि आप एवरनोट से सभी चित्र प्राप्त कर सकते हैं, तो आप Google डॉक्स के साथ ओसीआर कर सकते हैं।

आप Google डॉक्स में छवियों का एक फ़ोल्डर अपलोड कर सकते हैं और उन्हें दस्तावेज़ों में परिवर्तित कर सकते हैं, जिसमें छवि और ओसीआरएड पाठ दोनों शामिल होंगे।

फिर आप इन सभी दस्तावेजों को सादे पाठ के रूप में बैच-डाउनलोड कर सकते हैं, जो छवि को बाहर निकाल देगा।

यदि आप सभी एवरनोट छवियों को हैश (जैसे md5) के साथ नाम देते हैं , तो Google डॉक्स से डाउनलोड की गई सादे पाठ फ़ाइलों को मूल छवि के साथ जोड़ना आसान होना चाहिए।


0

मैं विंडोज पर हूं और एडोब एक्रोबेट प्रो और वर्ड का उपयोग करता हूं इसलिए मैं निम्नलिखित कार्य करता हूं:

  1. यदि फ़ाइल को JPG के रूप में सहेजा नहीं गया है, तो फोटो व्यूअर में खोलने के लिए एवरनोट में छवि के ऊपरी बाएं कोने में स्थित नेत्रगोलक आइकन पर क्लिक करें और JPG के रूप में सहेजने के लिए फ़ाइल> "प्रतिलिपि बनाएँ" पर क्लिक करें।
  2. एक्सप्लोरर में छवि फ़ाइल के लिए ब्राउज़ करें
  3. उस पर राइट-क्लिक करें और एडोब पीडीएफ में कन्वर्ट का चयन करें (फ़ाइल एक्रोबैट में खुल जाएगी)
  4. फ़ाइल पर क्लिक करें> इस रूप में सहेजें और रिच टेक्स्ट फ़ॉर्मेट को रिच टेक्स्ट फ़ाइल के रूप में सहेजने के लिए "Save as type" ड्रॉपडाउन से चुनें और फ़ाइल को प्रोसेस करने में एक मिनट लगता है)
  5. एक्सप्लोरर में RTF फ़ाइल ब्राउज़ करें और Word में खोलने के लिए डबल-क्लिक करें
  6. आवश्यकतानुसार संपादित करें

एवरनोट में एक छवि नहीं, किसी दिए गए छवि फ़ाइल से पाठ को निकालने के तरीके के बारे में यह सलाह दी गई है। क्या आप स्पष्ट कर सकते हैं कि यह मूल प्रश्न का उत्तर कैसे देता है, और ऐसा एक तरह से पिछला और स्वीकृत उत्तर नहीं है?
संगीत 2
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.