जवाबों:
एवरनोट एपीआई में टेक्स्ट और आयत प्राप्त करने के लिए कार्यक्षमता होती है जहां यह टेक्स्ट छवि के अंदर मौजूद होता है। Http://evernote.com/about/developer/api/evernote-api.htm देखें , "एवरनोट रिकॉग्निशन इंडेक्स XML फॉर्मेट" देखें और इसे पुनः प्राप्त करने के लिए कार्य करें। समस्या यह है कि वे पारंपरिक ओसीआर नहीं करते हैं ... उनके ओसीआर एल्गोरिथ्म छवि पर एकल "शब्द" के लिए अलग-अलग शब्द उत्पन्न कर सकते हैं। वे सभी इसका उपयोग खोज के लिए करते हैं, इसलिए यह उनके लिए ठीक है, लेकिन एक मान्यता इंजन के रूप में उपयोग करने के लिए ठीक नहीं है। (हालांकि वे आपको प्रत्येक शब्द विकल्प के लिए वजन देते हैं, इसलिए शायद आप इसका उपयोग कर सकते हैं)
इसके अलावा, एवरनोट स्पष्ट रूप से तय नहीं करता है कि एक विशेष छवि बिल्कुल एक शब्द के बराबर है - उदाहरण के लिए, एवरनोट यह निर्धारित नहीं करता है कि एक विशेष छवि "सुराग" है और "कारण" नहीं है। बल्कि, यह दोनों को ट्रैक करेगा, और या तो एक खोज एक ही छवि को लौटाएगा। इसलिए, एक पूर्ण-पाठ समकक्ष प्राप्त करने का कोई तरीका नहीं है क्योंकि एवरनोट यह तय नहीं कर रहा है कि पूर्ण पाठ वास्तव में क्या है, केवल यह क्या हो सकता है।
एवरनोट-सामान के निर्माता को एवरनोट एक सभ्य राशि का भुगतान करता है या साथ में काम करने के लिए कुछ करने के लिए एक सभ्य राशि का भुगतान करता है। इस प्रकार, मुझे वास्तव में संदेह है कि वे आपको निकाले गए पाठ (छवि पर स्थिति) प्राप्त करने देंगे।
(एक व्यवसाय मॉडल हो सकता है, अन्य लोगों की छवियों को स्कैन करने और अच्छा ocr :) प्रदान करने के लिए)
तो उत्तर नहीं है।
मुझे यकीन नहीं है कि आपको कितने परिष्कार की आवश्यकता है, लेकिन चूंकि मैं एडोब एक्रोबैट का भी उपयोग करता हूं, इसलिए मैं एक्रोबैट के साथ खोलने के लिए अपने एवरनोट अटैचमेंट पर सही क्लिक करता हूं।
फिर एक्रोबेट के भीतर से मैं "दस्तावेज़ | ओसीआर पाठ मान्यता" का चयन करता हूं, फिर दस्तावेज़ को सादे पाठ के रूप में सहेजें।
यह मेरे लिए अच्छी तरह से काम करता है क्योंकि मुझे केवल एक सामयिक ओसीआर रूपांतरण की आवश्यकता है।
यदि आप एवरनोट से सभी चित्र प्राप्त कर सकते हैं, तो आप Google डॉक्स के साथ ओसीआर कर सकते हैं।
आप Google डॉक्स में छवियों का एक फ़ोल्डर अपलोड कर सकते हैं और उन्हें दस्तावेज़ों में परिवर्तित कर सकते हैं, जिसमें छवि और ओसीआरएड पाठ दोनों शामिल होंगे।
फिर आप इन सभी दस्तावेजों को सादे पाठ के रूप में बैच-डाउनलोड कर सकते हैं, जो छवि को बाहर निकाल देगा।
यदि आप सभी एवरनोट छवियों को हैश (जैसे md5
) के साथ नाम देते हैं , तो Google डॉक्स से डाउनलोड की गई सादे पाठ फ़ाइलों को मूल छवि के साथ जोड़ना आसान होना चाहिए।
मैं विंडोज पर हूं और एडोब एक्रोबेट प्रो और वर्ड का उपयोग करता हूं इसलिए मैं निम्नलिखित कार्य करता हूं: