मुझे अभी तक सफलता मिली है (16.04 के तहत) pdfocr.rb के साथ । यह उबंटू विकी पर सूचीबद्ध है
यहाँ एक ppa है, लेकिन 16.04 के लिए भंडार अपडेट नहीं किया गया है। गितुब से ऊपर की रूबी लिपि हालांकि 16.04 के साथ काम करती है।
आप इसे Github से डाउनलोड कर सकते हैं। आपको निम्नलिखित संकुल स्थापित करने की आवश्यकता होगी:
ruby tesseract-ocr pdftk exactimage
तब pdfocr.rb को निष्पादन योग्य बनाया और चलाया गया:
./pdfocf.rb -i source.pdf -o output.pdf
वैकल्पिक रूप से आप -l LANG
पैरामीटर का उपयोग कर सकते हैं । उस स्थिति में आपको tesseract-ocr-LANG
पैकेज स्थापित करने की आवश्यकता होगी , जहां LANG
तीन अक्षर आईएसओ 639-2 भाषा कोड है। अभी आपके पास 16.04 रेपो पर 108 भाषाएं हैं।