जवाबों:
लिनक्स के लिए कई ओसीआर पाठक हैं जो छवि से पाठ में परिवर्तित हो सकते हैं। निम्नलिखित विकल्पों को देखें:
उपरोक्त सभी, ओप्रोपस को छोड़कर, इसी नाम के एक पैकेज में उबंटू रिपॉजिटरी में मौजूद हैं।
विभिन्न पाठक अलग-अलग छवि स्वरूपों का समर्थन करते हैं, इसलिए आप अपने विकल्पों में सीमित हो सकते हैं फ़ाइल स्वरूप आपके दस्तावेज़ में है। वैकल्पिक रूप से, यदि आप किसी विशेष ओसीआर रीडर का उपयोग करना चाहते हैं तो आप प्रारूप बदलने के लिए ImageMagick से कन्वर्ट टूल का उपयोग कर सकते हैं ।
यहाँ मेरे उत्तर से अनुकूलित ।
आपको पहले अपने linux मशीन पर "tesseract-ocr" स्थापित करने की आवश्यकता है।
sudo apt-get install tesseract-ocr
आप इसे मैन्युअल रूप से CLI से कर सकते हैं या मैंने उसी के लिए PHP कोड बनाया है, आप चाहें तो इसका उपयोग कर सकते हैं।
नोट: इस कोड को चलाने के लिए, php.ini में exec कमांड को सक्षम किया जाना चाहिए
<?php
//IMAGE TO TXT Conversion
$input_file = $_REQUEST['input_file'];
$out = explode(".",$input_file);
$output_file = $out[0]."_".$out[1];
$output_file_name = $output_file.".txt";
echo "<br />----IMAGE To TXT conversion Started-----</br />";
echo exec('tesseract '.$input_file.' '.$output_file);
echo "<br />----TXT conversion Done-----</br />";
echo "<br /><b>Please Check----->".$output_file.".txt</b><br />";
echo "Click <a target='_blank' href='".$output_file_name."'>Here </a>to view it<br />";
?>
इस कोड को रूट फ़ोल्डर में रखें और इसे ब्राउज़र से एक्सेस करें,
जैसे:
http://yourserver.com?input_file=1.png
नोट: 1. पीएनजी फ़ाइल आपकी वर्तमान निर्देशिका में मौजूद होनी चाहिए।
मुझे छवि अपलोड करने के अधिकार नहीं हैं, मैंने इस चित्र का उपयोग संदर्भ के लिए किया है, http://plone.org/documentation/kb-old/copy_of_ocr-in-plone-use-tesseract-ocr/phototest.gif/image_preview