छवि को पाठ में बदलें


8

मुझे बैंक से एक स्कैन किया गया छवि दस्तावेज़ मिला है और मैं इसे उबंटू में छवियों के साथ सामान्य पाठ दस्तावेज़ में बदलना चाहता हूं।

क्या इसके लिए कोई उपकरण है?

जवाबों:


15

लिनक्स के लिए कई ओसीआर पाठक हैं जो छवि से पाठ में परिवर्तित हो सकते हैं। निम्नलिखित विकल्पों को देखें:

उपरोक्त सभी, ओप्रोपस को छोड़कर, इसी नाम के एक पैकेज में उबंटू रिपॉजिटरी में मौजूद हैं।

विभिन्न पाठक अलग-अलग छवि स्वरूपों का समर्थन करते हैं, इसलिए आप अपने विकल्पों में सीमित हो सकते हैं फ़ाइल स्वरूप आपके दस्तावेज़ में है। वैकल्पिक रूप से, यदि आप किसी विशेष ओसीआर रीडर का उपयोग करना चाहते हैं तो आप प्रारूप बदलने के लिए ImageMagick से कन्वर्ट टूल का उपयोग कर सकते हैं ।

यहाँ मेरे उत्तर से अनुकूलित ।


0

आपको पहले अपने linux मशीन पर "tesseract-ocr" स्थापित करने की आवश्यकता है।

sudo apt-get install tesseract-ocr

आप इसे मैन्युअल रूप से CLI से कर सकते हैं या मैंने उसी के लिए PHP कोड बनाया है, आप चाहें तो इसका उपयोग कर सकते हैं।

नोट: इस कोड को चलाने के लिए, php.ini में exec कमांड को सक्षम किया जाना चाहिए

<?php
//IMAGE TO TXT Conversion
    $input_file = $_REQUEST['input_file'];
    $out = explode(".",$input_file);

    $output_file = $out[0]."_".$out[1];
    $output_file_name  =    $output_file.".txt";

    echo "<br />----IMAGE To TXT conversion Started-----</br />";
    echo  exec('tesseract '.$input_file.' '.$output_file);
    echo "<br />----TXT conversion Done-----</br />";

    echo "<br /><b>Please Check----->".$output_file.".txt</b><br />";
    echo "Click <a target='_blank' href='".$output_file_name."'>Here </a>to view it<br />"; 
?>

इस कोड को रूट फ़ोल्डर में रखें और इसे ब्राउज़र से एक्सेस करें,

जैसे:

http://yourserver.com?input_file=1.png

नोट: 1. पीएनजी फ़ाइल आपकी वर्तमान निर्देशिका में मौजूद होनी चाहिए।

मुझे छवि अपलोड करने के अधिकार नहीं हैं, मैंने इस चित्र का उपयोग संदर्भ के लिए किया है, http://plone.org/documentation/kb-old/copy_of_ocr-in-plone-use-tesseract-ocr/phototest.gif/image_preview

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.