मैंने कुछ ई-बुक्स / पेपर देखे हैं जो उनके पेपर वर्जन से जाहिर तौर पर स्कैन किए गए थे लेकिन ई-बुक्स / पेपर्स के टेक्स्ट को आश्चर्यजनक रूप से कॉपी किया जा सकता है। मुझे लगता है कि सीधे स्कैन किए गए संस्करणों को कुछ ऑप्टिकल कैरेक्टर मान्यता सॉफ्टवेयर द्वारा संसाधित किया जाना चाहिए था।
इसलिए मैं जानना चाहूंगा कि अनुशंसित ऑप्टिकल कैरेक्टर रिकग्निशन सॉफ्टवेयर्स क्या हैं? विशेष रूप से वे जो उबंटू के लिए या मुफ्त हैं? यदि विंडोज के लिए वे अधिक बेहतर हैं, तो कृपया मुझे भी बताएं।
मुझे उन OCRs में विशेष रूप से दिलचस्पी है, जो स्कैन की गई पीडीएफ फाइल को इनपुट के रूप में स्वीकार कर सकते हैं और फिर भी आउटपुट के रूप में एक और पीडीएफ फाइल का उत्पादन कर सकते हैं, जो इनपुट के समान है, लेकिन इसकी पाठ प्रतिलिपि के साथ।
धन्यवाद एवं शुभकामनाएँ!
कृपया प्रति उत्तर एक सॉफ़्टवेयर सीमित करें