पिछले सप्ताह के अंत में मैं अपने दादा-दादी की जगह पर था। मेरी दादी ने अपने परिवार के इतिहास की इस विशालकाय (~ 1400 पृष्ठ) किताब को 1630 या उसके बाद वापस ले लिया। विशालकाय बेवकूफ है कि मैं कर रहा हूँ, मैंने सोचा कि यह डेटाबेस में संग्रहीत और वेब से उपलब्ध सभी जानकारी के लिए चालाक होगा। मैं सभी वेब प्रोग्रामिंग और नियमित अभिव्यक्ति को संभाल सकता हूं और क्या नहीं, लेकिन जो मुझे नहीं पता है वह पुस्तक से कंप्यूटर तक पाठ प्राप्त करने का सबसे अच्छा तरीका है।
मुझे पता है कि मेरे द्वारा किए गए थोड़े से शोध से ओसीआर आवश्यक होगा, ऐसा लगता है जैसे मेरे विकल्प हैं:
- एक कैमरे के साथ हर पेज की तस्वीर लें और फिर OCR सॉफ्टवेयर के साथ चित्रों को प्रोसेस करें
- प्रत्येक पृष्ठ को स्कैन करने के लिए एक स्कैनर का उपयोग करें, फिर ओसीआर सॉफ्टवेयर के साथ प्रक्रिया करें
- कुछ इस तरह से हाथ से पकड़े हुए उपकरण का उपयोग करें ।
क्या किसी के पास इस समस्या से निपटने के सर्वोत्तम तरीके के बारे में कोई विचार है? मैं पुस्तक को नष्ट नहीं करना चाहता, क्योंकि जहाँ तक मुझे पता है, इसे प्रतिस्थापित नहीं किया जा सकता है। यह शायद एकमात्र समय है जब मैं कभी भी एक बड़ी पुस्तक को स्कैन करने जा रहा हूं, इसलिए मुझे नहीं लगता कि मैं किसी भी तरह के उपकरण पर $ 250 से अधिक खर्च करना चाहता हूं। मुझे यहां कुछ मैनुअल प्रयास में कोई आपत्ति नहीं है (मुझे लगता है कि यह सबसे अधिक संभावना है महीनों लगेंगे), लेकिन मैं संभव सबसे कुशल तरीका खोजना चाहता हूं।
पुस्तक के बारे में ध्यान दें: यह केवल 20 साल पुराना है, इसलिए यह बहुत अच्छे आकार में है। यह मोनोक्रोम है और पृष्ठ पीले होने शुरू नहीं हुए हैं। चूंकि यह इतना बड़ा है, फिर भी मैं संभावित छाया के बारे में चिंता करता हूं जब पाठ बंधन के करीब पहुंच जाता है।