मैं हाल ही में भर में आया था Tesseract और OpenCV । ऐसा लगता है कि Tesseract एक पूर्ण विकसित OCR इंजन है और OpenCV का उपयोग OCR एप्लिकेशन / सेवा बनाने के लिए एक रूपरेखा के रूप में किया जा सकता है।
मैंने अपनी कुछ छवियों पर Tesseract का उपयोग करने की कोशिश की और इसकी सटीकता सभ्य लगती है। बाद में, मैंने ओटीसी प्रदर्शन करने के लिए ओपनसीवी का उपयोग करते हुए पायथन का उपयोग करके एक बहुत ही सरल ट्यूटोरियल को देखा और प्रभावित हुआ। कुछ ही मिनटों में, मैंने सिस्टम का प्रशिक्षण पूरा कर लिया और इसकी सटीकता अच्छी थी। लेकिन निश्चित रूप से, इस दृष्टिकोण को लेने का मतलब है कि मुझे एक बड़े प्रशिक्षण सेट का उपयोग करके अपने सिस्टम को बड़े पैमाने पर प्रशिक्षित करने की आवश्यकता है।
मेरे विशिष्ट प्रश्न निम्नलिखित हैं:
- कस्टम OCR ऐप बनाने के लिए Tesseract और OpenCV का उपयोग करने के बीच कोई कैसे चयन करता है?
- विभिन्न भाषाओं के लिए टेसेरैक्ट के लिए प्रशिक्षण डेटासेट उपलब्ध हैं। क्या ओपनसीवी में ऐसा ही कुछ है ताकि मुझे ओसीआर प्राप्त करने के लिए जमीन शुरू न करनी पड़े?
- कौन सा एक व्यावसायिक अनुप्रयोग के लिए बेहतर है?
कोई सुझाव?
OCR accuracy tests
और आपको कुछ चार्ट मिलेंगे। और मोबाइल एप्स की बात करें तो उनमें से ज्यादातर टीज़र का इस्तेमाल करते हैं। लेकिन अगर आप उनमें से कुछ को डाउनलोड करने के लिए परेशान हैं तो आप देखेंगे कि परिणाम वादों से थोड़ा अलग हैं। वे आमतौर पर सावधानीपूर्वक नियंत्रित वातावरण में एक वीडियो डेमो बनाते हैं और इसे youtube पर पोस्ट करते हैं, लेकिन जंगली में, यदि आप एक पृष्ठ / नुस्खा / कार्ड / स्कैन करते हैं, तो आपको कुछ मजेदार परिणाम मिलेंगे।