क्या Acrobat 11 को कई CPU कोर का उपयोग करके OCR किया जा सकता है?


8

OCR प्रोसेसिंग में समय लगता है। कई सीपीयू कोर के उपयोग से प्रोसेसिंग में तेजी आएगी। एक्रोबैट 10 एक बहुपरत अनुप्रयोग नहीं था । एक्रोबैट 11 के बारे में कैसे? क्या डिफ़ॉल्ट रूप से 11 OCR मल्टीपल CPU कोर (यदि उपलब्ध हो) का उपयोग करता है? यदि नहीं, तो क्या कोई वर्कअराउंड, जैसे स्क्रिप्टिंग, एक्रोबैट 11 को बनाने में मदद करने के लिए कई सीपीयू कोर का उपयोग करके ओसीआर करना है? या तो एक्रोबेट की स्क्रिप्टिंग भाषा में निर्मित या बाहरी स्क्रिप्ट का उपयोग करके जो प्रसंस्करण नौकरी के कुछ हिस्सों में एक्रोबेट के कई एकल थ्रेड इंस्टेंस लॉन्च और निर्देशित करता है।

नोट: यह प्रश्न बहुत अधिक स्थानीय नहीं है (समय में एक विशिष्ट क्षण तक सीमित नहीं है) क्योंकि (1) एडोब बहुत बार नए प्रमुख एक्रोबैट संस्करणों को जारी नहीं करता है (एक्रोबैट 10 दो साल पहले जारी किया गया था) और (2) एडोब एक्रोबैट एक व्यापक रूप से है इस्तेमाल किया आवेदन।

जवाबों:


6

मैंने VirtualBox में एक्रोबैट 11 (XI) परीक्षण स्थापित किया है । एक्रोबैट 11 सिंगल थ्रेडेड है।

मैंने एक बाहरी स्क्रिप्ट भी बनाई है जो कई एक्रोबेट इंस्टेंस (प्रति सीपीयू कोर) शुरू करती है, ओसीआर काम को समानांतर करती है और परिणाम को मर्ज करती है। एक महत्वपूर्ण कदम एक्रोबैट वरीयताओं में त्रुटि लॉगिंग को चालू करना है, सभी को पार्सल करना है और किसी भी त्रुटि फ़ाइलों को पुन: उत्पन्न करना है। स्क्रिप्ट (4 कोर का उपयोग करते समय) अभी भी एक्रोबैट 11 डिफ़ॉल्ट की तुलना में दो गुना अधिक तेजी से ओसीआर करता है।


4
आप चाहें तो सिर्फ सोर्स दे सकते हैं। यदि वे इसे हटाने की हिम्मत करते हैं तो इसे आसानी से बहाल किया जा सकता है।
जॉय

इसके अलावा, यदि आप वही व्यक्ति हैं, जिसने प्रश्न पोस्ट किया है, तो अपने दोनों अपंजीकृत खातों को एक नए, पंजीकृत एक में विलय करने पर विचार करें। आप यहां शुरू कर सकते हैं , और अधिक जानकारी के लिए इसे भी पढ़ सकते हैं। उसके बाद आप अपने प्रश्न को संशोधित करने में सक्षम होंगे जैसा कि आप फिट देखते हैं।
Indrek

मैं कुछ भी बाधा डालने की कोशिश नहीं कर रहा हूं। क्योंकि आप उपयोगकर्ता नामों को बदलते रहते हैं, इसलिए ऐसा प्रतीत होता है कि आपके संपादन किसी तीसरे पक्ष द्वारा किए गए थे, जो मूल प्रश्न को नहीं समझते थे। इसके अलावा, यदि आप अपने स्वयं के प्रश्न का उत्तर देना चाहते हैं, तो आपको प्रश्न लिखना चाहिए और एक ही बार में उत्तर देना चाहिए।
आइजैक राबिनोविच

मैंने आपके (अपंजीकृत) खातों को अभी के लिए मर्ज कर दिया है। हालांकि हम आपसे एक डिस्पोजेबल ई-मेल पते का उपयोग नहीं करने के लिए कहेंगे, लेकिन हमारी साइट पर रजिस्टर करें ताकि आप लॉग इन रह सकें, अपने सवालों पर टिप्पणी कर सकें, वगैरह-वगैरह। इसके अलावा, कुछ भी नहीं हटाया जाएगा, चिंता की कोई बात नहीं है। बस ध्यान दें कि गुमनाम संपादन की हमेशा अधिक सख्ती से समीक्षा की जाती है।
13

1
@tarcman अपनी स्क्रिप्ट पोस्ट करने की कोई संभावना? मुझे यकीन है कि बहुत सारे लोग हैं जो इसे इस्तेमाल करने में दिलचस्पी लेंगे
जेसन

1

मल्टीथ्रेडिंग को एक एप्लिकेशन में बनाया जाना चाहिए। डेवलपर को कोड लिखना होता है जो थ्रेड बनाता है और जो टास्क को उप-प्रकारों में तोड़ता है जिसे प्रत्येक थ्रेड को आवंटित किया जा सकता है। यदि एक्रोबेट के डेवलपर्स अपने ओसीआर मान्यता कोड के लिए ऐसा करने में विफल रहते हैं, तो उपयोगकर्ता के लिए आवश्यक अतिरिक्त तर्क बनाने का कोई रास्ता नहीं है।


2
यदि इसे उन पृष्ठों की श्रेणियों पर लागू किया जा सकता है, जो संभवत: कार्य को कई प्रक्रियाओं में विभाजित करने का प्रयास कर सकते हैं, तो प्रत्येक OCRing केवल कुछ पृष्ठ और बाद में परिणामों को एक साथ विलय कर सकते हैं।
जॉय

0

ओसीआर के लिए सभी कोर का उपयोग करने के लिए आप पीडीएफ-एक्सचेंज संपादक को देखना चाहते हैं। यह ओसीआर इंजन मेरे सिस्टम पर सभी कोर का उपयोग करता है। एक बार जब आप प्रदर्शन के इस स्तर पर पहुँच जाते हैं, तो यह समझ में आता है कि SSD का उपयोग करें।

एक विंडोज़ ट्विन होना चाहिए जो इसे एक थ्रेडेड एप्लिकेशन को अधिक सीपीयू समय समर्पित करने का कारण बनेगा जो कि I / O बाध्य नहीं है। मेरे सिस्टम पर एक्रोबैट को डिस्क प्रदर्शन द्वारा धीमा नहीं किया जा रहा है, लेकिन सबसे अधिक सीपीयू समय जो मैं एक इंडेक्स का निर्माण करता है, वह लगभग 30% है।

आइए इसका सामना करते हैं, एक्रोबेट एक व्यापक रूप से इस्तेमाल किया जाने वाला लेकिन खराब लिखित अनुप्रयोग है। एक्रोबेट प्रो में कुछ विशेषताएं हैं जो आपको अभी भी कहीं और (अभी तक) नहीं मिल सकती हैं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.