मैं एक बहु-पृष्ठ .TIF फ़ाइल को एक पीडीएफ में कैसे बदल सकता हूँ? [डुप्लिकेट]


7

इस सवाल का पहले से ही यहाँ एक जवाब है:

मेरे पास एक GIGANTIC .TIF फ़ाइल है।

मैंने कुछ दिनों पहले एक किताब में स्कैन किया और मैंने गलती से इसे एक मल्टी-पेज .TIF के रूप में स्कैन कर लिया। मैं वास्तव में इसे एक अधिक सुलभ .PDF फ़ाइल में बदलना चाहता हूं।

क्या आपके पास कोई विचार है कि यह कैसे किया जा सकता है?


"GIGANTIC" किसी तरह व्यक्तिपरक है। आप अपने प्रश्न में सुधार कर सकते हैं, यदि आप कुछ संख्याएँ देते हैं: पृष्ठों की संख्या और TIF फ़ाइल का आकार (संकुचित या नहीं) एक अच्छा प्रारंभिक बिंदु होगा।
8:13

यह दो सवालों के अलग होने के बाद से जुड़े हुए प्रश्न की नकल नहीं है। इस मामले में व्यक्ति एक मल्टीपज TIFF फ़ाइल को एक एकल पीडीएफ में बदलना चाहता है। दूसरे व्यक्ति में MULTIPLE TIFF फ़ाइलों को एकल PDF में कनवर्ट और मर्ज करना चाहते हैं। जबकि संबंधित प्रश्न अलग हैं! क्या किसी प्रश्न को 'अद्वितीय' के रूप में चिह्नित करने का कोई तरीका है?
user2021355

पीडीएफ कनवर्टर साइटों के लिए झगड़ा ऑनलाइन मौजूद हैं। उदाहरण के लिए, एक त्वरित खोज सामने आई: tiff2pdf.com इसने मेरे 12 पेज के TIFF को एक पीडीएफ में सफलतापूर्वक बदल दिया। एक टिप्पणी में जवाब देने के लिए माफी लेकिन सवाल संपादन के लिए बंद है (अभी के लिए ... मैं इसे स्पष्टीकरण के साथ पुनर्जीवित करने की कोशिश कर रहा हूं :)।
user2021355

जवाबों:


16

तुम सिर्फ फ़ाइल स्वरूप ((के रूप में जोनाथन बेन-Avraham द्वारा बताया परिवर्तित पाठ को खोजने योग्य बना बिना ओसीआर के माध्यम से) के साथ ठीक कर रहे हैं, इस के लिए एक आदर्श कार्य किया जाएगा convertसे ImageMagick , जीत, लिनक्स: विभिन्न प्लेटफार्मों के लिए पैकेज (उपलब्ध मैक)।

अपनी बहु-पृष्ठ TIFF फ़ाइल को कनवर्ट करने के लिए बस उस कमांड का उपयोग करें

convert multi-page.tif book.pdf

हालाँकि, आपको -compressपैरामीटर को नियोजित करना चाहिए । यदि आपके पास 24 बिट रंगीन TIF है, तो आप LZW(दोषरहित) या JPEG(हानिपूर्ण) का उपयोग कर सकते हैं , जैसे

convert -compress LZW multi-page.tif book.pdf

यदि आपका TIFF काला और सफेद है (कृपया सुनिश्चित करें, यह वास्तव में केवल 1bit colordepth के साथ सहेजा गया है), मैं आमतौर पर उपयोग करता हूं -compress Fax

यहां 5 पृष्ठ नमूना फ़ाइल के लिए एक उदाहरण है, जिसमें कुछ पाठ हैं - संपीड़न एल्गोरिदम के बीच वास्तविक अनुपात आपकी फ़ाइल की सामग्री पर निश्चित रूप से निर्भर करता है:

24bit JPEG:  1294kB
24bit LZW:   1759kB
1bit  Fax:    135kB

उस रूपांतरण के बाद आप अभी भी एक OCR टूल (जैसे Adobe Acrobat Pro) को टेक्स्ट सर्च और कॉपी करने योग्य बना सकते हैं।


-compress Faxध्वज के लिए बहुत धन्यवाद जो पुस्तक स्कैन के लिए विशेष रूप से उपयोगी है।
फायरगुरफिकु

मेरे पास एक परिवर्तनीय निष्पादन योग्य नहीं था, लेकिन मेरे पास मैजिक था, इसलिए यह मेरे द्वारा उपयोग की जाने वाली कमांड है: मैजिक कन्वर्ट -compress फ़ैक्स "% 1.tif" "% 1.pdf"
रैंडल फ्लैग

2

TIFF (टैग की गई छवि फ़ाइल प्रारूप) एक पिक्सेल-उन्मुख प्रारूप है जो छवियों के लिए अभिप्रेत है। TIFF फ़ाइल से केवल वर्ण डेटा प्राप्त करने के लिए आपको OCR (ऑप्टिकल करारा बैक्टीरिया मान्यता) कार्यक्रम का उपयोग करना होगा। सभी ओसीआर कार्यक्रमों में कुछ त्रुटि दर है। पृष्ठों का प्रारूप (हेडर, फूटर, सेक्शन हेडिंग इत्यादि) भी OCR की क्षमता को प्रभावित करते हैं ताकि पात्रों का सटीक अनुमान लगाया जा सके।

भाषा और विशेष रूप से लेखन प्रणाली और फ़ॉन्ट भी ओसीआर सटीकता को प्रभावित करते हैं। यदि पुस्तक में असामान्य गैर-पश्चिमी फ़ॉन्ट है, जिसमें लिगुरेट्स हैं, तो गोट ओसीआर आउटपुट प्राप्त करने की संभावना शून्य के करीब है।

यदि पुस्तक मुख्य रूप से पाठ नहीं है, उदाहरण के लिए, कई स्क्रीन शॉट्स या अन्य चित्रों वाली पुस्तक जो महत्वपूर्ण हैं, तो ओसीआर आपकी मदद नहीं करेगा।

आपके द्वारा उपयोग किए जा रहे OS के आधार पर कुछ ओपन सोर्स OCR प्रोग्राम उपलब्ध हैं। Google ड्राइव में एक निशुल्क OCR सेवा है। WMMV।

यह मानते हुए कि आपके द्वारा स्कैन की गई मूल पुस्तक कागज प्रारूप में है, तो TIFF सबसे अच्छा है जो आप किसी भी घटना में कर सकते हैं। आप TIFF फ़ाइल को संपीड़ित करके दस्तावेज़ का आकार अधिक प्रबंधनीय बना सकते हैं। पठनीयता के खिलाफ दस्तावेज़ आकार को अनुकूलित करने के लिए संपीड़न के विभिन्न स्तरों के साथ JPEG संपीड़न का प्रयास करें।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.