पीडीएफ फाइल को ओड्ट फाइल में कैसे बदलें?


32

मैं एक .pdfफ़ाइल को एक .odtफ़ाइल में बदलना चाहता हूं ताकि मैं इसे एक .docफ़ाइल में परिवर्तित कर सकूं । क्या कोई सॉफ्टवेयर / स्क्रिप्ट है जो ऐसा कर सकती है। मैंने .pdfफ़ाइल की सामग्री को कॉपी करने की कोशिश की है और इसे लिबरऑफिस लेखक में चिपकाया है कि प्रारूपण संरक्षित नहीं है।

दस्तावेज़ गोपनीय है इसलिए मैं रूपांतरण के लिए किसी भी ऑन-लाइन सेवा का उपयोग नहीं करना चाहूंगा।

किसी भी सहायताको बहुत सराहा जाएगा।


संबंधित (लेकिन एक डुप्लिकेट नहीं !): एक ओडीटी को पीडीएफ में कैसे बदलना है?
एलियाह कगन

1
LIBREOFFICE / OpenOffice विशिष्ट प्रश्नों के लिए, मैं ask.libreoffice.org
Bucic

जवाबों:


15

मैं एक मुक्त पीडीएफ की कमी से नाराज था ODT कनवर्टर भी। मुझे कुछ भी जटिल की जरूरत नहीं थी। बस एक उपकरण जो ओडीटी फ़ाइलों को उत्पन्न करता है जिन्हें मैं फिर लिबरऑफिस (जैसे फॉर्म भरने के लिए) में एनोटेट कर सकता हूं।

मुझे पता है कि PDF दस्तावेज़ को ग्राफ़िक्स फ़ाइलों में परिवर्तित करके और फिर उन्हें LibreOffice में आयात करके मैन्युअल रूप से यह कैसे करना है, लेकिन यह काफी तेज़ हो जाता है।

इसलिए, मैंने अंत में एक त्वरित लिटिल शेल स्क्रिप्ट लिखी जो सभी आवश्यक चरणों को स्वचालित रूप से करता है। आप इसे https://github.com/gutschke/pdf2odt पर पा सकते हैं

यह इनपुट के रूप में पीडीएफ और छवि फ़ाइलों की संख्या ले सकता है और एक ओडीटी फ़ाइल उत्पन्न करता है जिसे लिबर ऑफिस में खोला और संपादित किया जा सकता है। छवियाँ पृष्ठ पृष्ठभूमि के रूप में दिखाई देती हैं, इसलिए आप उन पर स्वतंत्र रूप से लिख सकते हैं। प्रत्येक छवि अपनी स्वयं की पृष्ठ शैली से जुड़ी होती है। पृष्ठ विराम सम्मिलित करते समय ध्यान रखें और पृष्ठ शैली को आवश्यकतानुसार समायोजित करें।

मैंने लिनक्स और मैक दोनों पर स्क्रिप्ट का परीक्षण किया। यह देखते हुए कि इसे केवल कुछ हद तक मानक उपकरणों की आवश्यकता है, यह काफी पोर्टेबल होना चाहिए।


यह स्क्रिप्ट प्रत्येक पृष्ठ के स्क्रीनशॉट बनाती है और उन्हें लक्ष्य प्रारूप में प्लॉट करती है, स्क्रिप्ट के लिए धन्यवाद Gutschke
ओलिवर

मैंने pdf2ooकुछ साल पहले इस्तेमाल किया था, लेकिन अब लगता है कि लिबरऑफिस के लिए भ्रष्ट फाइलों का उत्पादन होता है। यह स्क्रिप्ट ऐसा करती है और अधिक - धन्यवाद!
बाज़

3
PDF2odt स्क्रिप्ट, दुर्भाग्य से, एक छवि प्रारूप में परिवर्तित होती है, जिसका उपयोग ODT पृष्ठभूमि के रूप में किया जाता है। किसी भी मूल पाठ को "संपादित" करने में सक्षम होने की उम्मीद न करें।
रिचर्ड एल्किंस

13

आप एक नज़र डाल सकते हैं PDF Utilities(Synaptic या apt-get के माध्यम से poppler-utils) जिसमें pdftotext शामिल है :

Poppler एक PDF रेंडरिंग लाइब्रेरी है जो Xpdf PDF व्यूअर पर आधारित है।

इस पैकेज में पीडीएफ दस्तावेजों की जानकारी प्राप्त करने के लिए कमांड लाइन यूटिलिटीज (पॉपलर पर आधारित) हैं, उन्हें अन्य प्रारूपों में परिवर्तित करें, या उनमें हेरफेर करें:
* पीडीएफडेटाच - एम्बेडेड फ़ाइलों (अटैचमेंट्स) को सूचीबद्ध करता है या निकालता है
- pdffonts - फॉन्ट
एनालिसिस * pdfimages - छवि चिमटा
* pdfinfo - दस्तावेज़ जानकारी
* pdfseparate - पृष्ठ निष्कर्षण उपकरण
* pdftocairo - PDF to PNG / JPEG / PDF / PS / EPS / SVG कनवर्टर का उपयोग कर काहिरा
* pdftohtml - पीडीएफ से HTML कनवर्टर
* pdftoppm - पीडीएफ से पीपीएम / पीएनजी / JPEG छवि कनवर्टर
* pdftops - पोस्टस्क्रिप्ट (पी एस) कनवर्टर करने के लिए पीडीएफ
पाठ निष्कर्षण - * pdftotext
* pdfunite - दस्तावेज़ विलय उपकरण

बेशक, सफलता इस बात पर निर्भर करेगी कि पीडीएफ फाइल कैसे उत्पन्न हुई। यदि आप आप क्या चाहते हैं पाने के एक पाठ फ़ाइल के रूप में, आप कर सकते थे तो बचाने कि एक .odt फ़ाइल के रूप में।

संपादित करें: मैं उद्धरण के लिए स्रोत प्रदान करना भूल गया। यह के लिए Synaptic में विवरण टैब से हैPDF Utilities (based on Poppler).


3
इस सूची से, pdftohtmlकार्य के लिए सबसे उपयुक्त होना चाहिए, क्योंकि HTML प्रारूपण कर सकता है। तब HTML को ODT या DOC में परिवर्तित किया जा सकता था।
इम्ज़ - इवान ज़खरीशेव

10

लिब्रे ऑफिस .pdfफाइल आयात करने में सक्षम है । सर्वोत्तम परिणामों के लिए इसे लिबरऑफिस के वर्तमान संस्करण में खोलें। हालांकि, यह एक ड्राइंग के रूप में दस्तावेज़ को खोल देगा, और आप इसे केवल एक समर्थित छवि प्रारूप में परिवर्तित करने में सक्षम होंगे, न कि एक लेखक दस्तावेज़ के रूप में।

स्वाभाविक रूप से, सभी स्वरूपण संरक्षित नहीं हैं, लेकिन कम से कम कुछ।


1
मैंने हाल ही में यह कोशिश की, और यह सिर्फ भयानक है, यह एक प्रारूपण को थोड़ा भी नहीं बचाता है। अधिक से अधिक, यह पाठ को अपठनीय बनाता है।
हाय-एंजेल

3

यदि पॉपलर-यूटिल्स पैकेज स्थापित किया गया है, तो नीचे दिए गए Nautilus स्क्रिप्ट (एक निष्पादन योग्य फ़ाइल के रूप में ~ / .gnome2 / nautilus-script फ़ोल्डर में रखा जाएगा) पीडीएफ फाइल को HTML में बदलने में मदद करेगा (विकल्प "-i") को शामिल करने के लिए हटाया जा सकता है साथ ही छवियाँ), जिसे बाद में लिबर ऑफिस राइटर के साथ खोला जा सकता है और ODT के रूप में सहेजा जा सकता है, हालांकि रूपांतरण प्रारूपण की सफलता बहुत कुछ इस बात पर निर्भर करती है कि PDF कैसे बनाई जाती है।

http://ubuntuone.com/6xI1afyu6QdQvgdCGn0kym


इस मददगार स्क्रिप्ट के लिए धन्यवाद। बस एक छोटी सी टिप्पणी (से man pdftohtml): -noframes : generate no frames. Not supported in complex output mode.तो सेट के -noframesसाथ कोई प्रभाव नहीं पड़ेगा -c
ग्लूटानाट

2
धन्यवाद, मैंने अपनी स्क्रिप्ट से अब इस अनावश्यक विकल्प को हटा दिया है। इन सभी विकल्पों के लिए एक gui प्रदान करने के लिए एक ज़ेनिटी द्वारा संचालित बैश स्क्रिप्ट बहुत अच्छा लगेगा, ;-)
Sadi

# MHC, ऐसा लगता है कि यह जानकारी गलत है; अगर हम -noframes को शामिल नहीं करते हैं, तो हमें पीडीएफ पृष्ठों के लिए अलग-अलग html फाइलें मिलती हैं; इसलिए मैंने इसे अपनी स्क्रिप्ट में फिर से डाला।
सादी

वह अजीब है। प्रलेखन में एक गलती होनी चाहिए। मैं अपने हिसाब से स्क्रिप्ट की कॉपी बदल दूंगा। सर उठाने के लिए धन्यवाद!
Glutanimate

3

कैलिबर का प्रयास करें। यह HTML और फिर अन्य प्रारूपों में परिवर्तित होता है। इसने एक बड़ी (183 पृष्ठों) फ़ाइल पर बहुत अच्छा काम किया, जिसे मुझे अन्यथा प्रिंट करना पड़ता।

मेरे मामले में मैंने इसे एक एपुब में बदल दिया, लेकिन मज़े के लिए इसे सिर्फ एक डेडॉक्स में बदल दिया जो बहुत अच्छी तरह से निकला।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.