कनवर्ट करें पीडीएफ (कि LaTeX के साथ उत्पन्न किया गया था)। शुद्ध फ़ाइल के लिए


4

मुझे पता है कि एक मनमाना पीडीएफ को। नेट में बदलने की सामान्य समस्या या तो असंभव है या इसका परिणाम अनुपयोगी लाटेक्स होगा (उदाहरण के लिए, वेक्टर ग्राफिक्स के रूप में सब कुछ व्यक्त करके)।

लेकिन अगर मेरी पीडीएफ एक LaTeX फ़ाइल (जो अब मेरे पास नहीं है) से उत्पन्न हुई थी , तो क्या यह स्रोत फ़ाइल में "रिवर्स-इंजीनियर" करने का एक तरीका है?


जवाबों:


1

क्षमा करें, लेकिन यह फ़ाइल (LaTex) द्वारा उत्पन्न होने पर (बहुत) मदद नहीं करेगा।


+1 "नहीं" से सहमत हैं। मेरा मतलब है, यह संभव हो सकता है कि कुछ LaTeX फाइल बनाई जाए जो समान PDF आउटपुट उत्पन्न करे, लेकिन यहां तक ​​कि यह वास्तव में कठिन होगा और शायद वर्तमान तकनीक की सीमाओं से परे होगा। समस्या मूल रूप से एक कंप्यूटर प्रोग्राम को डिकम्पोज करने के लिए समान है, लेकिन LaTeX स्रोत और इसके पीडीएफ आउटपुट के बीच का डिस्कनेक्ट अधिकांश कंप्यूटर प्रोग्रामिंग भाषाओं की तुलना में अधिक है (इसलिए यह कठिन है)।
डेविड जेड

क्या उत्पन्न PDF किसी लेटेक्स-संबंधित मेटाडेटा को नहीं रखता है?
hsribei

मेरी जानकारी के कोई भी नहीं।
लजुएट

2

आपने अपनी .tex फ़ाइल खो दी है और शायद इसे संशोधित करने के लिए, पीडीएफ को फिर से बनाना चाहते हैं। आपकी फ़ाइल कितनी लंबी है और आपकी शैली कितनी "नियमित" है, इसके आधार पर, आप इसे मैन्युअल रूप से पुन: बनाने का प्रयास कर सकते हैं।

पाठ के लिए, आपको इसे पीडीएफ फाइल से कॉपी करने में सक्षम होना चाहिए (जब तक कि आप उसे हटाने के लिए एक अजीब सुरक्षा सुविधा का उपयोग नहीं करते हैं) और फिर इसे बड़ी मात्रा में Emacs में पेस्ट करें। fillआदेशों का उपयोग करके आप पृष्ठ विराम से निपट सकते हैं और पैराग्राफ संरचना को अच्छी तरह से और आसानी से पुनर्निर्माण कर सकते हैं। आप फिर हाइरन और उच्चारण की तरह, विलुप्त हो रहे पात्रों को ढूंढ / बदल सकते हैं। फुटनोट्स और कैप्शन पर नज़र रखना कुछ समस्या पैदा करेगा; मैं उन्हें चिपकाने का सुझाव देता हूं जहां वे होते हैं और पैराग्राफ संरचना को फिर से संगठित करने से पहले उनके अनुसार स्वरूपण करते हैं ।

ग्राफिक्स के लिए, यह मानते हुए कि वे वेक्टर छवियां हैं, आप उन्हें PDF फ़ाइल से बाहर निकालने के लिए इलस्ट्रेटर या इंकस्केप का उपयोग कर सकते हैं और उन्हें एक उपयुक्त फ़ाइल प्रकार के रूप में सहेज सकते हैं जिसका उपयोग pdflatex द्वारा किया जा सकता है। यदि वे jpgs हैं, तो आप भाग्य से बाहर हैं, क्योंकि उनके लिए उपयोगी होने के लिए गुणवत्ता पहले से ही बहुत समझौता हो जाएगी। अगर वे लाटेक्स द्वारा PSTricks या किसी प्रकार का उपयोग करके उत्पन्न किए गए थे ... आप भाग्य से बाहर हैं।

धारा और उपधारा शीर्षकों को पहचानने और सुधारने के लिए काफी आसान होना चाहिए। जैसा कि मैंने यह लिखा है, लेबलिंग और संदर्भ दर्द की दुनिया की तरह लग रहे हैं, लेकिन अगर आप इसे कागज पर योजना बनाते हैं, तो फ़ाइल को मैन्युअल रूप से पार्स करने से पहले, यह सक्षम होना चाहिए।

गणित के समीकरण, यदि आपके पास कुछ अतिरिक्त जटिल है, तो आपको इसे तेजी से लिखने में कोई समस्या नहीं होगी।

संदर्भों के लिए, आपको .bib फ़ाइल (यह मानते हुए कि आपने एक का उपयोग किया है) को फिर से बनाना होगा। मैं BibTeX प्रविष्टियों को डाउनलोड करने की सलाह दूंगा जिन्हें आप ऑनलाइन पा सकते हैं और बाकी को हाथ से भर सकते हैं।

सब सब में, यह एक (थकाऊ) सप्ताहांत परियोजना की तरह लग रहा है। मैंने इसे पहले किया है और यह उतना कठिन नहीं है जितना लगता है। फिर, यह एक ~ 20-पृष्ठ का दस्तावेज़ था और डॉक्टरेट शोध प्रबंध नहीं था, इसलिए अपनी लड़ाई बुद्धिमानी से सुनिश्चित करें। मैं केवल इतना कह सकता हूं कि यह सौभाग्य है


1

मैंने इसे भविष्य में अशुद्धि जाँचने वाले किसी भी व्यक्ति के लिए यहाँ डाल दिया है - जब तक आप पहले की तरह कुछ नहीं कर रहे हों, क्षमा करें

आपके उत्पादित पीडीएफ में मूल (या किसी भी) फ़ाइलों को शामिल / संलग्न करने के लिए लाटेक्स पैकेज हैं।

मैं यहां सारी जानकारी डालने जा रहा था, लेकिन एक नए उपयोगकर्ता के रूप में सिस्टम ने मुझे बताया कि जब मैंने लिखना समाप्त कर लिया था, तो मैं केवल दो लिंक बना सकता था, इसलिए यहां एक ही जानकारी है (एक अन्य चर्चा में) मैंने TeXworks मेलिंग में पोस्ट किया इस पोस्टिंग के बाद सूची शुरू में विफल रही।

http://tug.org/pipermail/texworks/2011q3/004624.html

paul http://twscript.paulanorman.info


0

यदि पीडीएफ मुख्य रूप से टेक्स्ट है, तो आप कच्चे टेक्स्ट को निकालने के लिए फाइल पर pdf2text चला सकते हैं। लेकिन फिर भी आपको फ़ॉर्मेटिंग प्राप्त करने के लिए सभी लाटेक्स कमांड को मैन्युअल रूप से सम्मिलित करना होगा।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.