इग्नासियो का जवाब अभी ठीक है। वास्तव में, यह मेरी सूची में पहली बात होगी। ठीक है, कि और शायद सुझाव देने के लिए pdftohtml
उपकरण भी poppler, के साथ संयुक्त के साथ आता है कि pdfreflow अगर आप पैराग्राफों, आदि में पाठ को पुनः एकत्रित करने की कोशिश करना चाहते (बेशक, यह आप HTML आउटपुट दे देंगे, लेकिन सादा पाठ कर सकते हैं करने के लिए HTML परिवर्तित कई तरीकों से किया जा सकता है।)
यहाँ कुछ अन्य विकल्प भी हैं।
ebook-convert
से कमांड लाइन टूल कैलिबर , जो सादे पाठ में .PDFs परिवर्तित कर सकते हैं (या RTF या ebook प्रारूपों के एक नंबर, ePub, आदि)
pdftxtextract
से Podofo
Abiword को कमांडलाइन से बुलाया जा सकता है, किसी भी प्रारूप के बीच से इसे / निर्यात से इनपुट कर सकते हैं और उचित आयात प्लगइन के साथ, इसमें PDF शामिल हैं:
abiword --to=txt file.pdf
(निष्पक्षता में, मुझे लगता है कि AbiWord और कैलिबर दोनों पॉपलर पुस्तकालयों का उपयोग करते हैं, लेकिन मैं सकारात्मक नहीं हूं।)