मुझे सैम और रयान थॉम्पसन के साथ-साथ अन्य सभी उत्तरदाताओं के लिए पहले धन्यवाद देना होगा - मेरे जवाब के लिए यहां कुछ भी नहीं है, बल्कि थूनर की कस्टम क्रियाओं में उनके समाधान जोड़ने की संभावना से संबंधित भिन्नता है:
इसलिए, किसी भी टर्मिनल कमांड के रूप में, एक फ़ोल्डर के भीतर सभी पीडीएफ फाइलों को टेक्स्ट में बदलने के लिए एक आदेश को थून फाइल प्रबंधक में कस्टम कार्यों की सूची में रखा जा सकता है
वहाँ की कमान है find . -name '*.pdf' -print0 | xargs -0 -n1 pdftotext
, ( रयान थॉम्पसन से ) यह वह है जिसे मैं उपयोग करना पसंद करता हूं, लेकिन यह एक बुरा मोड़ है ... देखें ...
... यह एक मज़ेदार आदेश है, जिसका उपयोग देखभाल के साथ किया जाता है: यह फ़ोल्डर के भीतर सभी पीडीएफ को पाठ में परिवर्तित करने के लिए बनाया गया है, जहां इसे निकाल दिया जाता है, इसलिए, यदि इसे घर के फ़ोल्डर में गलती से निकाल दिया जाता है, तो यह कुछ अवांछित होगा प्रभाव: आपके सभी पीडीएफ़ पाठ में परिवर्तित हो जाएंगे!
(मैंने इसे इस तरह से परीक्षण किया: डेस्कटॉप पर "परीक्षण" नामक एक फ़ोल्डर बनाया और इसमें एक पीडीएफ फाइल और फ़ोल्डरों के भीतर फ़ोल्डर्स की एक श्रृंखला ( /Desktop/test/a/b/c/e/f/g/h/i
) एक ही पीडीएफ युक्त प्रत्येक)। उस आदेश को चलाने से /Desktop/test
सभी pdfs को उस में परिवर्तित कर दिया है। "मैं" फ़ोल्डर।)
(मैं इस आदेश को समायोजित करने के लिए टिप्पणियों का स्वागत करूंगा ताकि उस जोखिम से बचा जा सके।)
सैमfor file in *.pdf; do pdftotext "$file" "$file.txt"; done
से आने वाले अन्य ( ) के साथ बदलने से समस्या से बचा जाता है।
लेकिन कुछ मामलों में कोई भी ठीक उसी तरह से कामना कर सकता है जो रयान का समाधान करता है!