मैक ओएस एक्स: एक पीडीएफ निर्देशिका में उनके फ़ाइल नामों के अनुसार मर्ज कैसे करें


30

मैं निर्देशिका में कई सौ पीडीएफ फाइलों को उनके फ़ाइल नामों के अनुसार स्वचालित रूप से मर्ज करना चाहता हूं ।

उदाहरण के लिए

फ़ाइलें 1000.1.pdf 1000.2.pdf 1000.3.pdf 1000.x.pdf को 1000.pdf में विलय किया जाना चाहिए

तथा

2000.abc.pdf 2000.def.pdf 2000.ghi.pdf 2000.jkl.pdf 2000.5.pdf में 2000.pdf

मैं पूर्वावलोकन / स्वचालक (यदि उपलब्ध हो) के आधार पर समाधानों का उपयोग नहीं करना चाहता, क्योंकि एडोब एक्रोबेट या पीडीएफपेन जैसे पीडीएफ फाइलों को अक्सर पीडीएफ फाइलों में विलय कर दिया जाता है (स्रोत दस्तावेजों के आधार पर) फ़ाइल आकार में उल्लेखनीय वृद्धि (उदाहरण के लिए देखें) जब पूर्वावलोकन में बचत क्या वृद्धि करने के लिए पीडीएफ फाइल आकार का कारण बनता है? )

क्या आपके पास कोई सिफारिश है? धन्यवाद!


PDF को मिलाने से फाइल का आकार हमेशा बढ़ेगा, वास्तव में आपके साथ क्या समस्या है?
nohillside

1
@patrix मैं विलय की जाने वाली सैकड़ों फ़ाइलों की बात कर रहा हूं। जैसा कि ऊपर जोड़ा गया है, मैक ओएस एक्स में शामिल विभिन्न उपकरणों के साथ फ़ाइल आकार में उल्लेखनीय वृद्धि हो सकती है। मुझे कभी-कभी कई सौ प्रतिशत के आकार में वृद्धि के साथ एक मर्ज किए गए पाठ फ़ाइल क्यों चाहिए ?
लीजोनेट

2
@patrix, lejone8 ​​PDF फ़ाइलों का एक स्वचालित मर्ज करना चाहता है, लेकिन 1 + 1 = 2 अनुपात में, 1 + 1 = 5 के साथ नहीं? या फ़ाइल आकार में अधिक। इसके अलावा lejonet8 स्पष्ट रूप से बताता है कि Apple उत्पादों का उपयोग तीसरे पक्ष के उत्पादों की तुलना में खराब प्रदर्शन के कारण स्वीकार्य नहीं है! मुझे नहीं पता कि आप मेरी टिप्पणियों को क्यों हटाते हैं, लेकिन ऐसा हो।
रूस

1
मुझे ऑटोमेशन के अनुरोध की समझ नहीं है। यह नाम से (सॉर्ट) फ़ाइलों को व्यवस्थित करने के लिए बहुत सरल और तेज़ है, फिर सभी वांछित श्रेणी में चयन करें, और किसी भी उपलब्ध प्रोग्राम जैसे यहां, या अन्य में क्लिक करके मर्ज करें। परिणामस्वरूप फ़ाइल आकार पीडीएफ फाइलों के प्रकार और सामग्री पर निर्भर करेगा, इसलिए 1 + 1 = 2 संभव नहीं है। Lejonet8 इस तर्क पर लटका हुआ प्रतीत होता है कि Apple प्रोग्राम बड़ी पीडीएफ फाइलें क्यों बनाते हैं, फिर अन्य। उत्तर देने में सौभाग्य है।
रूस

2
क्या आप अधिक विवरणों में वर्णन करने के लिए प्रश्न को संपादित कर सकते हैं कि आपके लिए "स्वचालित" का क्या अर्थ है (यह आपकी समस्या के समाधान के लिए समय निकालने वाले लोगों के लिए अलग-अलग चीजों का मतलब लगता है)? दस्तावेजों के विलय को क्या ट्रिगर करना चाहिए? मिलान करने वाली फ़ाइलों को खोजने के लिए कौन से पैटर्न का उपयोग किया जाना चाहिए? विशेष रूप से डीडब्ल्यू का जवाब पहली नज़र में अत्यधिक स्वचालित प्रतीत होता है, लेकिन शायद आपके प्रश्न के पीछे और भी बहुत कुछ है जो हम अभी जानते हैं।
nohillside

जवाबों:


25

पीडीएफटी की कोशिश करें । यह कमांड-लाइन सॉफ्टवेयर है जो पीडीएफ फाइलों में शामिल हो सकता है (और बहुत सारे अन्य सामान भी करता है, लेकिन यह यहां प्रासंगिक नहीं है)। आप इसे आधिकारिक पीडीएफ वेब पेज से डाउनलोड कर सकते हैं ।

नमूना सिंटैक्स:

pdftk old1.pdf old2.pdf old3.pdf cat output new.pdf

फ़ाइल पैदा करेगा new.pdfकि फ़ाइलों के संयोजन होता है old1.pdf, old2.pdf, old3.pdf

अपनी समस्या को हल करने के लिए, अपने उदाहरण फ़ाइलनाम के साथ:

pdftk 1000.*.pdf cat 1000.pdf
pdftk 2000.*.pdf cat 2000.pdf

और इसी तरह। यदि आप चाहें तो इसे पूरी तरह से स्वचालित बनाने के लिए शेल स्क्रिप्टिंग का उपयोग कर सकते हैं (लेकिन आपको शेल स्क्रिप्ट लिखने का तरीका सीखने में थोड़ा समय देना होगा)।


सभी फाइलों को 1000.x, 2000.x आदि मानकर एक शेल स्क्रिप्ट को किसी तरह से देखा जा सकता है

#!/bin/bash

for n in {1..9}; do
    if [[ -r ${n}000.1.pdf ]]; then
        rm -f ${n}000.pdf
        pdftk ${n}000.*.pdf cat ${n}000.pdf && mv ${n}000.*.pdf ~/.Trash/
    fi
done

आपकी टिप्पणी के लिए धन्यवाद, लेकिन मैं नहीं देखता कि मेरी ज़रूरतों के लिए एक वर्कफ़्लो कहां है (समान नामों वाली सैकड़ों फाइलें, इन नामों के अनुसार विलय की गई हैं)।
lejonet

1
@ lejonet8, यही वह जगह है जहाँ कमांड लाइन उपकरण चमकते हैं! मैंने अपना उत्तर संपादित कर दिया है कि आपको यह कैसे करना है। आगे के विवरणों पर काम करना शायद इस प्रश्न के दायरे से बाहर है, और शेल स्क्रिप्ट लिखने के तरीके से अधिक संबंधित है।
डीडब्ल्यू

आपके उत्तर के लिए धन्यवाद। दुर्भाग्य से इसे मेरी फाइलों पर चलाने से यह त्रुटि संदेश के रूप में सामने आया: त्रुटि: पेज रेंज के अंत में अनपेक्षित पाठ, यहां: 1000.pdf
lejonet

1
@ lejonet8 शायद आप प्रश्न में अपनी स्वचालन आवश्यकताओं पर थोड़ा और विस्तार कर सकते हैं । क्या आप "फ़ोल्डर क्रियाएँ" या इस तरह की चीजों की तलाश कर रहे हैं? पहली जगह में गति प्रक्रिया को क्या ट्रिगर करेगा?
nohillside

3
@ lejonet8, आपको यह देखने के लिए थोड़ा प्रयोग करना पड़ सकता है कि आपके लिए pdftk कैसे काम करता है। एक त्रुटि संदेश, बिना किसी संदर्भ के, दुर्भाग्य से मेरे लिए समस्या का निदान करने के लिए पर्याप्त नहीं है। कुछ जोड़ी फाइलों को समेटने की कोशिश करें। प्रयोग। देखें कि क्या आप निदान कर सकते हैं जब pdftk काम करता है / नहीं करता है और कारण। ट्यूटोरियल पढ़ें। फिर, एक उपयुक्त स्टैक एक्सचेंज साइट या अन्य प्रश्न-उत्तर साइट पर pdftk काम करने के बारे में एक प्रश्न पोस्ट करें। FWIW, pdftk मेरे लिए बहुत विश्वसनीय रहा है, कई विभिन्न कार्यक्रमों द्वारा उत्पन्न पीडीएफ फाइलों की एक विस्तृत विविधता के साथ काम कर रहा है। बेशक आपका अनुभव भिन्न हो सकता है।
डीडब्ल्यू

52

आटोमैटर में एक पायथन लिपि छिपी होती है जो .PDF-files से जुड़ती है

/System/Library/Automator/Combine\ PDF\ Pages.action/Contents/Resources/join.py --help
Usage: join [--output <file>] [--shuffle] [--verbose]

उदाहरण का उपयोग:

/System/Library/Automator/Combine\ PDF\ Pages.action/Contents/Resources/join.py --output all.pdf *.pdf

2
आपके उत्तर के लिए धन्यवाद। मैं तकनीकी पृष्ठभूमि पर टिप्पणी नहीं कर सकता (ऑटोमेटर और पूर्वावलोकन में विलय में अंतर हो सकता है)। स्रोत फ़ाइलों के आधार पर फ़ाइल आकार में भी उल्लेखनीय वृद्धि हो सकती है। मैंने अभी इसे फिर से परीक्षण किया और कुल 12 mb के आकार के साथ चार फाइलें जहाँ 32 mb दस्तावेज़ में शामिल हुआ। यह अस्वीकार्य है।
lejonet

क्षमा करें, इससे कोई मदद नहीं मिल सकती।
आखुण

4
मैंने इस कमांड को अपनी ~/.bash_profileफ़ाइल में इस तरह से एक उपनाम के रूप में जोड़ा है : alias catpdf="/System/Library/Automator/Combine\ PDF\ Pages.action/Contents/Resources/join.py --output all.pdf *.pdf"इसलिए मैं बस cdपीडीएफ और रन वाली निर्देशिका में शामिल हो सकता हूं catpdf
स्टीवर्ट मैकडोनाल्ड

2
एक एपीपी में छिपे पायथन स्क्रिप्ट के सरल उपयोग के लिए अपवोटिंग! मैंने अधिक मजबूत समाधान के लिए हालांकि pdftk का उपयोग करने का निर्णय लिया।
ब्लेयरगें

1
@lejonet तकनीकी पृष्ठभूमि यह है कि दोनों समान रूपरेखाओं का उपयोग करते हैं (10.11 पर क्वार्ट्ज.ऑर्गेनिक्स), जैसा आपने अनुमान लगाया था। इसे `join.py 'script (आयात विवरण) की पहली पंक्तियों से देखा जा सकता है।
hans_meine

8

आप के pdfuniteसाथ वितरित उपयोग कर सकते हैं poppler। आप popplerHomebrew के साथ स्थापित कर सकते हैं :

brew install poppler

और अब इसका उपयोग करें:

pdfunite input1.pdf input2.pdf input3.pdf output.pdf

popplerइन अन्य आदेशों के साथ आता है: pdfdetach, pdffonts, pdfimages, pdfinfo, pdfseparate, pdftocairo, pdftohtml, pdftoppm, pdftops, pdftotext, के अलावा pdfunite


0

pdftk El Capitan पर अब और काम नहीं करता है! (OS X 10.10)

एक विकल्प PDFTron से पेजमास्टर है। वाक्य विन्यास होगा:

pagemaster -m *.pdf -o output.pdf

यह ऊपर दिए गए ऑटोमेटर समाधान की फ़ाइल आकार वृद्धि की समस्या नहीं है, क्योंकि यह एक कस्टम पीडीएफ लाइब्रेरी का उपयोग करता है।

नोट: यह एक फ्री टूल नहीं है। डेमो संस्करण प्रत्येक पृष्ठ पर एक पतली वॉटरमार्क जोड़ता है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.