बैच पीडीएफ फाइलों से टिप्पणियों को हटा दें


15

मैं आसानी से सभी टिप्पणियों और एनोटेशन (फॉक्सिट रीडर के साथ जोड़ा) को एक फ़ोल्डर में सभी पीडीएफ से कैसे निकाल सकता हूं?


1
क्या यह सोचना एक मान्य धारणा है कि आप केवल (बीयर के रूप में) मुफ्त में या मुफ्त में (स्वतंत्रता के रूप में) समाधान चाहते हैं?
Kurt Pfeifle

@ पिपिटास मुझे किसी भी तरह के समाधान में दिलचस्पी है।
Andrew MacFie

जवाबों:


5

आप एक यूनिक्स प्रणाली पर उपलब्ध करा रहे हैं:

cd <directory containing PDFs>
find . -type f -name '*.pdf' -exec perl -pi -e 's:/Annots \[[^]]+\]::g' {} +

यह एक हैक है जो सभी को दूर करता है /Annots पीडीएफ से कमांड (एनोटेशन खींचने वाली कमांड)। यह एनोटेशन ऑब्जेक्ट्स को वहां छोड़ देता है (आप पीडीएफ को एक टेक्स्ट एडिटर के साथ खोल सकते हैं और उन्हें खोज सकते हैं), वे सिर्फ तैयार नहीं हैं।


क्या आप आरई को समझा सकते हैं? [^] क्या करता है + मैच
jftuga

1
@jftuga, s: (विकल्प) /Annots \[ (ये पाठ " /Annots [ ") [^]]+ (किसी भी चरित्र के एक या एक से अधिक उदाहरणों के अलावा " ] ") \] (शाब्दिक चरित्र " ] ") :: (कुछ भी नहीं के साथ पूर्व मिलान कुछ भी बदलें) g (यदि आवश्यक हो तो प्रति पंक्ति कई बार बदलें)।
Divinenephron

1
रेगेक्स का एक संभावित भ्रामक हिस्सा यह है कि एक शाब्दिक ] सामान्य रूप से बच निकलना है, लेकिन सही नहीं है ^ निषेध।
Divinenephron

3

मैं बस इस समस्या पर गिर गया, और यहाँ दिए गए किसी भी उत्तर ने मेरे लिए काम नहीं किया। क्या किया था काम था rewritepdf उबंटू पैकेज से उपकरण libcam-pdf-perl:

rewritepdf -C in.pdf out.pdf

एक निर्देशिका में सभी पीडीएफ फाइलों से एनोटेशन को हटाने के लिए इसे थोड़ा स्क्रिप्टिंग में लपेटना अब आसान है:

for i in *.pdf; do rewritepdf -C '$i' '$i'.new; done

यह ठीक काम किया। :) कुछ मदद: उबंटू (यानी, डेबियन) पैकेज यहां है packages.debian.org/sid/perl/libcam-pdf-perl निर्भरता स्वचालित रूप से "उबंटू सॉफ्टवेयर सेंटर" का उपयोग करके स्थापित की जाती है। (ओह, और राजधानी "-सी" के साथ बाहर देखो। मैं पहली बार "-c" भागा और कुछ भी नहीं हुआ, यहां तक ​​कि कोई भी त्रुटि आउटपुट नहीं थी।)
loved.by.Jesus

2

मैं सोच आप पीडीएफ को "रीफ़्रेश करके" सबसे आसानी से कर सकते हैं। रिफ़रिंग का अर्थ है: पहले फ़ाइल को पोस्टस्क्रिप्ट में बदलें, फिर पोस्टस्क्रिप्ट को पीडीएफ में बदलें। आमतौर पर रिफाइंडिंग पर ध्यान केंद्रित किया जाता है, क्योंकि आमतौर पर आप गुणवत्ता और कुछ सामग्री को ढीला करते हैं। आपके मामले में आप चाहते हैं सामग्री को ढीला करने के लिए। री-फ्राइंग के साथ किया जा सकता है Ghostscript (और सहायक बैच फाइल इसके साथ शिपिंग करता है - डाउनलोड करें gs900w32.exe यदि आप विंडोज पर हैं), तो यहां आप जाते हैं, 2 आसान कमांड के साथ:

pdf2ps.bat input.pdf output.ps
ps2pdf.bat output.ps input_refried.pdf

1
यह काम नहीं करता है। लिखित टिप्पणियां बनी रहती हैं (टिप्पणियों के रूप में नहीं, लेकिन पीडीएफ के हिस्से के रूप में)।
Andrew MacFie

2
यदि टिप्पणियों को वास्तव में पीडीएफ की सामग्री में जोड़ा जाता है, तो उन्हें केवल मैन्युअल रूप से हटाया जा सकता है। वास्तविक पीडीएफ एनोटेशन अलग हैं।
CarlF

किसी भी कनवर्टर का उपयोग किए बिना कोई रास्ता नहीं है?
user

2

ठीक है, आपने कहा कि आप एक वाणिज्यिक समाधान पर भी विचार करेंगे ...।

मैं आपको कोशिश करने की सलाह दूंगा callas pdfToolbox । यह विंडोज और मैक ओएस एक्स के लिए उपलब्ध है (उनके पास लिनक्स के लिए भी एक सीएलआई है, लेकिन आप केवल इसके साथ पूर्व-कॉन्फ़िगर "प्रोफाइल" का उपयोग कर सकते हैं। विंडोज जीयूआई के साथ, आप अपने कस्टम प्रोफाइल बना सकते हैं और उनके साथ फिर से उपयोग कर सकते हैं। हालांकि, लिनक्स सीएलआई।

PDFToolbox में बहुत से और बहुत सारे और बहुत सारे और कई व्यक्तिगत पीडीएफ समस्याओं को हेरफेर करने और ठीक करने का तरीका है।

"फ़िक्सअप" में से एक है सभी एनोटेशन को निकालना।

आपको पहले परीक्षण करने के लिए किसी भी पैसे को निकालने की आवश्यकता नहीं है; Callas मुफ्त में 14 दिन का परीक्षण लाइसेंस देता है।


यह वास्तव में सभी एनोटेशन को हटाने का एक तरीका है, लेकिन मुझे यकीन नहीं है कि बैच काम कैसे किया जाए।
Andrew MacFie

पिछले संस्करणों के बारे में पता नहीं --- लेकिन नवीनतम pdfToolbox5 रिलीज पीडीएफ वाले पूर्ण फ़ोल्डरों के खिलाफ बैच मोड में इसे चलाने की अनुमति देता है .....
Kurt Pfeifle
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.