pdftotext किसी भी तरह सभी स्पेस कैरेक्टर ("") को प्रतिशत चिह्नों ("%") में परिवर्तित करता है, और सभी डैश ("-") को एक विशिष्ट पीडीएफ के लिए छक्के ("6") में बदल देता है।
किसी भी विचार कैसे इस व्यवहार को रोकने के लिए? या इसका निदान कैसे करें?
दुर्भाग्य से मैं इस समय पीडीएफ साझा नहीं कर सकता। इससे सवाल का जवाब देना बहुत मुश्किल हो सकता है। लेकिन शायद कोई भी इन अजीब चरित्र प्रतिस्थापन के आधार पर, किसी भी तरह एक अच्छा अनुमान लगा सकता है।
pdftotext संस्करण 0.26.5