Evince में एक pdf डॉक्यूमेंट का शब्द काउंट प्राप्त करना


22

क्या कोई तरीका है जिससे मैं एक पीडीएफ दस्तावेज़ की शब्द गणना प्राप्त कर सकता हूं जो कि मैं एवियन, उबंटू के डिफ़ॉल्ट पीडीएफ दर्शक में देख रहा हूं? मैं दस्तावेज़ों को पाठ फ़ाइलों में बदलने और टर्मिनल से शब्द गणना प्राप्त करने में सक्षम हूं, लेकिन मैं टर्मिनल का उपयोग किए बिना उन्हें जल्दी से प्राप्त करने में सक्षम होना चाहता हूं। क्या ऐसा कोई प्लगइन है जो ऐसा कर सकता है, या यह पहले से ही बनाया गया है और मैं इसे याद कर रहा हूं?

PS, मैं अपने दर्शक को बदलना पसंद नहीं करूंगा क्योंकि उबंटू में डिफ़ॉल्ट पीडीएफ दर्शक है, और मैं उनमें से बहुत सारे डिफ़ॉल्ट अनुप्रयोगों का उपयोग करके जितना संभव हो उतना करना चाहूंगा, इवियन शामिल हैं, वास्तव में बहुत अच्छे हैं।

pdf  evince 

जवाबों:


32

आप इसे कमांड लाइन के माध्यम से कर सकते हैं:

pdftotext filename.pdf - | tr -d '.' | wc -w

धन्यवाद, लेकिन जैसा कि मैंने सवाल में कहा था, मुझे इस तरह की चीज के लिए कमांड लाइन का उपयोग नहीं करना होगा।

4
@ क्रिस तब के कोड में सिस्टम ("<ऊपर कमांड>") को एकीकृत करने की कोशिश करता है।
गोडेल

11

कैसे एक त्वरित बैश स्क्रिप्ट के बारे में जिनी और ईविल की आवश्यकता होती है । जब बिना किसी तर्क के बुलाया जाता है, तो यह आपको एक संवाद बॉक्स देगा ताकि आप एक फ़ाइल चुन सकें। जब एक तर्क के साथ कहा जाता है (या डायलॉग बॉक्स के बाद कहा जाता है), तो यह दोनों फाइल को खोल देगा और आपको एक शब्द गणना के साथ एक संवाद बॉक्स देगा।

दूसरे शब्दों में, निम्नलिखित को एक पाठ फ़ाइल में कॉपी करें, जिसे evince-word-count.shया कुछ कहा जाता है, इसे अपने पथ में कहीं सहेजें (जैसे ~/bin/), इसे निष्पादन योग्य बनाएं (या तो नौटिलस के राइट क्लिक और गुणों के साथ या साथ chmod +x ~/bin/evince-word-count.sh),

#!/bin/bash
if [ "$#" -gt "0" ] ; then
    filename="$1"
else
    filename="$(zenity --file-selection)"
fi
evince "$filename" &
zenity --info --text "This PDF has $(pdftotext "$filename" - | tr -d '.' | wc -w) words"
exit 0

अब, nautilus में कुछ PDF पर राइट क्लिक करें, "Open with ..." चुनें और फिर इसे evince-word-count.sh के साथ खोलें। अब, जब आप एक पीडीएफ खोलते हैं, तो यह दोनों को खोलकर खोल देगा, और आपको एक शब्द गणना देगा।

वैकल्पिक शब्द


आप इस फ़ाइल को /home/$USER/.local/share/nautilus/scripts/ पर रख सकते हैं, जो इसे Nautilus (Ubuntu vanilla file mananger) में राइट-क्लिक से उपलब्ध कराता है।
डेनियल होल्म

10

एवलिन मेलिंग सूची पर ओलाफ लीडिंगर की प्रतिक्रिया:

मुझे लगता है कि इस तरह की सुविधा दस्तावेज़ संपादकों के लिए बेहतर है, क्योंकि उनके पास दस्तावेज़ पर एक सादे दर्शक के रूप में अधिक जानकारी है और शब्दों की गिनती तुच्छ है। एक उदाहरण के रूप में एक पीडीएफ फाइल लें। क्या आप पाठ के रूप में देखते हैं वास्तव में वेक्टर ग्राफिक आकार के कुछ प्रकार हो सकता है। भले ही पाठ पीडीएफ फाइल में शामिल है, लेकिन जो शब्द आप देखते हैं, वे कई "स्थिति (y, x) पर पाठ आकर्षित" - कमांड - जैसे कि umlauts या लाइन के अंत में से बना हो सकता है। इसलिए एक शब्द भी कई शब्दों के रूप में गिना जा सकता है। इसलिए मुझे लगता है कि ऐसी सुविधा को मज़बूती से लागू करना कठिन हो सकता है। Pdftotext पर एक नज़र डालें कि मेरा क्या मतलब है।

2
दस्तावेज़ को परिभाषित करने के लिए जो भी फ़ाइल का उपयोग किया जाता है उसे "स्रोत कोड" माना जा सकता है, और एवियन मशीन है जो कोड को निष्पादित करता है। स्रोत कोड संपादक (उदाहरण के लिए एक टेक्स्ट एडिटर) से यह पूछना अनुचित (और असंभव) है कि निष्पादन का आउटपुट क्या होगा, इसलिए आइए आउटपुट को देखें (यानी एवियन / पॉपलर में प्रस्तुत छवि / पाठ)। एवियन में कार्यान्वयन मेरे लिए उपयोगी होगा क्योंकि मैं अपने पत्रों को भाषा-अज्ञेय पाठ संपादक में "कोडिंग" कर रहा हूं और अपने स्रोत को "रन" करने के लिए एवियन (पंडोक और पीडीएफ़्लैटेक्स के माध्यम से) का उपयोग करता हूं। केवल अंत में हम निश्चित हो सकते हैं कि यह किस माध्यम से बना है। टिप्पणी कोड पर विचार करें।
user29020

4

मुझे विश्वास नहीं है कि यह संभव है (वैसे यह तकनीकी रूप से संभव है लेकिन इसे लागू नहीं किया गया है)।

आपको याद रखना होगा कि एविसन एक दस्तावेज़ दर्शक है और एक शब्द गणना एक विशेषता है जो आमतौर पर एक संपादक में आवश्यक होती है (हाँ मुझे पता है कि यह हमेशा मामला नहीं होता है)।

आप एवियन डेवलपर्स से संपर्क करना पसंद कर सकते हैं और पूछ सकते हैं कि क्या उन्हें इस सुविधा को लागू करने में कोई दिलचस्पी होगी।


1
धन्यवाद। मैंने उनसे संपर्क किया है और जब तक मुझे एक निश्चित प्रतिक्रिया नहीं मिल जाती, मैं सवाल को खुला रखूंगा।

जब आप सुनते हैं, तो बेझिझक अपने प्रश्न का उत्तर दें :)
8128

एवियन सख्ती से एक "दर्शक" नहीं है। किसी दस्तावेज़ को बनाना और देखना और संपादित करना स्पष्ट रूप से "संपादित करें" और फिर "दृश्य" की तुलना में एक बड़ा वर्कफ़्लो है। इस सवाल के बारे में: वर्तमान में एवरसन चुनिंदा पाठ को कॉपी करने की अनुमति देता है। यह कड़ाई से एक "दृश्य" भूमिका नहीं है। एविंस परिणामी शब्द गणना का पता लगाने के लिए एक शानदार स्थिति में है क्योंकि यह अंतिम रूप से "रेंडरर" है जो हम वास्तव में पढ़ते हैं (या प्रकाशित करने के लिए भेजते हैं)। यह पहले से ही प्रदान किए गए पूरे शब्दों की पहचान करने का एक तरीका है (एक शब्द को डबल-क्लिक करने का प्रयास करें!)। मैं "फ़ाइल-> गुण" बॉक्स में यह प्रदान करने के लिए Evince पसंद करूंगा। यह मुझे पहले ही पृष्ठ संख्या (प्रतिपादन पर आधारित) बताता है।
user29020
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.