Microsoft Word में Grep

10

मैं एक शब्द दस्तावेज़ से दिए गए स्ट्रिंग के साथ सभी लाइनों को खींचना चाहता हूं। यूनिक्स दुनिया में ... ग्रीप एक गड़बड़ के बिना ऐसा करता है। विंडोज मेरे लिए स्पष्ट से कम है।

microsoft-word grep

— fretje
स्रोत

10

साइगविन (या लिनक्स मशीन तक पहुंच) के साथ

antiword file.doc | grep "my phrase"

या

catdoc file.doc | grep "my phrase"

वहाँ इसी तरह के एक समान तरीके से grep करने के लिए बहुत सारे कमांड-लाइन फ़ाइल प्रारूप कन्वर्टर्स हैं ।

विशुद्ध रूप से इन-वर्ड सॉल्यूशन Ctrl + F (फाइंड) हो सकता है , और फिर फाइंड ऑल - हालांकि, मुझे यकीन नहीं है कि एमएस वर्ड के सभी वर्जन में ऑल बटन है।

— chronos
स्रोत

2

जब मैंने प्रश्न शीर्षक देखा तो मुझे लगा कि "हा! यह अच्छा होगा, यह नहीं"। फिर से मुझे कभी भी GNU प्रोग्रामर को कम नहीं समझना चाहिए।

— फॉशी

मेरे द्वारा दी जाने वाली catdocप्रत्येक .doc/ .docxफ़ाइल पर segfaults का सबसे हालिया संस्करण , और antiwordमुझे अपना दस्तावेज़ बताता है "यह एक Word दस्तावेज़ नहीं है"। क्या आप किसी अन्य विकल्प के बारे में जानते हैं?

— detly

कुछ भी नहीं जो मैंने उपयोग किया है ... त्वरित खोज शो जो docx2txtडेबियन रिपॉजिटरी में मौजूद हैं - काम कर सकते हैं। मैं OpenOffice / LibreOffice कमांड-लाइन प्रारूप रूपांतरण उपयोगिता (unoconv) में भी देखूंगा, जिसका उपयोग उसी उद्देश्य के लिए किया जा सकता है।

— क्रोनोस

3

मुझे पता है कि यह आदिम लगता है, लेकिन क्या आपको फ़ाइल को .txt के रूप में सहेजने से रोकना है और फिर इसे अपनी पसंद के अनुसार रिप करना है।

— कौआ
स्रोत

2

यह करने के लिए उन्हें सैकड़ों करने के बाद, क्या है।

— tchrist

1

शब्द संदर्भ में "लाइन" का क्या अर्थ है? प्रदर्शित लाइन, जो पृष्ठ स्वरूपण के लिए कुछ भी करने पर बदलती है? अनुच्छेद? कुछ और?

आप Word के खोज-और-प्रतिस्थापित कार्यों के साथ सामान का एक गुच्छा कर सकते हैं, जिसमें स्वरूपण और अन्य गैर-स्पष्ट चीजें शामिल हैं, लेकिन वे सभी केवल खोज-क्या पाठ पर कार्य करेंगे, किसी भी आसपास के पाठ पर नहीं।

— मार्था
स्रोत

grep मिला है कि regex lovin ', हालांकि!

— फोसिवी

1

CRGREP में MS डॉक्युमेंट्स - वर्ड, पॉवरपॉइंट, एक्सेल - के लिए सपोर्ट है जिसे मैंने एक फ्री ओपनसोर्स टूल के रूप में विकसित किया है। यह डेटाबेस टेबल, चित्र, ऑडियो, अभिलेखागार, पीडीएफ और इन जैसे संयोजनों जैसे अन्य सामानों को खोजने के लिए भी सख्त करता है। मज़े करो।

— क्रेग
स्रोत

0

PowerGREP आपके लिए बिलकुल ऐसा ही करेगा , और तेज़ - लेकिन मुफ्त नहीं। यह मेरी राय में, हालांकि, हर पैसे के लायक है। साथ ही, 30 दिनों का नि: शुल्क परीक्षण है।

एक वर्ड फ़ाइल के माध्यम से PowerGREP खोज का स्क्रीनशॉट

— टिम पीटरज़कर
स्रोत

0

टिप्पणी करने के लिए पर्याप्त प्रतिनिधि नहीं मिला, लेकिन मैं इस डॉक बनाम डॉक के मुद्दे पर चर्चा कर सकता हूं ताकि किसी को भी धागे का पीछा करते हुए (जैसे मैं था) यह मददगार लग सकता है।

आपको डॉक्स फ़ाइलों के लिए एक विशेष उपकरण की आवश्यकता नहीं है। डॉक्स एक्सएमएल फाइलें ज़िप की जाती हैं।

एक्सएमएल को निकालने और छीनने के लिए कुछ के आधार पर प्रयास करें

unzip -p "*.docx" word/document.xml | sed -e 's/<[^>]\{1,\}>//g; s/[^[:print:]]\{1,\}//g'

से कमांड लाइन फू

— Fafhrd
स्रोत

0

तेज़, मुफ्त, मुक्त-स्रोत और क्रॉस-प्लेटफ़ॉर्म समाधान: https://github.com/phiresky/ripgrep-all

— एटी
स्रोत