मुझे पीडीएफ से स्प्रेडशीट तक पाठ के हजारों स्निपेट प्राप्त करने की आवश्यकता है। वे कम हैं, शायद ही कभी 2-3 पंक्तियों से अधिक, लेकिन प्रत्येक पंक्ति विराम एक नया सेल बनाता है, और मुझे इसे मैन्युअल रूप से मरम्मत करना होगा, जिसमें बहुत समय लगता है।
क्योंकि मेरे पास उनमें से कई हैं, "पेस्ट में वर्ड का उपयोग करें और एक खोज और बदलें" वर्कअराउंड मेरे लिए सिर्फ समय बर्बाद कर रहा है। क्या कॉपी पर लाइन ब्रेक गायब होने का कोई तरीका है? शायद एक दर्शक है जो इसके लिए एक विशेष कॉपी मोड प्रदान करता है, या एक प्लगइन है?
दस्तावेज वैज्ञानिक लेख हैं। पाठ व्यवस्था काफी रैखिक है। आप यह मान सकते हैं कि मैं जो पाठ कॉपी कर रहा हूं वह किसी तालिका या फ्लोट के अंदर नहीं है, और न ही घुमाया गया है और न ही कुछ। (यदि ऐसा कुछ होता है, तो मुझे लगता है कि मैं इसके साथ मैन्युअल रूप से निपटूंगा)। पाठ अक्सर दो स्तंभों में सेट किया जाता है, लेकिन मुझे केवल उस पाठ को चिह्नित करने में कोई परेशानी नहीं है जो मुझे उसके कॉलम से चाहिए। मुझे किसी विशेष प्रारूपण को संरक्षित करने की आवश्यकता नहीं है। मैं एक समाधान की कोशिश करने को तैयार हूं जो सभी अचूक पात्रों को हटा देता है, उदाहरण के लिए। ग्रंथ अंग्रेजी में हैं, यह ठीक है अगर समाधान केवल एएससीआईआई में काम करता है / कॉपी किए गए पाठ के सभी गैर-अल्फ़ान्यूमेरिक एएससीआईआई स्ट्रिप्स।
मेरे पास एक समाधान के लिए एक बहुत मजबूत प्राथमिकता है जो लिनक्स पर काम करेगा, संभवतः किसी तरह का ओकुलर प्लगइन। लेकिन अगर वहाँ एक विंडोज केवल समाधान होना चाहिए, मैं इसके बारे में भी सुनना चाहता हूँ। मेरे पास विंडोज मशीन पर कुछ हद तक एक्रोबेट प्रो का लाइसेंस है।