मैं इस उद्धरण को पीडीएफ से कैसे कॉपी कर सकता हूं? [डुप्लिकेट]


4

संभव डुप्लिकेट:
कॉपी पेस्ट करते समय पीडीएफ ने पाठ को विकृत कर दिया है

मैं पढ़ रहा हूँ a पीडीएफ कॉपी जेरोम एच। फ्रीडमैन के पेपर "डेटा माइनिंग एंड स्टैटिस्टिक्स: व्हाट द कनेक्शन?" Google Chrome का उपयोग करना।

इसमें एक मनोरंजक उद्धरण है जिसे मैं अपने ब्लॉग पर कॉपी और पेस्ट करना चाहता हूं।

मैंने चूहे के पाठ का चयन करने के लिए माउस का उपयोग किया और दबाया CTRL + सी पाठ को कॉपी करने के लिए। दस्तावेज़ इस तरह दिखता है:

A highlighted quote from Jerome's paper.

जब मैं नोटपैड, स्टैक ओवरफ्लो, या कहीं और, टेक्स्ट को पेस्ट करता हूं, तो उत्पाद विंगरिंग्स जैसा होता है:

➣✍❺❼⑤➭✸❸❊➁❥❸❊⑥ ▼ ❽❾❸✘➎✳❸❾②|➊➥❸❊❸❊⑥❦⑨|②③✇ ▲ ➆   ⑨❏✇➄⑥ ⑨❏✇➄⑥ ⑨❏✇➄⑥ ⑨❏✇➄⑥ ⑨❏✇➄⑥ ②❥⑤⑩⑨❘②❥⑤⑩❽❾⑤⑩✇➄⑥ ⑨❏✇➄⑥P⑨❏✇➄⑥   ➎✳❸❏②❥➇ ▼ ✇ ▲ ②➟➊❚➇⑦❸❊⑥✆✇P⑨|②③✇ ▲ ②❥⑤⑩⑨|②❥⑤⑩❽❾⑤⑩✇➄⑥❦➇ ▼ ✇➀⑨↔✇➄⑥❦⑤⑩❺❼❸✶✇ ♣ ➇⑦❸❷❻➀➁↔⑨❹➇⑦❸❷➊❚ ➁❥⑤②❥❸✶⑨   ✇❨➂ ▼ ✇➄➂✳❸❊➁✶Þ⑦✇ ♣ ❽❾❻➀➍ ♣ ➂⑦❶❼②❥❸❊➁➟⑨❥❽❾⑤❸❊⑥✗②❥⑤⑩⑨|②↔⑨|②③✇➄➁❹②③⑨❚✇ ♣ ❽❾❻➀➍ ♣ ➂ ▼ ✇➄⑥☛➧ ➀➏

पाठ को इस तरह दिखना चाहिए:

इस क्षेत्र में सांख्यिकीविदों और कंप्यूटर वैज्ञानिकों के बीच एक अंतर यह प्रतीत होता है कि जब एक सांख्यिकीविद् को यह पता चलता है कि वह एक पेपर लिखता है; एक कंप्यूटर वैज्ञानिक एक कंपनी शुरू करता है।

मुझे उस पाठ को मैन्युअल रूप से लिखना था। यह इस तरह के एक छोटे से उद्धरण के लिए संभव है, लेकिन मैं वास्तव में जो मैं देखता हूं उसे कैसे कॉपी करूं?

क्या यह पीडीएफ, ब्राउज़र, प्लगइन या तीनों के कुछ संयोजन के बारे में कुछ असामान्य है?

जवाबों:


6

इसे करने का सबसे विश्वसनीय तरीका ओसीआर का उपयोग करना है।

लेकिन एक गंदे और तेज समाधान के रूप में आप Google का उपयोग कर सकते हैं जल्दी देखो वहाँ से परिणाम खोजें आपके लिंक के लिए, त्वरित दृश्य उपयोग विकल्प में देखें & gt; सादा HTML

इसमें अभी भी कुछ गढ़े हुए पाठ हैं और काफी हैं अस्पष्ट लेकिन पाठ की एक बड़ी मात्रा सही है और नकल करने योग्य । यहां खोज कार्य करता है ताकि आप इसका उपयोग लक्ष्य पाठ का पता लगाने के लिए कर सकें और इसे बिना किसी विकृत पाठ के कॉपी कर सकें।


यहां विस्तृत उदाहरण:
Google search results for URL includes Quick View link.
फिर View विकल्प का उपयोग करें सादा HTML
The Quick View has an options to view the document as HTML.
गूगल पर HTML संस्करण , आप इस तरह के समकक्ष पाठ को खोज और चुन सकते हैं:
Search the HTML verion to find and select the relevant quote.
नोटपैड में पेस्ट करने से यह आउटपुट उत्पन्न होता है:

इस क्षेत्र में sta-tisticians और कंप्यूटर वैज्ञानिकों के बीच एक अंतर यह प्रतीत होता है कि जब एक सांख्यिकीविद् को एक विचार है कि वह पेपर लिखता है; एक कंप्यूटर वैज्ञानिक एक कंपनी शुरू करता है।

बिलकुल प्रदर्शित नहीं है, लेकिन इतना करीब है कि आप इसके साथ काम कर सकते हैं।


1
मैं भूल गया कि Google ने पीडीएफ को इस तरह से कैश किया था! बहुत उपयोगी। मैंने इस उत्तर को और अधिक उपयोगी बनाने के लिए चित्रों के साथ एक चरण-दर-चरण मार्गदर्शिका शामिल करने के लिए आपके उत्तर को संपादित किया।
Iain Samuel McLean Elder

Google खोज संस्करण में, जो Google मेरी मशीन पर कार्य करता है, इस "त्वरित दृश्य" लिंक के बजाय, मुझे नीचे तीर पर क्लिक करना होगा, फिर "कैश्ड" चुनें। लेकिन वह भी काम करता है।
tuomassalo

1

आपको दूषित पाठ को त्यागना होगा जो पहले से ही पीडीएफ के साथ जुड़ा हुआ है इससे पहले कि आप इसे पुन: ओसीआर कर सकें। इसे करने का सबसे आसान तरीका यह है कि इसे TIFF प्रारूप में सहेजा जाए, फिर इसे एक्रोबेट के साथ खोलें और इसे OCR करें। जब मैंने ऐसा किया, तो यह मेरे लिए काम कर गया।


मैं इस समाधान को सत्यापित नहीं कर सकता क्योंकि मेरे पास Adobe Acrobat नहीं है।
Iain Samuel McLean Elder

मैंने एक्रोबैट एक्स के साथ इसे आपके लिए फिर से ओसीआर किया है और इसे एक मुफ्त साइट पर अपलोड किया है pdfcast.org/pdf/... OCR (किसी भी तरह से!) सही नहीं है, लेकिन उम्मीद है कि यह उपयोगी होगा।
Nicole Hamilton

1

गलत एन्कोडिंग के साथ एक पीडीएफ की तरह दिखता है। निम्नलिखित सूत्र देखें:

पीडीएफ का उपयोग करके प्रिंट करने का प्रयास करें CutePDF , फिर देखें कि परिणामी पीडीएफ कोई बेहतर है या नहीं।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.