कॉपी पेस्ट करते समय पीडीएफ ने पाठ को विकृत कर दिया है


23

मैं एक पीडीएफ फाइल से पाठ को कॉपी और पेस्ट करने की कोशिश कर रहा हूं।

हालाँकि, जब भी मैं मूल पाठ को पेस्ट करता हूँ तो यह गार्बल्ड अक्षरों का एक बड़ा झमेला होता है। पाठ निम्नलिखित की तरह दिखता है (यह सिर्फ एक छोटा सा उद्धरण है):

4$/)5=$13! ,4&1*%-! )5'$! 1$2$)&,$40! 65))! .*5)1! -#$! )/'8*/8$03! 
(4/+$6&4;0!/'1!-&&)0!*0$1!.9!/,,)5%/-5&'!1$2$)&,$403!5'!+*%#!-#$! 
0/+$!6/9! -#/-! &,$4/-5'8! 090-$+! 1$2$)&,$40! .*5)1!1$25%$! 1452$40! 
/'1! &-#$4! 090-$+! 0&(-6/4$! %&+,&'$'-0! *0$1! .9! /,,)5%/-5&'! 
1$2$)&,$40!-&1/97!"#$!+5M!&(!,4&1*%-!)5'$!/'1!,4&1*%-!1$2$)&,$40! 
65))! .$!+*%#!+&4$! $2$')9! ./)/'%$13! #&6$2$43! -#/'! -#$!+5M! &(! 
&,$4/-5'8!090-$+!/'1!/,,)5%/-5&'!1$2$)&,$40!-&1/97! 
)*+*+, C<88,?>8513AG<5A14, 

मैंने इसे Adobe और Foxit दोनों PDF पाठकों में आज़माया है। मैंने Adobe Reader में एक 'Save as text' किया था और परिणामी टेक्स्ट फ़ाइल एक ही टेक्स्ट है।

किसी भी विचार कैसे मैं इस पाठ को गैर-विकृत कर सकता हूं? (मैनुअल टाइपिंग के अलावा ... निकालने के लिए बहुत सारा टेक्स्ट है।)


कुछ स्क्रीन रीडर उपयोगिताओं का प्रयास करें (जो कि jpeg के साथ काम करता है, एक प्रिंट स्क्रीन करें और वहां आप जाएं) या यहां एक अलग तरीका है । (बस एक 'अनुमान', इसके लिए मुझे मत काटो। मैंने तब पहले रास्ते का इस्तेमाल किया। आशा है कि और सुविधाजनक तरीके हैं)।
अपाचे

इसी तरह के सवाल: superuser.com/questions/119393/…
ह्यूग एलन

मैं ओएस एक्स के साथ इस समस्या की पुष्टि भी कर सकता हूं, कम से कम 10.8.2 के रूप में। मैंने पीडीएफ फ़ाइल संरचना के माध्यम से जाने में थोड़ा समय बिताया है, लेकिन दुर्भाग्य से मैं क्षति की मरम्मत के लिए कोई रास्ता नहीं देख सकता। एक्रोबेट प्रो की "प्रीफलाइट" पीडीएफ / ए मानक के खिलाफ जांच करते समय फ़ाइल के साथ मुद्दों की रिपोर्ट करती है, और इन्वेंट्री रिपोर्ट में ग्लिफ़ को स्पष्ट रूप से गलत यूनिकोड वर्णों के खिलाफ मैप किया जाता है। मैंने Apple के साथ एक बग रिपोर्ट बनाई है - ID 12655651। यदि मुझे कोई अपडेट मिलता है तो मैं यहां वापस रिपोर्ट करूंगा।
9

Mught सहायक हो superuser.com/a/481510/153937
अंकित

जवाबों:


11

इसके आस-पास प्राप्त करने का सबसे सरल तरीका फ़ाइल को Google Chrome के हाल के संस्करण में अंतर्निहित पीडीएफ रीडिंग प्लगइन के साथ खोलना है । फिर आप टेक्स्ट खोजने के लिए क्रोम की खोज सुविधा का उपयोग कर सकते हैं, और कॉपी-पेस्ट कार्य सही ढंग से कर सकते हैं।

मैं Shiki के जवाब पर pipitas की टिप्पणी को वोट करना चाहूंगा, लेकिन मेरे पास क्रेडिट नहीं है :( समस्या कस्टम फ़ॉन्ट एन्कोडिंग हो सकती है , एन्क्रिप्शन नहीं । एक्रोबेट में, फ़ाइल -> गुण पर क्लिक करें, फिर एन्कोडिंग देखने के लिए फ़ॉन्ट्स टैब पर क्लिक करें। , और सुरक्षा टैब यह देखने के लिए कि क्या यह एन्क्रिप्टेड है।


वास्तव में, कस्टम फ़ॉन्ट एन्कोडिंग मेरे लिए अपराधी था। हालाँकि, Chrome समाधान नहीं था। मैंने आंशिक रूप से घोस्टस्क्रिप्ट के साथ पीएस से एक पीडीएफ को पुन: प्राप्त करने के साथ समस्या को हल किया (मैं पीएस स्रोत के लिए भाग्यशाली था)। कोई भी वर्ण समूह, जिसके लिए LaTeX ligatures (जैसे ff, c, fi, आदि) लागू होता है, PDF के कॉपी किए गए पाठ में दिखाई नहीं देता है, जिसे कॉपी / पेस्ट करते समय कुछ संपादन की आवश्यकता होती है।
फुहारमेनटर

1
क्रोम के साथ एक ही समस्या
जिनसो

4

मैंने पीडीएफ के साथ इस समस्या का पता लगाया जो मैंने बनाया था, और मेरा मानना ​​है कि मैंने समस्या के स्रोत को ट्रैक किया: पीडीएफ फाइल का आकार कम करने के लिए मैक ओएस एक्स के पूर्वावलोकन का उपयोग करना।

मैंने PDFs में चित्रों को संपीड़ित करने के लिए Colorsync यूटिलिटी का उपयोग करके कुछ क्वार्ट्ज फिल्टरों का निर्माण किया था। जैसा यहाँ वर्णित है: http://www.macosxhints.com/article.php?story=20031106133852693

मैंने पाया कि मैं मूल (असम्पीडित) पीडीएफ फाइल से टेक्स्ट को आसानी से कॉपी और पेस्ट कर पा रहा हूं, लेकिन मैंने जो पीडीएफ फाइल साइज फिल्टर बनाया है, उस पीडीएफ को चलाने के बाद, जिसके परिणामस्वरूप संपीड़ित पीडीएफ स्पष्ट रूप से कॉपी पेस्ट नहीं करता है (जैसा दिखता है वैसा ही आता है) आपके द्वारा पोस्ट किए गए तार)।

हालाँकि, Adobe Acrobat Pro के डॉक्यूमेंट> फ़ाइल साइज़ फ़ंक्शन को उसी मूल PDF के माध्यम से चलाने पर, परिणामी संपीड़ित PDF पाठ को सफलतापूर्वक कॉपी और पेस्ट कर सकता है।

तो, यह आपके मामले में पूरी तरह से सहायक नहीं है, यह मानते हुए कि आपकी पीडीएफ फाइल कहीं और से प्राप्त हुई थी और आप मूल संस्करण तक नहीं पहुंच सकते हैं, अगर यह वास्तव में किसी तरह से संकुचित था। लेकिन यह स्पष्टीकरण हो सकता है - कि फ़ाइल का आकार कम करने के प्रयास में किसी तरह फाइल मंगाई गई थी।

यह पीडीएफ से पाठ को कॉपी और पेस्ट करने में समान समस्याओं में चलने वाले सामग्री रचनाकारों के लिए उपयोगी हो सकता है - अपने पीडीएफ को सिकोड़ने के लिए ओएस एक्स क्वार्ट्ज फिल्टर का उपयोग करके सावधान रहें!

--edit-- मैंने इस समस्या को भी देखा जब पूर्वावलोकन के साथ PDF का संयोजन किया। दो स्रोत पीडीएफ को कॉपी और पेस्ट किया जा सकता है, लेकिन जब एक पेज को एक फाइल से दूसरी फाइल में ड्रैग किया जाता है, तो संयुक्त पीडीएफ को सहेजते हुए, संयुक्त डॉक्यूमेंट में टेक्स्ट कॉपी / पेस्ट नहीं किया जा सकता है। ये दो दस्तावेज हैं जो दोनों एक ही समय में फिल्म निर्माता प्रो 11 के साथ मैक पर उत्पन्न हुए हैं - मैं कल्पना नहीं कर सकता कि उनके पास अलग-अलग एनकोडिंग या ऐसी कोई चीज होगी।


मुझे एक मैक ओएस उपयोगकर्ता से कुछ पीडीएफ फाइलें मिलीं। चयन ठीक है, लेकिन कॉपी और पेस्ट आपको सिर्फ कचरा देगा। शब्द कन्वर्टर्स के लिए pdf का एक गुच्छा आज़माएं, जिसमें googledoc, adobe टेक्स्ट के रूप में सेव हैं, ये सभी गारबेड टेक्स्ट देता है।
टाइगर

मुझे संदेह है कि ओएस एक्स पीडीएफ सिकुड़ रहा है अपराधी। किसी को भी इस तरह के ऑपरेशन "पूर्ववत" करने के लिए किसी भी साधन के बारे में पता है? धन्यवाद!
टाइगर

मैंने पीडीएफ फाइल को कई (वर्चुअल) प्रिंटर पर प्रिंट किया, और मुझे 4x आकार की पीडीएफ फाइलें मिलीं। मुद्रित फ़ाइल स्पष्ट है छवि है, कोई पाठ चयन नहीं किया जा सकता है, जबकि मूल का चयन किया जा सकता है (हालांकि जड़ा हुआ)।
टाइगर

4

वर्कअराउंड बनाने का एक और बहुत आसान तरीका है :)

बस दस्तावेज़ को प्यारा प्रिंट, एडोब 2 पीएफडी प्रिंटर या किसी भी समान सामान का उपयोग करके प्रिंट करें। लब्बोलुआब यह है, कि आपको पीडीएफ प्रारूप में प्रिंट करने की आवश्यकता है।

कई मामलों में यह आसानी से समस्या को दूर करेगा।


2

समाधान जो मेरे लिए काम करता है:

  • दस्तावेज़ को Google ड्राइव / डॉक्स पर अपलोड करें
  • Google इसे (2013 के अनुसार) एक पीडीएफ के रूप में आयात करेगा
  • पीडीएफ दृश्य खोलें और चुनें फ़ाइल > के साथ खोलें > गूगल डॉक्स
  • दस्तावेज़ को निर्यात करने में लगभग एक मिनट लगेगा

परिणाम सही नहीं थे, लेकिन मुझे वहां 80% रास्ते मिले और मुझे पर्याप्त पाठ प्रदान किया कि मुझे सब कुछ फिर से लिखना नहीं पड़ा!


2

SOLVED: (विंडोज 8, एक्रोबेट इलेवन, ऑफिस 2010 पर मेरे लिए काम किया गया)

विकल्प 1:

  1. "Microsoft XPS डॉक्यूमेंट राइटर" आउटपुट का उपयोग करके एक्रोबैट से प्रिंट करें: "आपकी फ़ाइल name.oxps"
  2. XPS व्यूअर के साथ "ओक्स" खोलें। * (नीचे दिए गए टिप्पणियों में डाउनलोड लिंक देखें)
  3. उच्चतम रिज़ॉल्यूशन (600 DPI) का उपयोग करके पीडीएफ (एक्रोबैट पीडीएफ, या प्याराडीपीएफ) पर प्रिंट करें।
  4. एक्रोबैट के साथ खोलें और ओसीआर (खोजा छवि (सटीक)) विकल्प का उपयोग करें।

बिंगो!

टिप्पणियाँ:

  • उच्चतम रिज़ॉल्यूशन और खोज योग्य छवि (सटीक) का उपयोग करके अपने पाठ को उसकी साफ उपस्थिति खोए बिना बचाएंगे। कम रिज़ॉल्यूशन आपके पाठ को पठनीय बना देगा, लेकिन भद्दा दिखने वाला।
  • Microsoft XPS (फ़ाइलें) डाउनलोड करें: http://www.microsoft.com/en-us/download/details.aspx?id=11816
  • यदि आपको नहीं पता कि OCR क्या है, या जहां खोजा जा सकने वाला चित्र (सटीक), या "Microsoft XPS डॉक्यूमेंट राइटर" का उपयोग करके प्रिंट कैसे करें, तो कृपया, इसे अपने दम पर, अपने सर्वश्रेष्ठ अनुभवों के लिए Google पर क्लिक करें।

* केवल तभी डाउनलोड करें जब आपके पास एक्सपीएस स्थापित न हो।

विकल्प 2:

समान करें, लेकिन छवि के रूप में सहेजें (पीएनजी, टिफ, ...), फिर आपको सभी पृष्ठों को एक "पीडीएफ" फ़ाइल में वापस संयोजित करना होगा।


1
चरण 1,2 और 3 एक लंबा रास्ता तय करते हैं जब आप चरण 3 से पीडीएफ पर प्रिंट करना छोड़ सकते हैं। (जैसे आपके पीडीएफ रीडर के अंदर से)। एक्सपीएस के माध्यम से चक्कर लगाने की आवश्यकता नहीं है।
हेन्नेस

@ हेनीज़ स्टेप 4 से त्रुटि होती हैAcrobat could not perform OCR on this page because: This page contains renderable text
फ्यूहरमैनेटर

'रेंडर करने योग्य पाठ' कुछ ऐसा लगता है जिसे अभी भी खींचा जाना है (प्रदान किया गया है)। यदि आप XPS से गुजरते हैं तो संभव है कि पहले से ही ऐसा किया गया हो और OCR-सक्षम बिटमैप के रूप में संग्रहीत किया गया हो। लेकिन यह सिर्फ एक अनुमान है।
हेन्स

1

एक जोखिम है कि जानकारी बिल्कुल भी पुनर्प्राप्ति योग्य नहीं होगी। पीडीएफ दस्तावेज़ अनिवार्य रूप से एक दस्तावेज है जो दूसरे, एक साधारण पाठ, एक तस्वीर पर निर्भर करता है। जब आप दस्तावेज़ से कॉपी और पेस्ट करते हैं, तो आप तस्वीर को देखते हुए टेक्स्ट को चिह्नित करते हैं, लेकिन आपके क्लिपबोर्ड पर जो कॉपी किया जाता है, वह टेक्स्ट भाग का संबंधित टुकड़ा होता है।

दस्तावेज़ के निर्माण के तरीके के आधार पर, पाठ भाग की गुणवत्ता और उपलब्धता बहुत भिन्न हो सकती है। यदि आप एक्रोबैट, वर्ड, एक पीडीएफ प्रिंटर ड्राइवर या किसी अन्य विधि का उपयोग करते हुए एक वर्ड प्रोसेसर दस्तावेज़ को पीडीएफ प्रारूप में सहेजते हैं, तो गुणवत्ता आमतौर पर उत्कृष्ट होगी, क्योंकि मूल के पाठ से पाठ फ़ाइल बनाई जा सकती है। कुछ विशेष वर्ण विकृत हो सकते हैं, लेकिन सादे पाठ आमतौर पर ठीक होते हैं।

यदि दस्तावेज़ को स्कैन की गई छवि से बनाया गया है, हालांकि, टेक्स्ट का हिस्सा आमतौर पर छवि के ओसीआर प्रसंस्करण द्वारा बनाया जाता है, जो कि खेद परिणाम उत्पन्न कर सकता है, खासकर यदि मूल उद्देश्य के लिए इष्टतम से कम है।

एक खराब प्रोग्राम जिसका उपयोग पीडीएफ बनाने के लिए किया जाता है, या गलत सेटिंग्स, हो सकता है कि पाठ भाग पूरी तरह से विकृत हो जाए, जैसा कि, संभवतः, कुछ प्रकार के एन्क्रिप्शन फ़ाइल के बनने के बाद चलते हैं।

लब्बोलुआब यह है, अगर दस्तावेज़ का पाठ हिस्सा वास्तव में खराब है, तो इसे बेहतर बनाने का कोई तरीका नहीं है। आपका सबसे अच्छा शर्त पाठ भाग को पूरी तरह से हटाना होगा, और कार्यक्रम को ओसीआर प्रक्रिया को फिर से करना होगा। मुझे लगता है कि एक्रोबेट के भीतर से यह संभव हो सकता है, लेकिन मुझे पूरी तरह यकीन नहीं है।


1

इसका एक संभावित कारण यह हो सकता है कि पीडीएफ में फ़ॉन्ट एम्बेडिंग एक कस्टम एन्कोडिंग का उपयोग कर रहा था, जो पीडीएफ से पाठ की प्रतिलिपि बनाते समय सही ढंग से लागू नहीं होता है।

आप सभी सामग्री को मैन्युअल रूप से टाइप करने से बचाने के लिए विभिन्न तरीके लागू कर सकते हैं।

  1. क्या आपने 'pdftotext.exe' टूल में से एक को 'नेट' में डाउनलोड करने योग्य टूल से निकालने की कोशिश की? (मैं ftp://ftp.foolabs.com/pub/xpdf/xpdf-3.02pl4-win32.zip में शामिल अनुशंसा करता हूं )।
  2. एक्रोबेट रीडर के नवीनतम संस्करण में एक विकल्प है "टेक्स्ट के रूप में सहेजें ..." । यह "copy'n'paste" का उपयोग नहीं करता है (जो आपको विकृत पाठ देता है), लेकिन संभवतः उसी सॉफ़्टवेयर रूटीन का उपयोग करता है जैसा कि स्क्रीन पर पाठ को रेंडर करने के लिए उपयोग किया जाता है , और इसके बाद और अधिक उपयोगी परिणाम उत्पन्न हो सकते हैं।
  3. यदि '2.' काम नहीं करता है, और यदि आपके पास एक्रोबेट प्रोफेशनल तक पहुंच है: तो फॉन्ट-एम्बेडिंग डिस्टिलर प्रोफाइल में से एक का उपयोग करके पीडीएफ को फिर से डिस्टिल करने का प्रयास करें।
  4. यदि '3.' काम नहीं करने के बावजूद, आप एक्रोबेट प्रोफेशनल तक पहुँच पाने के बावजूद: पीडीएफ को फिर से डिस्टिल करने की कोशिश करें, लेकिन इस बार आपको मुख्य प्रिंट के निचले बाएँ कोने में 'उन्नत' बटन ('उन्नत' बटन के माध्यम से उपलब्ध) विकल्प का उपयोग करना चाहिए संवाद)। सुनिश्चित करें कि आप 600dpi का उपयोग करते हैं (हालांकि यह एक बड़ी फ़ाइल का उत्पादन कर सकता है)। परिणामस्वरूप पीडीएफ आप फिर से एक्रोबेट प्रो में खोलें। अब एक्रोबैट के 'ओसीआर' एल्गोरिथ्म को फाइल में लागू करें, जिसके परिणामस्वरूप एम्बेडेड टेक्स्ट होगा (रीडर में ऑन-स्क्रीन रेंडर करने के लिए उपयोग नहीं किया जाता है, लेकिन स्ट्रिंग्स को खोजने और हाइलाइट करने के लिए उपयोग किया जाता है)। अब आप उपरोक्त पीडीएफ विधियों में से किसी का उपयोग करके, इस पीडीएफ से पाठ को निकालने का फिर से प्रयास कर सकते हैं।

मेरे लिए, पीडीएफ में पुनर्मुद्रण के लिए एक्रोबैट प्रो इलेवन का उपयोग करना - लेकिन उन्नत में " 600 के रूप में प्रिंट किया गया" ( प्रिंट के रूप में 600 डीपीआई पर) प्रिंट के साथ ... बटन / उप-संवाद ... डायलॉग - चाल थी। तब आप अंत में परिणाम को ठीक से ओसीआर कर सकते हैं । इस पृष्ठ ने जिन अन्य समाधानों का उल्लेख किया है उनमें से किसी ने भी काम नहीं किया। नोट: एक बड़े दस्तावेज़ के लिए इसमें कुछ समय लग सकता है और परिणाम पीडीएफ काफी बड़ा हो सकता है।
ग्लेन स्लेडेन

@GlennSlayden: ख़ुशी है कि मेरी सलाह आपके लिए काम करती है ... इसमें क्या कमी थी कि आपने सोचा कि यह अभी भी एक उत्थान के लायक नहीं है?
कर्ट फ़िफ़ेल

उम, मैंने उत्थान किया। यह अभी भी मेरे लिए '1' के रूप में प्रदर्शित हो रहा है। मेरी एकमात्र शिकायत यह थी कि आपका उत्तर सबसे नीचे था और मुझे इसे खोजने में
थोड़ा

ठीक है, @GlennSlayden, फिर उस upvote को बहुत पहले (ऊपर आपकी टिप्पणी से पहले) loooong होना चाहिए था।
कर्ट फ़िफ़ेल

नहीं, मैंने "12 घंटे पहले" उतारा था उसी समय मैंने टिप्पणी लिखी थी ... मुझे अभी भी एक नीला तीर दिखाई देता है जो (मेरा मानना ​​है) का अर्थ है मेरा वोट (एक) वोट जो वर्तमान में पंजीकृत है। और मुझे याद है कि पिछली रात को मैंने मतदान किया था, यह '0' था।
ग्लेन स्लेडेन

1

मेरे उपयोगकर्ताओं में से एक ने बस एक ही मुद्दे की सूचना दी थी (पीडीएफ विंडोज के लिए डिस्टिलर के साथ बनाया गया था), कि कॉपी किया गया पाठ केवल गढ़ा हुआ पाठ है और वह किसी दस्तावेज़ के अंदर खोज नहीं कर सकता है। मैंने अपने मैक पर कोशिश की और कोई मुद्दा नहीं मिला। यह पता चला, कि मैंने Apple के पूर्वावलोकन एप्लिकेशन का उपयोग किया था, जबकि उन्होंने अपने विंडोज मशीन पर एडोब रीडर का उपयोग किया था। फिर मैंने अपने मैक पर एडोब रीडर की कोशिश की, उसी प्रभाव का सामना किया। मुझे ऐसा लगता है:

  • Adobe Reader सहेजे गए पाठ में coyping और खोज है।

  • Apple का पूर्वावलोकन एन्कोडिंग वेक्टर को लागू करने के बाद कॉपी और खोज करेगा।

मैं यह निश्चित रूप से नहीं कह सकता, लेकिन यह मेरे अवलोकन की व्याख्या करेगा। और यह वास्तव में सभी प्रकार की एन्कोडिंग बनाने की अनुमति देगा जब संयुक्त रूप से / कम की गई फ़ाइलों को किसी अन्य पोस्ट में वर्णित किया गया है: पूर्वावलोकन के साथ आप अभी भी पाठ को फिर से निकाल सकते हैं।

पहले मुझे लगा कि अंदर के छेदों को छोड़ने और मूल चरित्र स्थान का उपयोग करने के बजाय सन्निहित प्रविष्टियों के रूप में एम्बेडेड फ़ॉन्ट सबसेट को एनकोड करना अधिक तर्कसंगत होगा। लेकिन तब मुझे एहसास हुआ, कि मूल प्रविष्टियों के साथ फ़ॉन्ट सबसेट पर एन्कोडिंग वेक्टर का उपयोग करके, जो अक्षर अक्सर उपयोग किए जाते हैं, उनके बाइट में 1 से कम बिट सेट हो सकते हैं और इसे बेहतर तरीके से संपीड़ित किया जा सकता है (यह एंट्रोफी को कम कर सकता है) समग्र पाठ इस तरह)।


1

इसे Google डॉक्स पर अपलोड करना और विकल्प देखें> प्लेन एचटीएमएल का उपयोग करना , पाठ प्रतिलिपि योग्य पाठ को लगभग 80% सही स्थान देता है, जिसमें कुछ रिक्त स्थान गायब हैं।

इस के साथ धागा स्वीकार किए जाते हैं जवाब करने के लिए एक ही मुद्दा एक काम उदाहरण के साथ इस बताते हैं।


1

मैंने Google डॉक्स विकल्प की कोशिश नहीं की है क्योंकि यह अभी भी मेरे कार्यालय में समर्थित नहीं है। हालाँकि, फ़ाइल को "ScanSoft PDF Create!" "एक्रोबैट 9" से (पूरी फाइल को इमेज में प्रिंट करता है) और "नुआन्स पीडीएफ कन्वर्टर" में छपी हुई फाइल को खोलना (यह मुझे प्रेरित करता है कि क्या मैं इमेज फाइल को खोज योग्य और संपादन योग्य बनाना चाहता हूं, जिसे मैंने चुना था), मैं सक्षम था। मेरे पास एक वर्ड डॉक्यूमेंट है जिसे मैं आसानी से कॉपी और पेस्ट कर सकता हूं। यह लगभग 80-90% सटीकता के साथ ही सही नहीं है। लेकिन हे, आपके पास अभी भी उन हिस्सों की तुलना करने और ऑफसेट करने के लिए मूल पीडीएफ फाइल है जो अभी तय नहीं किए जा सकते हैं। पूरी बात लिखने से समय बचाता है। मेरा 2 सी।


0

मैंने विंडोज एक्सपी के लिए स्कैन्सॉफ्ट पीडीएफ कनवर्टर के पुराने संस्करण के साथ कुछ संपादन-योग्य पीडीएफ पीडीएफ बनाया, और फिर मैक के पूर्वावलोकन कार्यक्रम में पृष्ठों को संयोजित किया। प्रत्येक अलग-अलग पृष्ठों के लिए, मैं मैक पर एडोब रीडर से टेक्स्ट को सही ढंग से खोज, कॉपी और निर्यात कर सकता था। जब पूर्वावलोकन द्वारा संयुक्त और एक फ़ाइल के रूप में सहेजा जाता है, तो सभी स्क्रीन पर अच्छी तरह से दिखते हैं, लेकिन केवल कुछ मार्ग सही तरीके से खोजे जाने योग्य / निर्यात योग्य थे। यही समस्या मुझे यहां खींच लाई।

यहाँ पोस्ट ने मुझे कुछ अच्छे संकेत दिए (धन्यवाद!)। मैंने फोंट के लिए फ़ाइल गुणों को देखा। Win XP (जहाँ सब ठीक है) से सिंगल पेज फाइल्स में कहा गया था कि एन्कोडिंग ANSI था। पूर्वावलोकन में संयुक्त फ़ाइल (जहां कॉपी किए गए पाठ को विकृत किया गया है) ने अधिकांश फोंट को "रोमन" के रूप में "बिल्ट-इन" के रूप में एन्कोडिंग दिखाया।

मेरी समस्या का समाधान हर समय मेरी नाक के नीचे था - स्कैन्सॉफ्ट प्रोग्राम खुद फाइलों को जोड़ सकता है। जब मैंने स्कैनसॉफ्ट के कंबाइनर का उपयोग किया, और मैक पर फ़ाइल खोली, तो सभी फोंट को एएनएसआई-एनकोडेड के रूप में दिखाया गया और सभी पाठ निर्यात / पूरी तरह से कॉपी किए गए। पृथ्वी पर मैंने उन्हें पहली बार पीडीएफ कनवर्टर में क्यों नहीं जोड़ा, मुझे नहीं पता। धन्यवाद, पोस्टर!

लिनक्स सिस्टम पर फाइलें खोलना सच है।

मुझे पता है कि यह केवल विंडोज की समस्याओं की व्याख्या नहीं करता है - जब तक कि पीडीएफ समान मिश्रित मूल नहीं था?

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.