अपने लुक को (वेब ​​ब्राउजर पर) और टेक्स्ट / लिंक को संरक्षित करने के साथ वेबपेज को पीडीएफ में कैसे बदलें?


18

मैं एक वेबपेज को पीडीएफ में बदलने का तरीका ढूंढ रहा हूं, लेकिन वेबपेज के लुक को संरक्षित करना। वेबपेज के टेक्स्ट (सेलेक्ट होने योग्य) को सुरक्षित रखने के लिए, वेब पेज के लिए खोज योग्य [स्क्रीनशॉट जनरेट करने वाला चित्र] टेक्स्ट को न तो चयन योग्य और न ही खोज योग्य बना सकता है]।

मैं वेबपेज को पीडीएफ में प्रिंट करने की तलाश में हूं (जैसा कि वेब ब्राउज़र पर है) शैली या संरेखण पर किसी भी हेरफेर के बिना, या किसी भी वेबपेज के स्थिर घटकों का नुकसान।

यह उन वेबपृष्ठों की ऑफ़लाइन प्रतियों को संरक्षित करने में मदद करेगा जो आसानी से पढ़ने योग्य, व्याख्या करने योग्य और खोज योग्य हैं।


आपको नीचे दिए गए किसी भी प्रश्न को पढ़ने की आवश्यकता नहीं है (प्रश्न सिर्फ उपरोक्त अनुभाग है) मेरे प्रश्न को पाने के लिए। निम्नलिखित अनुभाग सिर्फ इस बात की सूची है कि मैंने प्रश्न के उत्तर तक पहुंचने के लिए अनुसंधान के माध्यम से या दूसरों के उत्तरों को एक नेस्टेड तरीके से प्राप्त किया है।

अनुसंधान परिणाम (सुझाव जो मेरी समस्या का समाधान नहीं किया गया)

समाधान खोजने की कोशिश में अब तक परिणाम (सभी अभी भी इस प्रश्न के समाधान के रूप में काम नहीं कर रहे हैं)

मैंने इन पीडीएफ वेब प्रिंटिंग इंजनों की कोशिश की है, लेकिन सभी पृष्ठों के लुक में हेरफेर करते हैं, और अधिक हानिकारक और कुछ मुश्किल से पढ़ने योग्य बनाते हैं: ( उदाहरण पृष्ठ स्क्रीनशॉट को चौकोर कोष्ठकों में शामिल किया गया है)

  • क्रोम [ मूल , प्रिंट शैलियाँ ( विकलांग | अक्षम नहीं है )]
  • फ़ायरफ़ॉक्स [ मूल , प्रिंट शैलियाँ (अक्षम p1 , p2 | अक्षम नहीं है p1 , p2 )]
  • पठनीयता
    • यह वेबपेज को सरल करता है (जो कि केंद्रित पढ़ने के लिए एक अच्छी बात है-हालांकि, यह वह नहीं है जो मैं खोज रहा हूं)। मैं बिना किसी हेरफेर के पीडीएफ फॉर्मेट में वेब ब्राउजर पर देखे गए वेबपेज की सभी पोज़िशन्स / स्टाइल्स प्रॉपर्टीज की तलाश में हूं।
  • फॉक्सइट रीडर
  • NovaPDF
  • CutyCapt [ मूल , ज़ूम फैक्टर: 0.4 : स्क्रीनशॉट, आउटपुट पीडीएफ]
    • मैं विंडोज पर प्रोग्राम के रनिंग मुद्दों को हल करने के बाद लिंक जोड़ दूंगा "
  • wkhtmltopdf [ मूल , ज़ूम फैक्टर: 0.4 : स्क्रीनशॉट , आउटपुट पीडीएफ ]
    • यह CSS3 का समर्थन नहीं करता है।

सभी वेबपेज स्क्रीनशॉट इमेज कैप्चरिंग प्लगइन्स (उदा। अपहरण , बहुत बढ़िया स्क्रीनशॉट , FireShot , फ़ायरफ़ॉक्स स्क्रीनशॉट डेवलपर टूल , फुल पेज स्क्रीन कैप्चर , Page2Images , वेब पर कब्जा , ...) मेरे प्रश्न का उत्तर न दें, क्योंकि वे नहीं करते हैं पाठ और लिंक को संरक्षित करें

Scrible वेबपृष्ठों को संरक्षित करने के लिए बहुत अच्छा है क्योंकि आगे के एनोटेशन और शोध के लिए है, लेकिन दुर्भाग्य से अभी भी ऑनलाइन और पीडीएफ प्रारूप में रूपांतरण के बिना।

समुदाय पर दो अन्य प्रश्न हैं जो किसी भी तरह मेरे लिए हैं, हालांकि, यह थोड़ा अलग है, लेकिन उन महत्वपूर्ण भेदों के साथ:

इसी तरह के और सवाल पाठ और लिंक को संरक्षित करना एक आवश्यकता नहीं है (पेज इस प्रकार कैप्चर किए गए हैं छवि स्क्रीनशॉट अधिकतर):


टिप्पणियाँ

ओएस: विंडोज 10


यदि आप किसी ब्राउज़र से प्रिंट करना चाहते हैं, तो आपको वेब पेज की स्क्रीन उपस्थिति को बनाए रखने के लिए किसी भी प्रिंट स्टाइलशीट को अक्षम करना होगा।
DavidPostill


तो आप का उपयोग कर मुद्रित कर सकते हैं क्यूटपीडीएफ लेखक
DavidPostill

@DavidPostill ऐसा लगता है कि प्रिंट शैलियों को अक्षम करना या तो काम नहीं करता है या यह पीडीएफ को सही ढंग से प्रदर्शित करने के लिए ब्राउज़र को प्रभावित नहीं करता है। प्रश्न के संपादित संस्करण में एक उदाहरण स्क्रीनशॉट जोड़ा गया है।
Omar

मेरा आज भी यही सवाल था और इस पेज ने मेरी मदद की (हालाँकि आउटपुट पेज का एक मोबाइल संस्करण था): stackoverflow.com/questions/9540990/...
MicroMachine

जवाबों:


4

हमने एक विश्वविद्यालय परियोजना में एक ही समस्या का सामना किया और इसका उपयोग करके हल करने में सक्षम थे

wkhtmltopdf

हमने कमांड लाइन पर इस टूल की क्षमताओं का काफी आनंद लिया। हमने इसे वेबपृष्ठों की वर्तमान स्थिति को रेंडर करने के लिए अजगर कोड का उपयोग करके भी बुलाया है। इसमें वेब पेज को पीडीएफ के रूप में वितरित करने का विकल्प है, आमतौर पर पृष्ठ स्वरूपण (उदाहरण के लिए ए 4), या पीएनजी के रूप में वेबसाइट दृश्य को संरक्षित करने के लिए सही नहीं है (पृष्ठ के दृश्य को संरक्षित करता है लेकिन लिंक नहीं)

हमारे द्वारा उपयोग की गई पठनीयता (पायथन: pypi.python.org/pypi/readability-lxml) प्रोजेक्ट भी है जो विज्ञापनों को हटाने और सामग्री का पता लगाने में बहुत अच्छी तरह से करता है (जैसे अखबार के लेख और इस तरह के लिए)। यदि आप अपने ब्राउज़र के लिए केवल एक addon या एक्सटेंशन चाहते हैं, तो निम्नलिखित पठनीयता कार्यान्वयन आपकी आवश्यकता को पूरा कर सकता है:

https://www.readability.com/addons/


दुर्भाग्य से, wkhtmltopdf ने पृष्ठ के तत्वों को संरक्षित नहीं किया। उदाहरण पृष्ठ : ज़ूम फैक्टर: 0.4: स्क्रीनशॉट , आउटपुट पीडीएफ
Omar

पठनीयता पृष्ठ को सरल करती है (जो कि एक अच्छी बात है-हालाँकि यह वह नहीं है जो मैं खोज रहा हूँ)। मुझे वेब ब्राउजर पर पीडीएफ फॉर्मेट में बिना किसी हेरफेर के देखे गए पेज की सभी पोजिशन्स / स्टाइल प्रॉपर्टीज रखने की जरूरत है।
Omar

क्या आपने उपकरण के wkhtmltopdf विकल्प का उपयोग किया है, क्योंकि पिंग पोजीशन ठीक होनी चाहिए (कम से कम पीडीएफ संस्करण की तुलना में जहां पेज ए 4 प्रारूप में फिट है)
SSchneid

1

यदि आप लिनक्स पर हैं, तो इस छोटे कमांड लाइन टूल को आज़माएँ CutyCapt , जो केवल Qt और QtWebkit पर निर्भर करता है, और पीडीएफ को निर्यात करता है।


1

मेरे पास एक ही समस्या थी, और इसे क्रोम के माध्यम से और PDF995 नामक एक प्रिंटर ड्राइवर के साथ पता लगाया, जिसे मैंने सुरक्षित रूप से डाउनलोड किया और मुफ्त में (डाउनलोड करने के लिए एक लिंक है) https://pdf995.en.softonic.com/ एक और है http://downloads.tomsguide.com/pdf995,0301-829.html )।

हालाँकि, मुझे लगता है कि कोई भी वेब ब्राउजर और कोई भी पीडीएफ कन्वर्टर पर्याप्त होगा। वैसे भी, यहाँ मैंने क्या किया:

  1. सभी का चयन करें या सब कुछ उजागर करें।
  2. हाइलाइट किए गए चयन पर राइट-क्लिक करें या Ctrl + P दबाएं (दोनों विकल्प आपको थोड़ा अलग परिणाम देते हैं, लेकिन आप पूरा होने के बाद उसी परिणाम के साथ समाप्त होते हैं)।

  3. यदि आपने 2 में राइट-क्लिक किया है, तो चयन (शॉर्ट-कट), "प्रिंट" पर क्लिक करें और केवल आपके द्वारा चुने गए सभी प्रिंट पूर्वावलोकन पर होंगे। सुनिश्चित करें कि आप अपने प्रिंटर गंतव्य को जो भी पीडीएफ कनवर्टर का उपयोग करने का निर्णय लेते हैं उसे बदल सकते हैं (पीडीएफ 99 5 या अन्य)।

  4. "प्रिंट" पर क्लिक करें और यह एक पीडीएफ दस्तावेज़ के रूप में बचाता है।

  5. यदि आपने इसके बजाय Ctrl (P) को थोड़ा (अधिक लंबा रास्ता) दबाया है, तो "अधिक सेटिंग्स" पर क्लिक करें और "विकल्प" तक स्क्रॉल करें।

  6. उस बॉक्स पर क्लिक करें जो "केवल चयन करें" और मेरे द्वारा बताए गए शॉर्ट-कट में सब कुछ का पालन करेगा।

  7. जो भी पीडीएफ कनवर्टर (पीडीएफ 99 5 या अन्य) चुनते हैं, अपने प्रिंटर गंतव्य को बदलना न भूलें।

  8. "प्रिंट" पर क्लिक करें।


0

यद्यपि आपका पीडीएफ में बिलकुल भी अनुरोध नहीं है, यदि उद्देश्य विशुद्ध रूप से बाद की समीक्षा के लिए वेबपृष्ठों की एक ऑफ़लाइन प्रतिलिपि रखना है, तो इसे वेबपृष्ठ के रूप में सहेजना बस ऐसा ही करेगा।

बड़ी चेतावनी यह है कि यह एक .html फ़ाइल और एक फोल्डर को बनाएगा, जिसमें एक ही डॉक्यूमेंट के बजाय पेज पर सभी मीडिया कंटेंट होंगे।

क्रोम और फ़ायरफ़ॉक्स में, आप उस पर राइट क्लिक करते हुए एक पेज सेव कर सकते हैं और Save as ... Internet Explorer में, आप इसे फ़ाइल के अंतर्गत सहेज सकते हैं - & gt; के रूप में सहेजें (मेनू को प्रदर्शित करने के लिए Alt कुंजी दबाकर)।


.Html प्रारूप में वेबपृष्ठ को सहेजना इसे अस्वीकार्य नहीं करेगा। तो, मुझे इसकी आवश्यकता पीडीएफ प्रारूप में है।
Omar

ये एक अच्छा बिंदु है! बस एक एक्सटेंशन याद है जो आपको प्रिंट-संबंधित स्टाइलशीट को आसानी से अक्षम करने की अनुमति देता है। एक त्वरित Google खोज ने मुझे उस समय चर्चा में ले लिया, जब मैंने पहली बार सुपरसुअर पर इसके बारे में सुना था: वेब ब्राउज़र में WYSIWYP (आप जो देखते हैं उसे कैसे प्रिंट करें) प्राप्त करें?
Pyheme

मैंने क्रोम का उपयोग करके "सेव एज़" करने की कोशिश की। यह एक .HTML फ़ाइल और एक फ़ोल्डर बनाता है। .HTLM फ़ाइल पृष्ठ से बहुत सारी सामग्री गायब थी।
SherlockSpreadsheets

0

इस सेवा का प्रयास करें। वेबसाइट से पीडीएफ बनाता है जैसा कि आप इसे ब्राउज़र में देखते हैं। https://lomotoh.com/ (मैं इस साइट से संबद्ध हूं)


यह लिंक को संरक्षित करता है, लेकिन चयन करने योग्य पाठ नहीं है, जो प्रश्न में एक आवश्यकता है।
fixer1234

कुछ साइटों के लिए चयन होने लगता है। मुझे लगता है कि यह निर्भर करता है कि साइट किस प्रकार के कस्टम फ़ॉन्ट का उपयोग करती है।
David Herse

0

कुछ पृष्ठों पर कम से कम सभी पाठ खोज योग्य, चयन योग्य, कट और पेस्ट करने योग्य होते हैं। मैंने एक ऐसे पृष्ठ पर कोशिश की, जो टेक्स्ट और पिक्स से कंप्यूटर द्वारा रोबोटिक रूप से चिपकाया गया था और उसने इसे एक छवि में शामिल किया।

मैंने सालों से इन चीजों का इस्तेमाल किया है। मुझे अपनी पसंद के XX शब्द में पृष्ठ का पुनर्निर्माण करके और परिणाम को पीडीएफ के रूप में निर्यात करके लिनक्स में सबसे अच्छे परिणाम मिलते हैं। मुझे वह मिल सकता है जो मुझे काफी कीमत पर चाहिए। मेरे सीमित उपयोग से मेहराब ivin साइट डेविड हर्स ने लगाई https://lomotoh.com/ (मैं हूँ नहीं इस साइट से जुड़े) के रूप में अच्छी तरह से किसी भी मैं कभी भी इस्तेमाल किया है काम करता है। मैं पीडीएफ तक वेबपृष्ठों को कवर करने के लिए संसाधन तक जाऊंगा, जब तक कि मुझे बेहतर नहीं मिलेगा या मुझे अपने स्वयं के पतले पर्स से भुगतान करने के लिए बहुत अधिक लागत आएगी।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.