वेक्टर-ग्राफिक्स फॉर्म में एक सुरक्षित वेबपेज की एक सटीक प्रतिलिपि सहेजें


9

मैं वेक्टर-ग्राफिक्स फॉर्म में वेबपेज की एक सटीक प्रतिकृति को सहेजना चाहता हूं, इसलिए मैं स्क्रीनशॉट तकनीक का उपयोग नहीं कर सकता (क्योंकि वह छवि को रैस्टोरर-ग्राफिक्स फॉर्म में संग्रहीत करता है)।

मैंने सफारी, क्रोम और फ़ायरफ़ॉक्स के माध्यम से 'प्रिंट टू पीडीएफ़' और 'पीडीएफ के रूप में सहेजें' की कोशिश की है। यह ज्यादातर समय काम करता है। हालाँकि, सहेजा गया pdf सभी वेबपृष्ठों के लिए एक सटीक प्रतिकृति नहीं है। उदाहरण के लिए, इस वेबपृष्ठ को एक पीडीएफ के रूप में सहेजने का प्रयास करें, और ध्यान दें कि सहेजे गए पीडीएफ में अपवोट / डाउनवोट आइकन कैसे शामिल नहीं हैं।

मैंने सफारी के साथ WebArchive के रूप में बचत करने की भी कोशिश की है। यहाँ समस्या यह है कि मुझे परिणामी फ़ाइल को क्रॉप करने की आवश्यकता है, और मुझे नहीं पता कि कैसे एक WebArchive को क्रॉप करना है, क्योंकि पूर्वावलोकन इसे नहीं खोल सकता है, और यह बस सफारी (एक वर्ग में वापस) में खुलता है।

मैंने वेब ब्राउज़र प्लगइन्स की भी कोशिश की है जो वेबपेज को पीडीएफ (वेक्टर-ग्राफिक्स फॉर्म) के रूप में सहेजने के लिए एक-क्लिक समाधान प्रदान करता है। यह बेहतर काम करता है (सटीक पृष्ठ सहेजा जाता है) और लगभग समस्या को हल करता है, सिवाय इसके कि ये प्रोग्राम पृष्ठ url को क्लाउड-आधारित प्रोग्राम को क्वेरी करने और फिर पृष्ठ को सहेजने के लिए भेजकर काम करते हैं। इसका मतलब यह है कि यह तकनीक उन https साइटों के लिए काम नहीं करेगी, जिन्हें लॉगिन करने के लिए मेरे क्रेडेंशियल्स की आवश्यकता है।

तो मैं एक कोने में हूँ। मैं एक वेबपेज की सटीक वेक्टर-ग्राफिक्स प्रतिकृति को बचाने की कोशिश कर रहा हूं, जिसे देखने के लिए मेरे लॉगिन क्रेडेंशियल की आवश्यकता है। मैं यह कैसे कर सकता हूँ?


1
मुझे लगता है कि आप भ्रमित हैं - पीडीएफ एक वेक्टर प्रारूप नहीं है।
केविन पेंको

भ्रमित नहीं; विस्तार के बारे में बहुत ज्यादा चिंता न करें कि एक पीडीएफ एक कंटेनर है जो वेक्टर-ग्राफिक्स सामान को स्टोर कर सकता है, क्योंकि मुझे लगता है कि प्रश्न में मुख्य बिंदु से अवगत कराया जा रहा है
क्लेटन स्टेनली

आपका प्रश्न "मैं एक वेब पेज को एक पीडीएफ फाइल के रूप में कैसे सहेज सकता हूं, जैसा कि यह स्क्रीन पर दिखाता है, और एक ऐसे पेज के साथ काम करता है जिसे लॉग ऑन करने के लिए पासवर्ड की आवश्यकता होती है?"
केविन पेंको

पीडीएफ होना जरूरी नहीं है; वेबपेज को सहेजने के लिए यह केवल एक मार्ग है जहां टेक्स्ट वेक्टर-ग्राफिक्स फॉर्म में है। मुझे उस प्रारूप के लिए प्रतिबद्ध नहीं होना है। मैं हालांकि दूसरे नोट के लिए शीर्षक में सुरक्षित जोड़ दूंगा, ताकि इस पर बेहतर जोर दिया जाए।
क्लेटन स्टेनली

जवाबों:


6

पेज को स्क्रीन पर देखते समय आप पृष्ठ को प्रिंट करते हुए अलग-अलग परिणाम प्राप्त कर रहे हैं।

ऐसा इसलिए होता है क्योंकि वेब पेज में सीएसएस स्टाइलशीट शामिल होती है जो प्रिंट होने पर पृष्ठ को बदल देती है।

यह प्रश्न आपको उस समस्या से बचने में मदद करेगा: मैं स्क्रीन स्टाइलशीट के साथ कैसे प्रिंट कर सकता हूं?

पेज को ऑन-स्क्रीन स्टाइलशीट के साथ प्रिंट करने के लिए वहां दिए गए निर्देशों का पालन करें।

फिर आपको पीडीएफ को प्रिंट करने और स्क्रीन पर देखने के समान परिणाम प्राप्त करने में सक्षम होना चाहिए।


1
बस पूर्ण प्रलेखन के लिए, मैंने क्रोम वेब डेवलपर प्लगइन का उपयोग किया, और इस प्लगइन के माध्यम से सीएसएस का संपादन किया। मुझे Google Chrome के बिल्ट डेवलपर टूल का उपयोग करके सीएसएस को संपादित करने के बाद अपडेट करने के लिए प्रिंट पेज नहीं मिल सका, लेकिन यह सबसे अधिक संभावना है क्योंकि मैं उस टूल से अपरिचित हूं।
क्लेटन स्टेनली

4

यदि आप थोड़ी स्क्रिप्टिंग से डरते नहीं हैं, तो आप http://phantomjs.org/ से OSX के लिए प्रेत एप्लिकेशन का उपयोग करने का प्रयास कर सकते हैं

तब आप सिर्फ rasterize.js स्क्रिप्ट जैसे कमांड के साथ शामिल बाइनरी को चलाएंगे:

phantomjs.exe rasterize.js http://www.example.com/sitepage 8.5in*11in outfile.pdf

एक दो नोट:

  • इसे 'rasterize.js' कहा जाता है, लेकिन पाठ को वास्तविक पाठ के रूप में पीडीएफ में सहेजा जाता है।

  • विंडोज़ ऑथेंटिकेशन का उपयोग करके एक सुरक्षित साइट पर प्रमाणीकरण को पेज ऑब्जेक्ट को इनिशियलाइज़ करने के बाद rasterize.js स्क्रिप्ट में एक दो लाइन जोड़कर पूरा किया जा सकता है:

var पेज = आवश्यकता ('वेबपेज')। create (),
    सिस्टम = आवश्यकता ('सिस्टम'),
    पता, आउटपुट, आकार;
    page.settings.userName = "serviceUserName"; // मैंने इन्हें जोड़ा
    page.settings.password = "servicePassword"; // यहाँ 2 लाइनें

अगर (system.args.length 5) {

प्रेत चट्टानें!
मैथ्यू लॉक
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.