पीडीएफ रूपांतरण के लिए उचित स्वचालित HTML (UNIX / लिनक्स वातावरण में) [बंद]


16

क्या स्वचालित रूप से लिनक्स में HTML फ़ाइलों से पीडीएफ दस्तावेजों को उत्पन्न करने का एक तरीका है जहां पीडीएफ इनपुट फ़ाइल के समान किसी प्रकार का उचित स्तर प्रदान करता है?

एक कमांड-लाइन टूल - जैसा कि किसी प्रकार के इंटरैक्टिव जीयूआई के विपरीत है - कुंजी है।

मैंने कोशिश की है htmldocऔर कुछ संबंधित चचेरे भाई, निश्चित रूप से। लेकिन ये उपकरण निराशाजनक रूप से पत्थर की उम्र के हैं; htmldocसीएसएस का समर्थन बिल्कुल नहीं करता है। आपको इन दिनों बहुत से HTML दस्तावेज़ नहीं मिलेंगे जिनमें कम से कम कुछ CSS स्टाइल नहीं हैं। मैं वास्तव में बेवकूफ प्रभावों या छोटी-मोटी अलंकरणों की परवाह नहीं करता, लेकिन मुद्दा यह है कि सीएसएस इन दिनों अधिकांश लेआउट के मूल में है; बहुत से लोग अब नेस्टेड टेबल की 6 परतों का उपयोग नहीं कर रहे हैं। इसलिए, यदि रूपांतरण उपकरण में CSS की कोई समझ नहीं है, तो यह "दस्तावेज़ सही नहीं लग रहा है" की बात नहीं है; यह प्रयोज्य के न्यूनतम मानक को पूरा नहीं करने की संभावना है।

यह कुछ लोगों द्वारा मुझे सुझाव दिया गया है कि PDF को परिवर्तित की जा सकने वाली छवियों को उत्पन्न करने के लिए गेको प्रतिपादन इंजन का उपयोग करने का प्रयास करें, लेकिन मुझे नहीं पता कि यह करने के बारे में कैसे जाना जाएगा, अकेले आसानी से।

मुझे यह मानने में कोई परेशानी नहीं है कि अच्छे वाणिज्यिक उपकरण हैं जो ऐसा करते हैं, लेकिन मैं वास्तव में यदि संभव हो तो एक ओपन-सोर्स पैकेज की तलाश कर रहा हूं, क्योंकि प्रयास स्वयं एक ओपन-सोर्स एक है और भुगतान नहीं करता है।

अग्रिम में धन्यवाद!

जवाबों:


7

क्या आपने wttmltopdf देखा है ? यह नहीं कह सकते हैं कि यह व्यक्तिगत रूप से कितना अच्छा काम करता है, लेकिन ऐसा लगता है कि आपको वास्तव में क्या चाहिए। केवल समस्या हो सकती है, इस और किसी भी 'ब्राउज़र ऑटोमेशन' समाधान के साथ, कि यह स्क्रीन को प्रदर्शित करने के बजाय प्रिंट स्टाइलशीट को उठाएगा, इसलिए पीडीएफ ठीक वैसा नहीं हो सकता जैसा आप स्क्रीन पर देखते हैं।


प्रिंट स्टाइलशीट क्या है? मुझे CSS ब्रह्मांड के नवीनतम और सबसे बड़े नए सामान के संपर्क से बाहर होना चाहिए।
एलेक्स बालाशोव

यह नया कुछ भी नहीं है, यह केवल टेबल के बजाय लेआउट के लिए CSS पर स्विच करने के बाद केवल अधिकांश वेबसाइटों के लिए व्यावहारिक हो गया। एक परिचय के लिए alistapart.com/articles/goingtoprint या webcredible.co.uk/user-friendly-resources/css/… की कोशिश करें ।
22


2

XHTML2PDF एक पायथन टूलसेट है, जिसमें कमांड-लाइन स्क्रिप्ट और पायथन लाइब्रेरी दोनों शामिल हैं (क्या आपको इसे स्क्रिप्ट से बाहर किए बिना किसी बड़ी चीज़ में एम्बेड करना चाहिए।) यह HTML / XHTML और CSS का समर्थन करता है, जो अतिरिक्त विक्रेता-विशिष्ट CSS शैलियों के साथ है। स्वरूपित आउटपुट को ट्वीक करें (उदाहरण के लिए, पृष्ठ संख्या, पैराग्राफ प्रवाह, आदि)

मैंने केवल कुछ HTML डॉक्स को संसाधित करने के लिए इसे थोड़ा सा उपयोग किया है, लेकिन यह ठीक काम करता है, और इसका फीचर सेट मुझे व्यापक लगता है। मैनुअल डेमो पेज पर छिपा हुआ है, लेकिन स्वयं, HTML डॉक से पीडीएफ में रूपांतरण का एक अच्छा उदाहरण है।

मेरे पास "पहले" और "बाद" उदाहरणों के लिए लिंक का एक अच्छा सेट था, लेकिन मैंने सिर्फ अपना खाता बनाया, और, जाहिर है, केवल स्पैमर्स ने अपनी पहली पोस्ट में एक से अधिक लिंक लगाए :-p


1

मैं कमांड लाइन से HTML पेजों में से कुछ पीएनजी उत्पन्न करना चाहता था। कहीं मुझे यह रूबी स्क्रिप्ट मिली है जो स्क्रीनशॉट उत्पन्न करने के लिए mozembed का उपयोग करती है। यदि आप स्केल नहीं करना चाहते हैं तो आप स्केल लाइन को हटा सकते हैं।

मुझे केवल एक समस्या यह दिखती है कि पृष्ठ वास्तव में एक पल के लिए स्क्रीन पर दिखाई देता है ...


हम्म, हाँ। आखिरी हिस्सा थोड़ा जानलेवा लगता है। इसे विशुद्ध रूप से सर्वर-साइड बैकएंड में बेक किया जाना चाहिए; कोई प्रदर्शन सिर या कुछ भी नहीं। उसे पूरा करने का कोई तरीका?
एलेक्स बालाशोव

0

कोशिश करें कि यह डी कमांड-लाइन से ठीक काम करे और इसके उदाहरण से यह किसी भी तरह के html के साथ काम करे


0

PrinceXML। CSS को ठीक से संभाल सकते हैं। लिनक्स, विंडोज, मैक ओएस एक्स संस्करण उपलब्ध हैं। AFAICS, यह भी Google डॉक्स के पीडीएफ आउटपुट के पीछे की तकनीक है। लेकिन ध्यान दें: यह पेवेयर है।

हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.