जावा से एक्सएमएल को कैसे प्रिंट करें?


443

मेरे पास एक जावा स्ट्रिंग है जिसमें एक्सएमएल है, जिसमें कोई लाइन फीड या इंडेंटेशन नहीं है। मैं इसे अच्छी तरह से स्वरूपित XML के साथ एक स्ट्रिंग में बदलना चाहूंगा। मैं यह कैसे करु?

String unformattedXml = "<tag><nested>hello</nested></tag>";
String formattedXml = new [UnknownClass]().format(unformattedXml);

नोट: मेरा इनपुट एक स्ट्रिंग है । मेरा आउटपुट एक स्ट्रिंग है

(मूल) नकली परिणाम:

<?xml version="1.0" encoding="UTF-8"?>
<root>
  <tag>
    <nested>hello</nested>
  </tag>
</root>

इस सवाल की जाँच करें: stackoverflow.com/questions/1264849/…
dfa

10
बस जिज्ञासु, क्या आप इस आउटपुट को एक XML फ़ाइल या कुछ और भेज रहे हैं जहां इंडेंट करना वास्तव में मायने रखता है? कुछ समय पहले मैं अपने XML को प्रारूपित करने के लिए बहुत चिंतित था ताकि इसे ठीक से प्रदर्शित किया जा सके ... लेकिन इस पर समय बिताने के बाद मुझे एहसास हुआ कि मुझे अपना उत्पादन एक वेब ब्राउज़र और किसी भी अपेक्षाकृत आधुनिक वेब ब्राउज़र को भेजना होगा वास्तव में XML को एक अच्छी ट्री संरचना में प्रदर्शित करेगा, इसलिए मैं इस मुद्दे को भूल सकता हूं और आगे बढ़ सकता हूं। मैं यह उल्लेख कर रहा हूं कि आप (या एक ही समस्या वाले अन्य उपयोगकर्ता) एक ही विवरण को अनदेखा कर सकते हैं।
हाबिल मोरेलोस

3
@Abel, टेक्स्ट फ़ाइलों को सहेजना, HTML टेक्स्टारेस में सम्मिलित करना, और डीबगिंग उद्देश्यों के लिए कंसोल को डंप करना।
स्टीव मैकलियॉड

2
"बहुत व्यापक के रूप में पकड़ पर" - वर्तमान में जो प्रश्न है उससे अधिक सटीक होना कठिन है!
स्टीव मैक्लियॉड

जवाबों:


266
Transformer transformer = TransformerFactory.newInstance().newTransformer();
transformer.setOutputProperty(OutputKeys.INDENT, "yes");
transformer.setOutputProperty("{http://xml.apache.org/xslt}indent-amount", "2");
//initialize StreamResult with File object to save to file
StreamResult result = new StreamResult(new StringWriter());
DOMSource source = new DOMSource(doc);
transformer.transform(source, result);
String xmlString = result.getWriter().toString();
System.out.println(xmlString);

नोट: परिणाम जावा संस्करण के आधार पर भिन्न हो सकते हैं। अपने प्लेटफ़ॉर्म के लिए विशिष्ट वर्कअराउंड की खोज करें।


1
कैसे करें ताकि आउटपुट न हो <?xml version="1.0" encoding="UTF-8"?>?
थांग फाम

19
छोड़ <?xml ...>घोषणा, ऐडtransformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes")
rustyx

4
आकस्मिक पाठकों को यहां वर्णित समाधान का एक उन्नत संस्करण मिल सकता है ( stackoverflow.com/a/33541820/363573 )।
Stephan

5
कहाँ docपरिभाषित किया गया है?
फ्लोरियन एफ

6
यह मेरे प्रश्न का उत्तर नहीं देता है: मैं XML को शामिल करने वाले स्ट्रिंग को कैसे प्रारूपित करूं? यह उत्तर पहले ही मान लेता है कि आपने स्ट्रिंग ऑब्जेक्ट को किसी अन्य ऑब्जेक्ट में बदल दिया है।
स्टीव मैकलियोड

135

यहाँ मेरे अपने प्रश्न का उत्तर है। मैंने विभिन्न परिणामों के उत्तरों को एक वर्ग लिखने के लिए संयोजित किया जो कि XML को प्रिंट करता है।

अमान्य XML या बड़े दस्तावेज़ों के साथ इसका जवाब देने की कोई गारंटी नहीं है।

package ecb.sdw.pretty;

import org.apache.xml.serialize.OutputFormat;
import org.apache.xml.serialize.XMLSerializer;
import org.w3c.dom.Document;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import java.io.IOException;
import java.io.StringReader;
import java.io.StringWriter;
import java.io.Writer;

/**
 * Pretty-prints xml, supplied as a string.
 * <p/>
 * eg.
 * <code>
 * String formattedXml = new XmlFormatter().format("<tag><nested>hello</nested></tag>");
 * </code>
 */
public class XmlFormatter {

    public XmlFormatter() {
    }

    public String format(String unformattedXml) {
        try {
            final Document document = parseXmlFile(unformattedXml);

            OutputFormat format = new OutputFormat(document);
            format.setLineWidth(65);
            format.setIndenting(true);
            format.setIndent(2);
            Writer out = new StringWriter();
            XMLSerializer serializer = new XMLSerializer(out, format);
            serializer.serialize(document);

            return out.toString();
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
    }

    private Document parseXmlFile(String in) {
        try {
            DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
            DocumentBuilder db = dbf.newDocumentBuilder();
            InputSource is = new InputSource(new StringReader(in));
            return db.parse(is);
        } catch (ParserConfigurationException e) {
            throw new RuntimeException(e);
        } catch (SAXException e) {
            throw new RuntimeException(e);
        } catch (IOException e) {
            throw new RuntimeException(e);
        }
    }

    public static void main(String[] args) {
        String unformattedXml =
                "<?xml version=\"1.0\" encoding=\"UTF-8\"?><QueryMessage\n" +
                        "        xmlns=\"http://www.SDMX.org/resources/SDMXML/schemas/v2_0/message\"\n" +
                        "        xmlns:query=\"http://www.SDMX.org/resources/SDMXML/schemas/v2_0/query\">\n" +
                        "    <Query>\n" +
                        "        <query:CategorySchemeWhere>\n" +
                        "   \t\t\t\t\t         <query:AgencyID>ECB\n\n\n\n</query:AgencyID>\n" +
                        "        </query:CategorySchemeWhere>\n" +
                        "    </Query>\n\n\n\n\n" +
                        "</QueryMessage>";

        System.out.println(new XmlFormatter().format(unformattedXml));
    }

}

13
बस इस बात पर ध्यान दें कि इस उत्तर के लिए Xerces के उपयोग की आवश्यकता है। यदि आप इस निर्भरता को जोड़ना नहीं चाहते हैं तो आप बस मानक jdk पुस्तकालयों और javax.xml.transform.Transformer (नीचे मेरा जवाब देखें) का उपयोग कर सकते हैं
khylo

45
2008 में यह एक अच्छा जवाब था, लेकिन अब यह सभी अपाचे कक्षाओं के बजाय मानक जेडीके कक्षाओं के साथ किया जा सकता है। Xerces.apache.org/xerces2-j/faq-general.html#faq-6 देखें । हाँ यह एक Xerces FAQ है लेकिन उत्तर मानक JDK कक्षाओं को कवर करता है। इन वर्गों के प्रारंभिक 1.5 कार्यान्वयन में कई मुद्दे थे लेकिन 1.6 पर सब कुछ ठीक काम करता है। FAQ में LSSerializer उदाहरण की प्रतिलिपि बनाएँ, "..." को काटें और पंक्ति के writer.getDomConfig().setParameter("format-pretty-print", Boolean.TRUE);बाद जोड़ें LSSerializer writer = ...
जॉर्ज हॉकिन्स

2
मैंने Apache दिए गए उदाहरण का उपयोग करके एक छोटा वर्ग बनाया है, जिसे @GeorgeHawkins ने लिंक दिया था। यह याद आ documentरहा था कि चर को कैसे आरंभ किया गया था, इसलिए मैंने सोचा कि मैं मंदी में जोड़ सकता हूं और इसमें से एक त्वरित उदाहरण बना सकता हूं। मुझे बताएं कि क्या मुझे कुछ बदलना चाहिए, pastebin.com/XL7932aC
samwell

यह सच नहीं है कि आप केवल jdk के साथ ऐसा कर सकते हैं। कम से कम मज़बूती से नहीं। यह कुछ आंतरिक रजिस्ट्री कार्यान्वयन पर निर्भर करता है जो डिफ़ॉल्ट रूप से मेरे jdk7u72 के साथ सक्रिय नहीं है। तो आप अभी भी सीधे अपाचे सामान का बेहतर उपयोग करते हैं।
user1050755

यहां बिना किसी निर्भरता के एक समाधान है: stackoverflow.com/a/33541820/363573
Stephan

131

इस उत्तर पर आधारित एक सरल समाधान :

public static String prettyFormat(String input, int indent) {
    try {
        Source xmlInput = new StreamSource(new StringReader(input));
        StringWriter stringWriter = new StringWriter();
        StreamResult xmlOutput = new StreamResult(stringWriter);
        TransformerFactory transformerFactory = TransformerFactory.newInstance();
        transformerFactory.setAttribute("indent-number", indent);
        Transformer transformer = transformerFactory.newTransformer(); 
        transformer.setOutputProperty(OutputKeys.INDENT, "yes");
        transformer.transform(xmlInput, xmlOutput);
        return xmlOutput.getWriter().toString();
    } catch (Exception e) {
        throw new RuntimeException(e); // simple exception handling, please review it
    }
}

public static String prettyFormat(String input) {
    return prettyFormat(input, 2);
}

परीक्षण का मामला:

prettyFormat("<root><child>aaa</child><child/></root>");

रिटर्न:

<?xml version="1.0" encoding="UTF-8"?>
<root>
  <child>aaa</child>
  <child/>
</root>

1
यह वह कोड है जो मैंने हमेशा उपयोग किया है, लेकिन इस कंपनी में यह काम नहीं किया, मुझे लगता है कि वे एक और XML ट्रांसफॉर्मिंग लाइब्रेरी का उपयोग कर रहे हैं। मैंने एक अलग लाइन के रूप में कारखाना बनाया और फिर काम किया factory.setAttribute("indent-number", 4);और अब यह काम करता है।
एड्रियन स्मिथ

कैसे करें ताकि आउटपुट न हो <?xml version="1.0" encoding="UTF-8"?>?
थांग फाम

4
@ हैरी:transformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes");
jjmontes

5
नमस्ते मैं इस सटीक कोड का उपयोग कर रहा हूं, और मेरा प्रारूप पहले तत्व के अपवाद के साथ ठीक से है, इसलिए: <?xml version="1.0" encoding="UTF-8"?><root>यह सब एक पंक्ति में है। कोई विचार क्यों?
कोडिएक

2
@ कोडीमीस्टर: एक बग लगता है (देखें stackoverflow.com/a/18251901/3375325 )। जोड़ना transformer.setOutputProperty(OutputKeys.DOCTYPE_PUBLIC, "yes");मेरे लिए काम किया।
जनासन 16

100

अब यह 2012 है और जावा एक्सएमएल के साथ उपयोग करने की तुलना में अधिक कर सकता है, मैं अपने स्वीकृत उत्तर के लिए एक विकल्प जोड़ना चाहूंगा। जावा 6 के बाहर इसकी कोई निर्भरता नहीं है।

import org.w3c.dom.Node;
import org.w3c.dom.bootstrap.DOMImplementationRegistry;
import org.w3c.dom.ls.DOMImplementationLS;
import org.w3c.dom.ls.LSSerializer;
import org.xml.sax.InputSource;

import javax.xml.parsers.DocumentBuilderFactory;
import java.io.StringReader;

/**
 * Pretty-prints xml, supplied as a string.
 * <p/>
 * eg.
 * <code>
 * String formattedXml = new XmlFormatter().format("<tag><nested>hello</nested></tag>");
 * </code>
 */
public class XmlFormatter {

    public String format(String xml) {

        try {
            final InputSource src = new InputSource(new StringReader(xml));
            final Node document = DocumentBuilderFactory.newInstance().newDocumentBuilder().parse(src).getDocumentElement();
            final Boolean keepDeclaration = Boolean.valueOf(xml.startsWith("<?xml"));

        //May need this: System.setProperty(DOMImplementationRegistry.PROPERTY,"com.sun.org.apache.xerces.internal.dom.DOMImplementationSourceImpl");


            final DOMImplementationRegistry registry = DOMImplementationRegistry.newInstance();
            final DOMImplementationLS impl = (DOMImplementationLS) registry.getDOMImplementation("LS");
            final LSSerializer writer = impl.createLSSerializer();

            writer.getDomConfig().setParameter("format-pretty-print", Boolean.TRUE); // Set this to true if the output needs to be beautified.
            writer.getDomConfig().setParameter("xml-declaration", keepDeclaration); // Set this to true if the declaration is needed to be outputted.

            return writer.writeToString(document);
        } catch (Exception e) {
            throw new RuntimeException(e);
        }
    }

    public static void main(String[] args) {
        String unformattedXml =
                "<?xml version=\"1.0\" encoding=\"UTF-8\"?><QueryMessage\n" +
                        "        xmlns=\"http://www.SDMX.org/resources/SDMXML/schemas/v2_0/message\"\n" +
                        "        xmlns:query=\"http://www.SDMX.org/resources/SDMXML/schemas/v2_0/query\">\n" +
                        "    <Query>\n" +
                        "        <query:CategorySchemeWhere>\n" +
                        "   \t\t\t\t\t         <query:AgencyID>ECB\n\n\n\n</query:AgencyID>\n" +
                        "        </query:CategorySchemeWhere>\n" +
                        "    </Query>\n\n\n\n\n" +
                        "</QueryMessage>";

        System.out.println(new XmlFormatter().format(unformattedXml));
    }
}

कोई संकेत नहीं, लेकिन यह इसके साथ काम करता है: System.setProperty (DOMImplementationRegistry.PROPERTY, "com.sun.org.apache.xerces.internal.dom.DOMImplementationSmImpl");
ggb667

1
आप इस उदाहरण से कैसे संकेत देते हैं?
ggb667

2
@DanTemple ऐसा लगता है कि एन्कोडिंग को नियंत्रित करने के लिए आपको LSOutput का उपयोग करने की आवश्यकता है। देखें chipkillmar.net/2009/03/25/pretty-print-xml-from-a-dom
यहोशू डेविस

1
मैंने इसे एंड्रियोड में इस्तेमाल करने की कोशिश की, लेकिन मैं `DOMImplementationRegistry पैकेज नहीं पा रहा हूँ। मैं जावा 8 का उपयोग कर रहा हूं
चिंतन सोनी

2
साथ ही आयात सूची सहित, इतने सारे परस्पर विरोधी पैकेज उपलब्ध .. जरूरत संयोजन की समझ बनाने के लिए अन्यथा के लिए धन्यवाद
लियोन

54

बस यह ध्यान देने के लिए कि टॉप रेटेड उत्तर को xerces के उपयोग की आवश्यकता है।

यदि आप इस बाहरी निर्भरता को जोड़ना नहीं चाहते हैं तो आप बस मानक jdk पुस्तकालयों का उपयोग कर सकते हैं (जो वास्तव में आंतरिक रूप से xerces का उपयोग करके बनाया गया है)।

नायब jdk संस्करण 1.5 के साथ एक बग था। http://bugs.sun.com/bugdatabase/view_bug.do?bug_id=6296446 देखें, लेकिन अब इसे हल कर लिया गया है।

(ध्यान दें कि यदि कोई त्रुटि होती है तो यह मूल पाठ वापस कर देगा)

package com.test;

import java.io.ByteArrayInputStream;
import java.io.ByteArrayOutputStream;

import javax.xml.transform.OutputKeys;
import javax.xml.transform.Source;
import javax.xml.transform.Transformer;
import javax.xml.transform.sax.SAXSource;
import javax.xml.transform.sax.SAXTransformerFactory;
import javax.xml.transform.stream.StreamResult;

import org.xml.sax.InputSource;

public class XmlTest {
    public static void main(String[] args) {
        XmlTest t = new XmlTest();
        System.out.println(t.formatXml("<a><b><c/><d>text D</d><e value='0'/></b></a>"));
    }

    public String formatXml(String xml){
        try{
            Transformer serializer= SAXTransformerFactory.newInstance().newTransformer();
            serializer.setOutputProperty(OutputKeys.INDENT, "yes");
            //serializer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes");
            serializer.setOutputProperty("{http://xml.apache.org/xslt}indent-amount", "2");
            //serializer.setOutputProperty("{http://xml.customer.org/xslt}indent-amount", "2");
            Source xmlSource=new SAXSource(new InputSource(new ByteArrayInputStream(xml.getBytes())));
            StreamResult res =  new StreamResult(new ByteArrayOutputStream());            
            serializer.transform(xmlSource, res);
            return new String(((ByteArrayOutputStream)res.getOutputStream()).toByteArray());
        }catch(Exception e){
            //TODO log error
            return xml;
        }
    }

}

इस स्थिति में बाएं टैब का उपयोग नहीं किया जाता है। सभी टैग सामान्य पाठ की तरह, लाइन के पहले प्रतीक पर शुरू होते हैं।
रुसलान

बाइट्स और स्ट्रिंग के बीच आगे और पीछे कन्वर्ट करते समय आपको एक चारसेट निर्दिष्ट करने की आवश्यकता नहीं है?
ग्लास

2
वहाँ से और बाइट सरणियों / स्ट्रिंग को परिवर्तित करने की कोई आवश्यकता नहीं होनी चाहिए। बहुत कम से कम आपको ऐसा करते समय चारसेट निर्दिष्ट करना होगा। बेहतर विकल्प यह होगा कि StringReader और StringWriter वर्गों का उपयोग InputSource और StreamResult में लपेटा जाए।
मैक्सिमम डेम

काम नहीं कर रहा। आपको कुछ आंतरिक रजिस्ट्री कार्यान्वयन के साथ गड़बड़ करने की आवश्यकता है।
user1050755

यहाँ इस समाधान का एक सरल संस्करण है: stackoverflow.com/a/33541820/363573
Stephan

32

मैंने org.dom4j.io.OutputFormat.createPrettyPrint () विधि का उपयोग करके अतीत में बहुत कुछ छापा है

public String prettyPrint(final String xml){  

    if (StringUtils.isBlank(xml)) {
        throw new RuntimeException("xml was null or blank in prettyPrint()");
    }

    final StringWriter sw;

    try {
        final OutputFormat format = OutputFormat.createPrettyPrint();
        final org.dom4j.Document document = DocumentHelper.parseText(xml);
        sw = new StringWriter();
        final XMLWriter writer = new XMLWriter(sw, format);
        writer.write(document);
    }
    catch (Exception e) {
        throw new RuntimeException("Error pretty printing xml:\n" + xml, e);
    }
    return sw.toString();
}

3
स्वीकृत समाधान मेरे मामले में नेस्टेड टैग को ठीक से इंडेंट नहीं करता है, यह एक करता है।
चेस सीबेरट

3
मैंने लाइनों के अंत में सभी अनुगामी रिक्त स्थान को हटाने के साथ prettyPrintedString.replaceAll("\\s+\n", "\n")
संयोजन में इसका उपयोग किया

19

यहाँ यह dom4j का उपयोग करने का एक तरीका है :

आयात:

import org.dom4j.Document;  
import org.dom4j.DocumentHelper;  
import org.dom4j.io.OutputFormat;  
import org.dom4j.io.XMLWriter;

कोड:

String xml = "<your xml='here'/>";  
Document doc = DocumentHelper.parseText(xml);  
StringWriter sw = new StringWriter();  
OutputFormat format = OutputFormat.createPrettyPrint();  
XMLWriter xw = new XMLWriter(sw, format);  
xw.write(doc);  
String result = sw.toString();

1
यह मेरे लिए काम नहीं किया। इसने बस कुछ दिया: <?xml version...एक लाइन पर और बाकी सब कुछ दूसरी लाइन पर।
सिक्सटफुटर्सड्यूड

14

जब से आप के साथ शुरू कर रहे हैं String, आप एक DOMवस्तु (जैसे Node) को गुप्त करने की जरूरत है इससे पहले कि आप का उपयोग कर सकते हैं Transformer। हालाँकि, यदि आप जानते हैं कि आपका XML स्ट्रिंग मान्य है, और आप एक स्ट्रिंग को DOM में पार्स करने की मेमोरी ओवरहेड को लाइक नहीं करना चाहते हैं, तो वापस स्ट्रिंग पाने के लिए DOM पर एक ट्रांसफ़ॉर्म रन करना - आप बस कुछ पुराने ढंग का कर सकते हैं चरित्र पार्सिंग द्वारा चरित्र। हर </...>वर्ण के बाद एक नई पंक्ति और रिक्त स्थान डालें , काउंटर और रिक्त स्थान निर्धारित करें (रिक्त स्थान की संख्या निर्धारित करें) जो आप हर के लिए वेतन वृद्धि <...>और </...>आपके द्वारा देखे जाने वाले सभी के लिए घटाएं ।

डिस्क्लेमर - मैंने नीचे दिए गए फंक्शन्स का कट / पेस्ट / टेक्स्ट एडिट किया, इसलिए हो सकता है कि वे उस तरह से कंपाइल न हों।

public static final Element createDOM(String strXML) 
    throws ParserConfigurationException, SAXException, IOException {

    DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
    dbf.setValidating(true);
    DocumentBuilder db = dbf.newDocumentBuilder();
    InputSource sourceXML = new InputSource(new StringReader(strXML));
    Document xmlDoc = db.parse(sourceXML);
    Element e = xmlDoc.getDocumentElement();
    e.normalize();
    return e;
}

public static final void prettyPrint(Node xml, OutputStream out)
    throws TransformerConfigurationException, TransformerFactoryConfigurationError, TransformerException {
    Transformer tf = TransformerFactory.newInstance().newTransformer();
    tf.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes");
    tf.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
    tf.setOutputProperty(OutputKeys.INDENT, "yes");
    tf.transform(new DOMSource(xml), new StreamResult(out));
}

1
"हालांकि, अगर आपको पता है कि आपका XML स्ट्रिंग वैध है ..." अच्छी बात है। नीचे दिए गए इस दृष्टिकोण के आधार पर मेरा समाधान देखें।
डेविड इस्ले

12

यदि एक 3 जी पार्टी एक्सएमएल लाइब्रेरी का उपयोग करना ठीक है, तो आप वर्तमान में सबसे ज्यादा वोट किए गए उत्तरों की तुलना में काफी सरलता से दूर हो सकते हैं।

यह कहा गया था कि इनपुट और आउटपुट दोनों स्ट्रिंग्स होना चाहिए, इसलिए यहां एक उपयोगिता विधि है जो एक्सओएम लाइब्रेरी के साथ लागू होती है :

import nu.xom.*;
import java.io.*;

[...]

public static String format(String xml) throws ParsingException, IOException {
    ByteArrayOutputStream out = new ByteArrayOutputStream();
    Serializer serializer = new Serializer(out);
    serializer.setIndent(4);  // or whatever you like
    serializer.write(new Builder().build(xml, ""));
    return out.toString("UTF-8");
}

मैंने परीक्षण किया कि यह काम करता है, और परिणाम आपके जेआरई संस्करण या उस जैसे कुछ पर निर्भर नहीं करते हैं। यह देखने के लिए कि आउटपुट प्रारूप को अपनी पसंद के अनुसार कैसे अनुकूलित किया जाए, Serializerएपीआई पर एक नज़र डालें ।

यह वास्तव में मैंने जितना सोचा था उससे अधिक समय से निकला था - कुछ अतिरिक्त लाइनों की आवश्यकता थी क्योंकि लिखने के लिए Serializerएक OutputStreamचाहिए। लेकिन ध्यान दें कि यहाँ वास्तविक XML ट्विडलिंग के लिए बहुत कम कोड है।

(इस उत्तर XOM की मेरी मूल्यांकन है, जो किया गया था का हिस्सा है सुझाव दिया मेरे में एक विकल्प के रूप में सबसे अच्छा जावा एक्सएमएल पुस्तकालय के बारे में सवाल dom4j को बदलने के लिए रिकॉर्ड के लिए, dom4j के साथ इसी तरह की आसानी उपयोग करने के साथ इस लक्ष्य को हासिल कर सकते हैं। XMLWriterऔर OutputFormatसंपादित करें : .. । mlo55 के उत्तर में प्रदर्शन किया गया ।)


2
धन्यवाद, यही मैं ढूंढ रहा था। यदि आपके पास एक XML पहले से ही एक "दस्तावेज़" ऑब्जेक्ट में XOM के साथ पार्स है, तो आप इसे सीधे serializer.write (दस्तावेज़) में पास कर सकते हैं;
थिबॉल्ट डी।

12

केविन हैकसन ने कहा: "हालाँकि, यदि आप जानते हैं कि आपका XML स्ट्रिंग वैध है, और आप एक स्ट्रिंग को DOM में पार्स करने की मेमोरी ओवरहेड को लाइक नहीं करना चाहते हैं, तो स्ट्रिंग को वापस पाने के लिए DOM पर एक ट्रांसफ़ॉर्म रन करना - आप कर सकते हैं चरित्र पार्सिंग द्वारा कुछ पुराने ढंग के चरित्र करें। प्रत्येक वर्ण के बाद एक नई पंक्ति और रिक्त स्थान डालें। काउंटर (रिक्त स्थान की संख्या निर्धारित करने के लिए) रखें जिसे आप हर <...> के लिए बढ़ाते हैं और आप जो भी देखते हैं उसके लिए वेतन वृद्धि होती है। "

माना। इस तरह का दृष्टिकोण बहुत तेज़ है और इसकी बहुत कम निर्भरताएँ हैं।

उदाहरण समाधान:

/**
 * XML utils, including formatting.
 */
public class XmlUtils
{
  private static XmlFormatter formatter = new XmlFormatter(2, 80);

  public static String formatXml(String s)
  {
    return formatter.format(s, 0);
  }

  public static String formatXml(String s, int initialIndent)
  {
    return formatter.format(s, initialIndent);
  }

  private static class XmlFormatter
  {
    private int indentNumChars;
    private int lineLength;
    private boolean singleLine;

    public XmlFormatter(int indentNumChars, int lineLength)
    {
      this.indentNumChars = indentNumChars;
      this.lineLength = lineLength;
    }

    public synchronized String format(String s, int initialIndent)
    {
      int indent = initialIndent;
      StringBuilder sb = new StringBuilder();
      for (int i = 0; i < s.length(); i++)
      {
        char currentChar = s.charAt(i);
        if (currentChar == '<')
        {
          char nextChar = s.charAt(i + 1);
          if (nextChar == '/')
            indent -= indentNumChars;
          if (!singleLine)   // Don't indent before closing element if we're creating opening and closing elements on a single line.
            sb.append(buildWhitespace(indent));
          if (nextChar != '?' && nextChar != '!' && nextChar != '/')
            indent += indentNumChars;
          singleLine = false;  // Reset flag.
        }
        sb.append(currentChar);
        if (currentChar == '>')
        {
          if (s.charAt(i - 1) == '/')
          {
            indent -= indentNumChars;
            sb.append("\n");
          }
          else
          {
            int nextStartElementPos = s.indexOf('<', i);
            if (nextStartElementPos > i + 1)
            {
              String textBetweenElements = s.substring(i + 1, nextStartElementPos);

              // If the space between elements is solely newlines, let them through to preserve additional newlines in source document.
              if (textBetweenElements.replaceAll("\n", "").length() == 0)
              {
                sb.append(textBetweenElements + "\n");
              }
              // Put tags and text on a single line if the text is short.
              else if (textBetweenElements.length() <= lineLength * 0.5)
              {
                sb.append(textBetweenElements);
                singleLine = true;
              }
              // For larger amounts of text, wrap lines to a maximum line length.
              else
              {
                sb.append("\n" + lineWrap(textBetweenElements, lineLength, indent, null) + "\n");
              }
              i = nextStartElementPos - 1;
            }
            else
            {
              sb.append("\n");
            }
          }
        }
      }
      return sb.toString();
    }
  }

  private static String buildWhitespace(int numChars)
  {
    StringBuilder sb = new StringBuilder();
    for (int i = 0; i < numChars; i++)
      sb.append(" ");
    return sb.toString();
  }

  /**
   * Wraps the supplied text to the specified line length.
   * @lineLength the maximum length of each line in the returned string (not including indent if specified).
   * @indent optional number of whitespace characters to prepend to each line before the text.
   * @linePrefix optional string to append to the indent (before the text).
   * @returns the supplied text wrapped so that no line exceeds the specified line length + indent, optionally with
   * indent and prefix applied to each line.
   */
  private static String lineWrap(String s, int lineLength, Integer indent, String linePrefix)
  {
    if (s == null)
      return null;

    StringBuilder sb = new StringBuilder();
    int lineStartPos = 0;
    int lineEndPos;
    boolean firstLine = true;
    while(lineStartPos < s.length())
    {
      if (!firstLine)
        sb.append("\n");
      else
        firstLine = false;

      if (lineStartPos + lineLength > s.length())
        lineEndPos = s.length() - 1;
      else
      {
        lineEndPos = lineStartPos + lineLength - 1;
        while (lineEndPos > lineStartPos && (s.charAt(lineEndPos) != ' ' && s.charAt(lineEndPos) != '\t'))
          lineEndPos--;
      }
      sb.append(buildWhitespace(indent));
      if (linePrefix != null)
        sb.append(linePrefix);

      sb.append(s.substring(lineStartPos, lineEndPos + 1));
      lineStartPos = lineEndPos + 1;
    }
    return sb.toString();
  }

  // other utils removed for brevity
}

2
यही तरीका होना चाहिए। स्ट्रिंग स्तर पर मक्खी पर प्रारूपित करें। यह एकमात्र समाधान है जो अमान्य या अपूर्ण XML को प्रारूपित करेगा।
फ्लोरियन एफ

11

हम्म्म ... कुछ इस तरह का सामना करना पड़ा और यह एक ज्ञात बग है ... बस इस OutputProperty को जोड़ें।

transformer.setOutputProperty(OutputPropertiesFactory.S_KEY_INDENT_AMOUNT, "8");

उम्मीद है की यह मदद करेगा ...


2
यह OutputPropertiesFactory कहाँ से आता है?
हेलनोव

आयात com.sun.org.apache.xml.internal.serializer। *;
गौरव

9

टिप्पणी के बारे में कि "आपको पहले एक DOM ट्री का निर्माण करना होगा": नहीं, आपको ऐसा नहीं करना चाहिए और ऐसा नहीं करना चाहिए।

इसके बजाय, एक StreamSource (नया StreamSource (नया StringReader (str))) बनाएँ, और उसे बताए गए पहचान ट्रांसफार्मर को फ़ीड करें। वह SAX पार्सर का उपयोग करेगा, और परिणाम बहुत तेज होगा। इस मामले में एक मध्यवर्ती पेड़ का निर्माण शुद्ध उपरि है। अन्यथा शीर्ष क्रम का उत्तर अच्छा है।


1
मैं पूरे दिल से सहमत हूं: मध्यवर्ती डोम पेड़ का निर्माण स्मृति की बर्बादी है। उस उत्तर के लिए धन्यवाद।
फ्लोरियन एफ

9

स्काला का उपयोग करना:

import xml._
val xml = XML.loadString("<tag><nested>hello</nested></tag>")
val formatted = new PrettyPrinter(150, 2).format(xml)
println(formatted)

आप इसे जावा में भी कर सकते हैं, यदि आप scala-Library.jar पर निर्भर हैं। यह इस तरह दिख रहा है:

import scala.xml.*;

public class FormatXML {
    public static void main(String[] args) {
        String unformattedXml = "<tag><nested>hello</nested></tag>";
        PrettyPrinter pp = new PrettyPrinter(150, 3);
        String formatted = pp.format(XML.loadString(unformattedXml), TopScope$.MODULE$);
        System.out.println(formatted);
    }
}

PrettyPrinterवस्तु दो ints, पहले किया जा रहा है अधिकतम लाइन की लंबाई और दूसरा खरोज कदम होने के साथ निर्माण किया है।


9

milosmns से थोड़ा बेहतर संस्करण ...

public static String getPrettyXml(String xml) {
    if (xml == null || xml.trim().length() == 0) return "";

    int stack = 0;
    StringBuilder pretty = new StringBuilder();
    String[] rows = xml.trim().replaceAll(">", ">\n").replaceAll("<", "\n<").split("\n");

    for (int i = 0; i < rows.length; i++) {
        if (rows[i] == null || rows[i].trim().length() == 0) continue;

        String row = rows[i].trim();
        if (row.startsWith("<?")) {
            pretty.append(row + "\n");
        } else if (row.startsWith("</")) {
            String indent = repeatString(--stack);
            pretty.append(indent + row + "\n");
        } else if (row.startsWith("<") && row.endsWith("/>") == false) {
            String indent = repeatString(stack++);
            pretty.append(indent + row + "\n");
            if (row.endsWith("]]>")) stack--;
        } else {
            String indent = repeatString(stack);
            pretty.append(indent + row + "\n");
        }
    }

    return pretty.toString().trim();
}

private static String repeatString(int stack) {
     StringBuilder indent = new StringBuilder();
     for (int i = 0; i < stack; i++) {
        indent.append(" ");
     }
     return indent.toString();
} 

जहाँ पुनरावृत्ति है (स्टैक ++); तरीका..?
user1912935

2
निजी स्थिर स्ट्रिंग रिपीस्ट्रिंग (इंट स्टैक) {स्ट्रींगबर्ल इंडेंट = नया स्ट्रिंगबुल्ट (); for (int i = 0; मैं <stack; i ++) {indent.append (""); } indent.toString (); }
कोडक्रेप्स

इंडेंटेशन एंड टैग्स पर ठीक काम नहीं कर रहा है। आपको इसका } else if (row.startsWith("</")) {हिस्सा बदलने की आवश्यकता है :else if (row.startsWith("</")) { String indent = repeatIdent(--stack); if (pretty.charAt(pretty.length() - 1) == '\n') { pretty.append(indent + row + "\n"); } else { pretty.append(row + "\n"); } }
Csaba Tenkes

8

बस भविष्य के संदर्भ के लिए, यहां एक समाधान है जो मेरे लिए काम किया है (एक टिप्पणी के लिए धन्यवाद कि @ जॉर्ज हॉकिंस ने एक उत्तर में पोस्ट किया है):

DOMImplementationRegistry registry = DOMImplementationRegistry.newInstance();
DOMImplementationLS impl = (DOMImplementationLS) registry.getDOMImplementation("LS");
LSSerializer writer = impl.createLSSerializer();
writer.getDomConfig().setParameter("format-pretty-print", Boolean.TRUE);
LSOutput output = impl.createLSOutput();
ByteArrayOutputStream out = new ByteArrayOutputStream();
output.setByteStream(out);
writer.write(document, output);
String xmlStr = new String(out.toByteArray());

6

यदि आपको यकीन है कि आपके पास वैध XML है, तो यह सरल है, और XML DOM पेड़ों से बचा जाता है। हो सकता है कि कुछ कीड़े हों, कुछ भी देखें तो टिप्पणी करें

public String prettyPrint(String xml) {
            if (xml == null || xml.trim().length() == 0) return "";

            int stack = 0;
            StringBuilder pretty = new StringBuilder();
            String[] rows = xml.trim().replaceAll(">", ">\n").replaceAll("<", "\n<").split("\n");

            for (int i = 0; i < rows.length; i++) {
                    if (rows[i] == null || rows[i].trim().length() == 0) continue;

                    String row = rows[i].trim();
                    if (row.startsWith("<?")) {
                            // xml version tag
                            pretty.append(row + "\n");
                    } else if (row.startsWith("</")) {
                            // closing tag
                            String indent = repeatString("    ", --stack);
                            pretty.append(indent + row + "\n");
                    } else if (row.startsWith("<")) {
                            // starting tag
                            String indent = repeatString("    ", stack++);
                            pretty.append(indent + row + "\n");
                    } else {
                            // tag data
                            String indent = repeatString("    ", stack);
                            pretty.append(indent + row + "\n");
                    }
            }

            return pretty.toString().trim();
    }

2
रिपीटस्ट्रिंग विधि कहाँ है ..?
user1912935

3
निजी स्थिर स्ट्रिंग रिपीस्ट्रिंग (इंट स्टैक) {स्ट्रींगबर्ल इंडेंट = नया स्ट्रिंगबुल्ट (); for (int i = 0; मैं <stack; i ++) {indent.append (""); } indent.toString (); }
कोडस्क्रे्स

हां [user1912935], @codeskraps ने जो लिखा है, वह काफी सरल होना चाहिए :)
milosmns

एक पाश के अंदर एक स्ट्रिंगबर्ल के साथ संबंध: खराब अभ्यास।
james.garriss

@ james.garriss लेकिन नई लाइनों को विभाजित करना सुपर आसान है, यह बस किसी भी डोम पेड़ों के बिना एक सरल दृष्टिकोण दिखाता है।
milosmns

5

उपरोक्त सभी समाधान मेरे काम नहीं आए, तब मैंने यह पाया http://myshittycode.com/2014/02/10/java-properly-indenting-xml-string/

सुराग XPath के साथ व्हाट्सएप को हटा देता है

    String xml = "<root>" +
             "\n   " +
             "\n<name>Coco Puff</name>" +
             "\n        <total>10</total>    </root>";

try {
    Document document = DocumentBuilderFactory.newInstance()
            .newDocumentBuilder()
            .parse(new InputSource(new ByteArrayInputStream(xml.getBytes("utf-8"))));

    XPath xPath = XPathFactory.newInstance().newXPath();
    NodeList nodeList = (NodeList) xPath.evaluate("//text()[normalize-space()='']",
                                                  document,
                                                  XPathConstants.NODESET);

    for (int i = 0; i < nodeList.getLength(); ++i) {
        Node node = nodeList.item(i);
        node.getParentNode().removeChild(node);
    }

    Transformer transformer = TransformerFactory.newInstance().newTransformer();
    transformer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
    transformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "yes");
    transformer.setOutputProperty(OutputKeys.INDENT, "yes");
    transformer.setOutputProperty("{http://xml.apache.org/xslt}indent-amount", "4");

    StringWriter stringWriter = new StringWriter();
    StreamResult streamResult = new StreamResult(stringWriter);

    transformer.transform(new DOMSource(document), streamResult);

    System.out.println(stringWriter.toString());
}
catch (Exception e) {
    e.printStackTrace();
}

1
ध्यान दें कि '{ xml.apache.org/xslt } इंडेंट-अमाउंट' संपत्ति का उपयोग आपको एक विशिष्ट ट्रांसफार्मर कार्यान्वयन के लिए बाध्य करेगा।
vallismortis

1
सभी समाधानों से इस एक ने सबसे अच्छा काम किया। मेरे पास पहले से ही अपने XML में रिक्त स्थान और नई लाइनें थीं और मैं अपने प्रोजेक्ट में अधिक निर्भरता नहीं जोड़ना चाहता था। काश मुझे XML को पार्स नहीं करना पड़ता लेकिन ओह अच्छा।
फाबियो

5

पूरी तरह से काम करने के नीचे यह कोड

import javax.xml.transform.OutputKeys;
import javax.xml.transform.Source;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.stream.StreamResult;
import javax.xml.transform.stream.StreamSource;

String formattedXml1 = prettyFormat("<root><child>aaa</child><child/></root>");

public static String prettyFormat(String input) {
    return prettyFormat(input, "2");
}

public static String prettyFormat(String input, String indent) {
    Source xmlInput = new StreamSource(new StringReader(input));
    StringWriter stringWriter = new StringWriter();
    try {
        TransformerFactory transformerFactory = TransformerFactory.newInstance();
        Transformer transformer = transformerFactory.newTransformer();
        transformer.setOutputProperty(OutputKeys.INDENT, "yes");
        transformer.setOutputProperty("{http://xml.apache.org/xslt}indent-amount", indent);
        transformer.transform(xmlInput, new StreamResult(stringWriter));

        String pretty = stringWriter.toString();
        pretty = pretty.replace("\r\n", "\n");
        return pretty;              
    } catch (Exception e) {
        throw new RuntimeException(e);
    }
}

5

मैं उन सभी को मिलाता हूं और एक छोटा कार्यक्रम लिख रहा हूं। यह xml फ़ाइल से पढ़ रहा है और प्रिंट आउट ले रहा है। बस के बजाय xzy अपनी फ़ाइल पथ दे।

    public static void main(String[] args) throws Exception {
    DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
    dbf.setValidating(false);
    DocumentBuilder db = dbf.newDocumentBuilder();
    Document doc = db.parse(new FileInputStream(new File("C:/Users/xyz.xml")));
    prettyPrint(doc);

}

private static String prettyPrint(Document document)
        throws TransformerException {
    TransformerFactory transformerFactory = TransformerFactory
            .newInstance();
    Transformer transformer = transformerFactory.newTransformer();
    transformer.setOutputProperty(OutputKeys.INDENT, "yes");
    transformer.setOutputProperty("{http://xml.apache.org/xslt}indent-amount", "2");
    transformer.setOutputProperty(OutputKeys.ENCODING, "UTF-8");
    transformer.setOutputProperty(OutputKeys.OMIT_XML_DECLARATION, "no");
    DOMSource source = new DOMSource(document);
    StringWriter strWriter = new StringWriter();
    StreamResult result = new StreamResult(strWriter);transformer.transform(source, result);
    System.out.println(strWriter.getBuffer().toString());

    return strWriter.getBuffer().toString();

}

4

बस एक और उपाय जो हमारे लिए काम करता है

import java.io.StringWriter;
import org.dom4j.DocumentHelper;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.XMLWriter;

**
 * Pretty Print XML String
 * 
 * @param inputXmlString
 * @return
 */
public static String prettyPrintXml(String xml) {

    final StringWriter sw;

    try {
        final OutputFormat format = OutputFormat.createPrettyPrint();
        final org.dom4j.Document document = DocumentHelper.parseText(xml);
        sw = new StringWriter();
        final XMLWriter writer = new XMLWriter(sw, format);
        writer.write(document);
    }
    catch (Exception e) {
        throw new RuntimeException("Error pretty printing xml:\n" + xml, e);
    }
    return sw.toString();
}

3

Jdom2 का उपयोग करना: http://www.jdom.org/

import java.io.StringReader;
import org.jdom2.input.SAXBuilder;
import org.jdom2.output.Format;
import org.jdom2.output.XMLOutputter;

String prettyXml = new XMLOutputter(Format.getPrettyFormat()).
                         outputString(new SAXBuilder().build(new StringReader(uglyXml)));

3

अधिकतम , कोडस्क्रेप्स , डेविड इस्ले और मिल्समन्स के उत्तर के विकल्प के रूप में , मेरे हल्के, उच्च-प्रदर्शन वाले सुंदर-प्रिंटर पुस्तकालय पर एक नज़र है: xml- फ़ॉर्मेटर

// construct lightweight, threadsafe, instance
PrettyPrinter prettyPrinter = PrettyPrinterBuilder.newPrettyPrinter().build();

StringBuilder buffer = new StringBuilder();
String xml = ..; // also works with char[] or Reader

if(prettyPrinter.process(xml, buffer)) {
     // valid XML, print buffer
} else {
     // invalid XML, print xml
}

कभी-कभी, जब फ़ाइल से सीधे SOAP सेवाओं का मजाक उड़ाया जाता है, तो एक सुंदर-प्रिंटर होना अच्छा होता है, जो पहले से ही मुद्रित एक्सएमएल को भी संभालता है:

PrettyPrinter prettyPrinter = PrettyPrinterBuilder.newPrettyPrinter().ignoreWhitespace().build();

जैसा कि कुछ ने टिप्पणी की है, सुंदर-छपाई केवल XML को अधिक मानव-पठनीय रूप में प्रस्तुत करने का एक तरीका है - व्हॉट्सएप सख्ती से आपके XML डेटा में नहीं है।

लाइब्रेरी लॉग-इन प्रयोजनों के लिए सुंदर-मुद्रण के लिए अभिप्रेत है, और इसमें सीडीएटीए और टेक्स्ट नोड्स में एक्सएमएल को हटाने (उप-हटाने / गुमनामी) और एक्सएमएल के सुंदर-मुद्रण के कार्य भी शामिल हैं।



2

अंडरस्कोर-जावा में स्थिर विधि है U.formatXml(string)। मैं परियोजना का अनुरक्षक हूं। जीवंत उदाहरण

import com.github.underscore.lodash.U;

public class MyClass {
    public static void main(String args[]) {
        String xml = "<tag><nested>hello</nested></tag>";

        System.out.println(U.formatXml("<?xml version=\"1.0\" encoding=\"UTF-8\"?><root>" + xml + "</root>"));
    }
}

आउटपुट:

<?xml version="1.0" encoding="UTF-8"?>
<root>
   <tag>
      <nested>hello</nested>
   </tag>
</root>

यह कमाल का है!
सेन्योर

1

एक बहुत अच्छी कमांड लाइन xml उपयोगिता है जिसे xmlstarlet ( http://xmlstar.sourceforge.net/ ) कहा जाता है जो बहुत सारे काम कर सकती है जो बहुत सारे लोग उपयोग करते हैं।

आपका प्रोग्राम इस प्रोग्राम को Runtime.exec का उपयोग करके निष्पादित कर सकता है और फिर स्वरूपित आउटपुट फ़ाइल को पढ़ सकता है। इसके पास अधिक विकल्प हैं और जावा कोड की कुछ पंक्तियों की तुलना में बेहतर त्रुटि रिपोर्टिंग है।

डाउनलोड xmlstarlet: http://sourceforge.net/project/showfiles.php?group_id=66612&package_id=64589


1

मैंने पाया है कि जावा 1.6.0_32 में एक्सएमएल स्ट्रिंग को सुंदर तरीके से प्रिंट करने की सामान्य विधि (एक नल या पहचान xslt के साथ एक ट्रांसफार्मर का उपयोग करके) ऐसा व्यवहार नहीं करता है जैसे कि मैं चाहूंगा कि टैग केवल व्हाट्सएप द्वारा अलग किए गए हैं, क्योंकि कोई अलग नहीं होने के विपरीत। पाठ। मैंने <xsl:strip-space elements="*"/>बिना किसी लाभ के अपने टेम्पलेट का उपयोग करने की कोशिश की । सबसे आसान समाधान मुझे उस जगह को छीनना था जिस तरह से मैं एक SAXSource और XML फ़िल्टर का उपयोग करना चाहता था। चूँकि मेरा समाधान लॉगिंग के लिए था इसलिए मैंने इसे अधूरा एक्सएमएल अंशों के साथ काम करने के लिए बढ़ाया। ध्यान दें कि यदि आप DOMSource का उपयोग करते हैं तो सामान्य विधि ठीक काम करती है लेकिन अपूर्णता और मेमोरी ओवरहेड के कारण मैं इसका उपयोग नहीं करना चाहता था।

public static class WhitespaceIgnoreFilter extends XMLFilterImpl
{

    @Override
    public void ignorableWhitespace(char[] arg0,
                                    int arg1,
                                    int arg2) throws SAXException
    {
        //Ignore it then...
    }

    @Override
    public void characters( char[] ch,
                            int start,
                            int length) throws SAXException
    {
        if (!new String(ch, start, length).trim().equals("")) 
               super.characters(ch, start, length); 
    }
}

public static String prettyXML(String logMsg, boolean allowBadlyFormedFragments) throws SAXException, IOException, TransformerException
    {
        TransformerFactory transFactory = TransformerFactory.newInstance();
        transFactory.setAttribute("indent-number", new Integer(2));
        Transformer transformer = transFactory.newTransformer();
        transformer.setOutputProperty(OutputKeys.INDENT, "yes");
        transformer.setOutputProperty("{http://xml.apache.org/xslt}indent-amount", "4");
        StringWriter out = new StringWriter();
        XMLReader masterParser = SAXHelper.getSAXParser(true);
        XMLFilter parser = new WhitespaceIgnoreFilter();
        parser.setParent(masterParser);

        if(allowBadlyFormedFragments)
        {
            transformer.setErrorListener(new ErrorListener()
            {
                @Override
                public void warning(TransformerException exception) throws TransformerException
                {
                }

                @Override
                public void fatalError(TransformerException exception) throws TransformerException
                {
                }

                @Override
                public void error(TransformerException exception) throws TransformerException
                {
                }
            });
        }

        try
        {
            transformer.transform(new SAXSource(parser, new InputSource(new StringReader(logMsg))), new StreamResult(out));
        }
        catch (TransformerException e)
        {
            if(e.getCause() != null && e.getCause() instanceof SAXParseException)
            {
                if(!allowBadlyFormedFragments || !"XML document structures must start and end within the same entity.".equals(e.getCause().getMessage()))
                {
                    throw e;
                }
            }
            else
            {
                throw e;
            }
        }
        out.flush();
        return out.toString();
    }

1

जावा 1.6+ के लिए मैंने जो समाधान यहां पाया है वह कोड को रिफॉर्मेट नहीं करता है यदि यह पहले से ही स्वरूपित है। मेरे लिए काम करने वाला (और पहले से प्रारूपित कोड को फिर से स्वरूपित) निम्नलिखित था।

import org.apache.xml.security.c14n.CanonicalizationException;
import org.apache.xml.security.c14n.Canonicalizer;
import org.apache.xml.security.c14n.InvalidCanonicalizerException;
import org.w3c.dom.Element;
import org.w3c.dom.bootstrap.DOMImplementationRegistry;
import org.w3c.dom.ls.DOMImplementationLS;
import org.w3c.dom.ls.LSSerializer;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;

import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.TransformerException;
import java.io.IOException;
import java.io.StringReader;

public class XmlUtils {
    public static String toCanonicalXml(String xml) throws InvalidCanonicalizerException, ParserConfigurationException, SAXException, CanonicalizationException, IOException {
        Canonicalizer canon = Canonicalizer.getInstance(Canonicalizer.ALGO_ID_C14N_OMIT_COMMENTS);
        byte canonXmlBytes[] = canon.canonicalize(xml.getBytes());
        return new String(canonXmlBytes);
    }

    public static String prettyFormat(String input) throws TransformerException, ParserConfigurationException, IOException, SAXException, InstantiationException, IllegalAccessException, ClassNotFoundException {
        InputSource src = new InputSource(new StringReader(input));
        Element document = DocumentBuilderFactory.newInstance().newDocumentBuilder().parse(src).getDocumentElement();
        Boolean keepDeclaration = input.startsWith("<?xml");
        DOMImplementationRegistry registry = DOMImplementationRegistry.newInstance();
        DOMImplementationLS impl = (DOMImplementationLS) registry.getDOMImplementation("LS");
        LSSerializer writer = impl.createLSSerializer();
        writer.getDomConfig().setParameter("format-pretty-print", Boolean.TRUE);
        writer.getDomConfig().setParameter("xml-declaration", keepDeclaration);
        return writer.writeToString(document);
    }
}

यह पूर्ण-स्ट्रिंग xml तुलना के लिए अपनी इकाई परीक्षणों में उपयोग करने के लिए एक अच्छा उपकरण है।

private void assertXMLEqual(String expected, String actual) throws ParserConfigurationException, IOException, SAXException, CanonicalizationException, InvalidCanonicalizerException, TransformerException, IllegalAccessException, ClassNotFoundException, InstantiationException {
    String canonicalExpected = prettyFormat(toCanonicalXml(expected));
    String canonicalActual = prettyFormat(toCanonicalXml(actual));
    assertEquals(canonicalExpected, canonicalActual);
}

1

त्वरित और गंदे समाधान की खोज करने वालों के लिए - जिसे XML को 100% वैध होने की आवश्यकता नहीं है। उदाहरण के लिए REST / SOAP लॉगिंग के मामले में (आप कभी नहीं जानते कि दूसरे क्या भेजते हैं ;-)

मैंने पाया और एक कोड छीन लिया मैंने पाया ऑनलाइन जो मुझे लगता है कि अभी भी यहां एक वैध संभव दृष्टिकोण के रूप में गायब है:

public static String prettyPrintXMLAsString(String xmlString) {
    /* Remove new lines */
    final String LINE_BREAK = "\n";
    xmlString = xmlString.replaceAll(LINE_BREAK, "");
    StringBuffer prettyPrintXml = new StringBuffer();
    /* Group the xml tags */
    Pattern pattern = Pattern.compile("(<[^/][^>]+>)?([^<]*)(</[^>]+>)?(<[^/][^>]+/>)?");
    Matcher matcher = pattern.matcher(xmlString);
    int tabCount = 0;
    while (matcher.find()) {
        String str1 = (null == matcher.group(1) || "null".equals(matcher.group())) ? "" : matcher.group(1);
        String str2 = (null == matcher.group(2) || "null".equals(matcher.group())) ? "" : matcher.group(2);
        String str3 = (null == matcher.group(3) || "null".equals(matcher.group())) ? "" : matcher.group(3);
        String str4 = (null == matcher.group(4) || "null".equals(matcher.group())) ? "" : matcher.group(4);

        if (matcher.group() != null && !matcher.group().trim().equals("")) {
            printTabs(tabCount, prettyPrintXml);
            if (!str1.equals("") && str3.equals("")) {
                ++tabCount;
            }
            if (str1.equals("") && !str3.equals("")) {
                --tabCount;
                prettyPrintXml.deleteCharAt(prettyPrintXml.length() - 1);
            }

            prettyPrintXml.append(str1);
            prettyPrintXml.append(str2);
            prettyPrintXml.append(str3);
            if (!str4.equals("")) {
                prettyPrintXml.append(LINE_BREAK);
                printTabs(tabCount, prettyPrintXml);
                prettyPrintXml.append(str4);
            }
            prettyPrintXml.append(LINE_BREAK);
        }
    }
    return prettyPrintXml.toString();
}

private static void printTabs(int count, StringBuffer stringBuffer) {
    for (int i = 0; i < count; i++) {
        stringBuffer.append("\t");
    }
}

public static void main(String[] args) {
    String x = new String(
            "<soap:Envelope xmlns:soap=\"http://schemas.xmlsoap.org/soap/envelope/\"><soap:Body><soap:Fault><faultcode>soap:Client</faultcode><faultstring>INVALID_MESSAGE</faultstring><detail><ns3:XcbSoapFault xmlns=\"\" xmlns:ns3=\"http://www.someapp.eu/xcb/types/xcb/v1\"><CauseCode>20007</CauseCode><CauseText>INVALID_MESSAGE</CauseText><DebugInfo>Problems creating SAAJ object model</DebugInfo></ns3:XcbSoapFault></detail></soap:Fault></soap:Body></soap:Envelope>");
    System.out.println(prettyPrintXMLAsString(x));
}

यहाँ उत्पादन है:

<soap:Envelope xmlns:soap="http://schemas.xmlsoap.org/soap/envelope/">
  <soap:Body>
    <soap:Fault>
        <faultcode>soap:Client</faultcode>
        <faultstring>INVALID_MESSAGE</faultstring>
        <detail>
            <ns3:XcbSoapFault xmlns="" xmlns:ns3="http://www.someapp.eu/xcb/types/xcb/v1">
                <CauseCode>20007</CauseCode>
                <CauseText>INVALID_MESSAGE</CauseText>
                <DebugInfo>Problems creating SAAJ object model</DebugInfo>
            </ns3:XcbSoapFault>
        </detail>
    </soap:Fault>
  </soap:Body>
</soap:Envelope>

1

मैंने एक उत्तर का उपयोग करते हुए देखा Scala, इसलिए यहां एक और एक है Groovy, बस अगर कोई इसे दिलचस्प पाता है। डिफ़ॉल्ट इंडेंटेशन 2 चरण है, XmlNodePrinterकंस्ट्रक्टर को एक और मान दिया जा सकता है।

def xml = "<tag><nested>hello</nested></tag>"
def stringWriter = new StringWriter()
def node = new XmlParser().parseText(xml);
new XmlNodePrinter(new PrintWriter(stringWriter)).print(node)
println stringWriter.toString()

जावा से उपयोग अगर groovy जार वर्गपथ में है

  String xml = "<tag><nested>hello</nested></tag>";
  StringWriter stringWriter = new StringWriter();
  Node node = new XmlParser().parseText(xml);
  new XmlNodePrinter(new PrintWriter(stringWriter)).print(node);
  System.out.println(stringWriter.toString());

1

मामले में आप इंडेंटेशन की जरूरत नहीं है, लेकिन बहुत कुछ लाइन टूट जाता है, यह बस regex के लिए पर्याप्त हो सकता है ...

String leastPrettifiedXml = uglyXml.replaceAll("><", ">\n<");

कोड अच्छा है, लापता इंडेंटेशन के कारण परिणाम नहीं।


(इंडेंटेशन के साथ समाधान के लिए, अन्य उत्तर देखें)


1
हम्म्म्म ... ज़रा ज़ोर से सोचिए, ऐसे समाधान की ज़रूरत किसे होगी? केवल वह क्षेत्र जो मैं देख सकता हूं, वह है जो हम कुछ वेब सेवाओं से प्राप्त करते हैं और केवल उस डेटा और उसकी वैधता का परीक्षण करने के लिए, डेवलपर या परीक्षक को इन आसान लोगों की आवश्यकता हो सकती है। नहीं तो एक अच्छा विकल्प नहीं ....
सुधाकर चावली

1
@ सुधाकरचवली मैं एक डेवलपर हूं। मुझे गंदे प्रिन्ट () और log.debug () हैक्स की आवश्यकता हो सकती है; यानी कुछ बार मैं केवल प्रोग्राम के बिना एक प्रतिबंधित सर्वर वातावरण (शेल एक्सेस के बजाय वेब व्यवस्थापक इंटरफ़ेस के साथ) से लॉग फ़ाइलों का उपयोग कर सकता हूं।
कोमोनॉड
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.