XML के रूप में HTML कोड कैसे पढ़ें और sql में नमूने की तरह आउटपुट प्राप्त करें?


11

मेरे पास HTML कोड डेटा बेस में संग्रहीत है, और मैं इसे XML के रूप में पढ़ना चाहता हूं।

मेरे कोड:

http://rextester.com/RMEHO89992

मेरे पास HTML कोड का एक उदाहरण है:

<div>
  <section>
       <h4>
         <span> A </span>
        </h4>
        <ul>
           <li>
              <span> Ab</span>
                     AD
              <span> AC </span>
           </li>
           <li>
              <span> Ag</span>
              <span> AL </span>
           </li>
        </ul>
        <h4>
              <span> B </span>
       </h4>
       <ul>
           <li>
              <span> Bb</span>
                     BD
              <span> BC </span>
           </li>
           <li>
              <span> Bg</span>
              <span> BL </span>
           </li>
        </ul>
   </section>
</div>

और यह मेरे लिए आवश्यक आउटपुट का एक उदाहरण है:

Category         Selection        Value                    
---------        ---------        ------------             
A                Ab               AD                  
A                Ag               AL                       
B                Bb               BD                   
B                Bg               BL                       

मुझे <h4>टैग के अंदर एक मान Category, <span>चयन के रूप में पहला टैग और एक संक्षिप्त स्ट्रिंग के रूप में शेष मान प्राप्त करने की आवश्यकता है ।

मैंने निम्नलिखित प्रश्न आज़माया है:

SELECT 
    (  isnull(t.v.value('(h4/span/span[1]/text())[1]','nvarchar(max)'),'') 
     + isnull(t.v.value('(h4/span/text())[1]','nvarchar(max)'),'')
     + isnull(t.v.value('(h4/span/span[2]/text())[2]','nvarchar(max)'),'')
    ) AS [Category],
    (  isnull(c.g.value('(span[1]/text())[1]','nvarchar(max)'),'')
     + isnull(c.g.value('(span[1]/span/text())[1]','nvarchar(max)'),'')
     + isnull(c.g.value('(span[1]/text())[2]','nvarchar(max)'),'')
    ) AS [Selection],
    (  isnull(c.g.value('(span[2]/text())[1]','nvarchar(max)'),'')
     + isnull(c.g.value('(span[2]/span/text())[1]','nvarchar(max)'),'')
     + isnull(c.g.value('(span[2]/text())[2]','nvarchar(max)'),'')
    ) AS [Value]
FROM @htmlXML.nodes('div/section') as t(v)
CROSS APPLY t.v.nodes('./ul/li') AS c(g) 

और :

SELECT 
       t.v.value('.','nvarchar(max)')
       ,
     --( isnull(t.v.value('(h4/span/span[1]/text())[1]','nvarchar(max)'),'')+isnull(t.v.value('(h4/span/text())[1]','nvarchar(max)'),'')+isnull(t.v.value('(h4/span/span[2]/text())[2]','nvarchar(max)'),''))AS [Category],

          ( isnull(c.g.value('(span[1]/text())[1]','nvarchar(max)'),'')+isnull(c.g.value('(span[1]/span/text())[1]','nvarchar(max)'),'')+isnull(c.g.value('(span[1]/text())[2]','nvarchar(max)'),''))AS [Selection]

           ,
         ( isnull(c.g.value('(span[2]/text())[1]','nvarchar(max)'),'')+isnull(c.g.value('(span[2]/span/text())[1]','nvarchar(max)'),'')+isnull(c.g.value('(span[2]/text())[2]','nvarchar(max)'),''))AS [Value]
    FROM    @htmlXML.nodes('div/section/h4/span') as t(v)
    CROSS APPLY @htmlXML.nodes('div/section/ul/li') AS c(g)

लेकिन यह केवल पहली श्रेणी प्राप्त करता है, और सभी मूल्यों को प्राप्त नहीं करता है।

Category         Selection        Value
---------        ---------        ------------
A                Ab               AC 
B                Ab               AC 
A                Ag               AL
B                Ag               AL 
A                Bb               BC
B                Bb               BC 
A                Bg               BL 
B                Bg               BL 

N श्रेणियां हो सकती हैं, और मान <span>टैग के अंदर हो भी सकते हैं और नहीं भी । मैं सभी श्रेणियों को उनके संबंधित मूल्य के साथ कैसे प्राप्त कर सकता हूं? या प्राप्त करें:

category              h4 number
--------            -----------
 A                     1
 B                     2
  • 1, माध्य = h4 प्रथम, 2, माध्य = h4 दूसरा
 ul number         Selection        Value                    
    ---------        ---------        ------------             
    1                Ab               AD                  
    1                Ag               AL                       
    2                Bb               BD                   
    2                Bg               BL       

स्तंभ संख्या और h4 संख्या के बीच संबंध। मै नहीं कर सकता।


1
क्या आप सुनिश्चित हैं कि अपेक्षित परिणाम सही है? क्या यह AD ACतीसरे कॉलम में पहली पंक्ति के लिए नहीं होना चाहिए ?
मिकेल एरिकसन

मैं नोड्स `h4` और` ul` के बीच संचार स्थापित करने की कोशिश कर रहा हूँ।
RedArmy

जवाबों:


7

यह बिल्कुल सुरुचिपूर्ण नहीं है, लेकिन काम करने के लिए लगता है।

DECLARE @X XML = REPLACE(REPLACE(@S, '<h4>', '<foo><h4>'), '</ul>', '</ul></foo>')

SELECT Category = x.value('../../h4[1]/span[1]', 'varchar(10)'),
       Selection = x.value('descendant-or-self::text()[1]', 'varchar(10)'),
       Value = REPLACE(
                REPLACE(
                 REPLACE(
                  LTRIM(
                   RTRIM(
                    REPLACE(
                     REPLACE(
                      CAST(x.x.query('fn:data(descendant-or-self::text()[fn:position() > 1])') AS VARCHAR(MAX))
                     , char(10), '')
                    , char(13), '')
                   )
                  )
                 , '  ', ' |')
                , '| ', '')
               , '|', '')
FROM   @X.nodes('div/section/foo/ul/li') x(x)
ORDER  BY Category,
          Selection

जो लौटता है

+----------+-----------+-------+
| Category | Selection | Value |
+----------+-----------+-------+
|  A       |  Ab       | AD AC |
|  A       |  Ag       | AL    |
|  B       |  Bb       | BD BC |
|  B       |  Bg       | BL    |
+----------+-----------+-------+

मैं यह मान रहा हूँ कि आप प्रश्न में वांछित परिणाम तालिका के रूप में क्या चाहते हैं, "संक्षिप्त मान के रूप में शेष मान" वापस नहीं करता है


14

मैं नोड्स h4और के बीच संचार स्थापित करने की कोशिश कर रहा हूं ul

दस्तावेज़ क्रम में एक नोड के पहले या बाद में नोड है या नहीं यह जांचने के लिए आप <<और >>ऑपरेटर का उपयोग कर सकते हैं । स्थिति पर एक विधेय के साथ मिलाएं, [1]पहली घटना को प्राप्त करने के लिए भी दस्तावेज़ क्रम में।

select H4.X.value('(span/text())[1]', 'varchar(10)') as Section,
       UL.X.query('.') as UL
from @X.nodes('/div/section/h4') as H4(X)
  cross apply H4.X.nodes('(let $h4 := . (: Save current h4 node :)
                           return /div/section/ul[$h4 << .])[1]') as UL(X);

rextester:

<<और नोड आदेश तुलना ऑपरेटर>> कहलाते हैं

यदि आपके पास इस तरह एक XML टुकड़ा है:

<N1>1</N1>
<N2>2</N2>
<N3>3</N3>
<N4>4</N4>
<N5>5</N5>

N3इस क्वेरी की पहली घटना से पहले आप सभी नोड प्राप्त कर सकते हैं :

select @X.query('/*[. << /N3[1]]');

परिणाम:

<N1>1</N1>
<N2>2</N2>

/*आप सभी रूट नोड दे देंगे। जो कुछ संलग्न है []वह एक विधेय है। .वर्तमान नोड है और /N3[1]रूट स्तर पर दस्तावेज़ क्रम में पहला N3 नोड है। इसलिए प्रत्येक रूट नोड से आपको नोड्स मिलते हैं जो पूर्ववर्ती हैं N3

यहाँ लगभग समान क्वेरी है, केवल आपको नोड्स मिलते हैं जो पहले नोड का अनुसरण करते हैं N3:

select @X.query('/*[. >> /N3[1]]');
<N4>4</N4>
<N5>5</N5>

केवल पहले नोड के बाद पहला नोड प्राप्त करने के लिए N3, आप विधेय जोड़ें [1]:

select @X.query('/*[. >> /N3[1]][1]');
<N4>4</N4>
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.