स्प्लिट फ़ंक्शन टी-एसक्यूएल में बराबर है?


128

मैं '1,2,3,4,5,6,7,8,9,10,11,12,13,14,15 ...' (कॉमा सीमांकित) को एक तालिका या तालिका चर में विभाजित करना चाहता हूं ।

क्या किसी के पास एक फ़ंक्शन है जो प्रत्येक को एक पंक्ति में लौटाता है?


http://www.sqlteam.com/forums/topic.asp?TOPIC_ID=50648 विभिन्न विधियों का चयन
एडोल्फ लहसुन

1
Erland Sommarskog ने पिछले 12 वर्षों से इस प्रश्न के आधिकारिक उत्तर को बनाए रखा है: http://www.sommarskog.se/arrays-in-sql.html यह StackOverflow पर यहाँ सभी विकल्पों को पुन: प्रस्तुत करने के लायक नहीं है, बस उसके पृष्ठ पर जाएँ और आप वह सब सीखेंगे जो आप कभी जानना चाहते थे।
पोर्टमैन

2
मैंने हाल ही में इस समस्या के सबसे आम तरीकों की तुलना करते हुए एक मामूली अध्ययन किया, जो कि पढ़ने लायक हो सकता है: sqlperformance.com/2012/07/t-sql-queries/split-strings और sqlperformance.com/2012/08-t- एसक्यूएल-क्वेश्चन /…
आरोन बर्ट्रेंड


लगता है कि आपको यहाँ कुछ अच्छे उत्तर मिले हैं; क्यों नहीं उनमें से एक को उत्तर के रूप में चिह्नित करें या अपनी समस्या का अधिक विस्तार से वर्णन करें यदि यह अभी भी उत्तर नहीं है।
रायनफेस्कॉटलैंड 16

जवाबों:


51

यहाँ कुछ पुराने ढंग का हल है:

/*
    Splits string into parts delimitered with specified character.
*/
CREATE FUNCTION [dbo].[SDF_SplitString]
(
    @sString nvarchar(2048),
    @cDelimiter nchar(1)
)
RETURNS @tParts TABLE ( part nvarchar(2048) )
AS
BEGIN
    if @sString is null return
    declare @iStart int,
            @iPos int
    if substring( @sString, 1, 1 ) = @cDelimiter 
    begin
        set @iStart = 2
        insert into @tParts
        values( null )
    end
    else 
        set @iStart = 1
    while 1=1
    begin
        set @iPos = charindex( @cDelimiter, @sString, @iStart )
        if @iPos = 0
            set @iPos = len( @sString )+1
        if @iPos - @iStart > 0          
            insert into @tParts
            values  ( substring( @sString, @iStart, @iPos-@iStart ))
        else
            insert into @tParts
            values( null )
        set @iStart = @iPos+1
        if @iStart > len( @sString ) 
            break
    end
    RETURN

END

SQL Server 2008 में आप .NET कोड के साथ समान प्राप्त कर सकते हैं। शायद यह तेजी से काम करेगा, लेकिन निश्चित रूप से इस दृष्टिकोण को प्रबंधित करना आसान है।


धन्यवाद, मैं भी जानना चाहूंगा। क्या यहाँ कोई त्रुटि है? मैंने यह कोड शायद 6 साल पहले लिखा था और यह कब से ठीक है।
XOR

मैं सहमत हूँ। यह एक बहुत अच्छा उपाय है जब आप नहीं चाहते (या बस नहीं कर सकते) तालिका प्रकार पैरामीटर बनाने के साथ शामिल हो सकते हैं, जो मेरे उदाहरण में होगा। डीबीए ने उस सुविधा को बंद कर दिया है और इसकी अनुमति नहीं देगा। धन्यवाद XOR!
dscarr

DECLARE वरस्ट्रिंग NVARCHAR (2048) = 'माइक / जॉन / मिको / मैट'; DECLARE CaracString NVARCHAR (1) = '/'; Dbo.FnSplitString (VarString, CaracString) से चयन *
फर्नांडो yevenes

55

इसे इस्तेमाल करे

DECLARE @xml xml, @str varchar(100), @delimiter varchar(10)
SET @str = '1,2,3,4,5,6,7,8,9,10,11,12,13,14,15'
SET @delimiter = ','
SET @xml = cast(('<X>'+replace(@str, @delimiter, '</X><X>')+'</X>') as xml)
SELECT C.value('.', 'varchar(10)') as value FROM @xml.nodes('X') as X(C)

या

DECLARE @str varchar(100), @delimiter varchar(10)
SET @str = '1,2,3,4,5,6,7,8,9,10,11,12,13,14,15'
SET @delimiter = ','
;WITH cte AS
(
    SELECT 0 a, 1 b
    UNION ALL
    SELECT b, CHARINDEX(@delimiter, @str, b) + LEN(@delimiter)
    FROM CTE
    WHERE b > a
)
SELECT SUBSTRING(@str, a,
CASE WHEN b > LEN(@delimiter) 
    THEN b - a - LEN(@delimiter) 
    ELSE LEN(@str) - a + 1 END) value      
FROM cte WHERE a > 0

समान करने के कई और तरीके यहां दिए गए हैं कि कॉमा सीमांकित स्ट्रिंग को कैसे विभाजित किया जाए?


9
सामान्य स्ट्रिंग स्प्लिटर की खोज करने वाले किसी भी व्यक्ति के लिए ध्यान दें: यहां दिया गया पहला समाधान सामान्य स्ट्रिंग स्प्लिटर नहीं है - यह केवल तभी सुरक्षित है जब आप सुनिश्चित हों कि इनपुट कभी भी शामिल नहीं होगा <, >या &(जैसे इनपुट एक पूर्णांक का अनुक्रम है)। उपरोक्त तीन वर्णों में से कोई भी आपको अपेक्षित परिणाम के बजाय पार्स त्रुटि देगा।
miroxlav

1
Miroxlav द्वारा उल्लिखित मुद्दों के साथ घटना (जो कुछ विचार के साथ हल होनी चाहिए), यह निश्चित रूप से सबसे रचनात्मक समाधानों में से एक है जो मैंने पाया है (पहला)! बहुत अच्छा!
प्रमुख-मनन

लाइन SELECT b, CHARINDEX(@delimiter, @str, b) + LEN(@delimiter)वास्तव में होनी चाहिए SELECT b, CHARINDEX(@delimiter, @str, b+1) + LEN(@delimiter)बी + 1 एक बड़ा अंतर बना देता है। परिसीमन के रूप में अंतरिक्ष के साथ यहां परीक्षण किया गया, इस फिक्स के बिना काम नहीं किया।
ज्वाजसेफी

@miroxlav इसके अलावा, मेरे अनुभव में, एक स्ट्रिंग को विभाजित करने के लिए एक्सएमएल का उपयोग करना एक बहुत महंगा चक्कर है।
अंडरस्कोर_ड

महान समाधान! यह देखते हुए कि उपयोगकर्ता 100 से अधिक भागों को विभाजित करने का MAXRECURSIONविकल्प जोड़ सकते हैं , रिक्त स्थान को संभालने के लिए stackoverflow.com/q/2025585LEN से कुछ बदल सकते हैं, और इनपुट के लिए पंक्तियों को बाहर कर सकते हैं। NULLNULL
केविनोइड

27

आपने इस SQL ​​Server 2008 को टैग किया है, लेकिन भविष्य के आगंतुक इस सवाल (SQL Server 2016+ का उपयोग करके) के बारे में जानना चाहेंगे STRING_SPLIT

इस नए बिलिन फ़ंक्शन के साथ अब आप बस उपयोग कर सकते हैं

SELECT TRY_CAST(value AS INT)
FROM   STRING_SPLIT ('1,2,3,4,5,6,7,8,9,10,11,12,13,14,15', ',') 

इस समारोह के कुछ प्रतिबंध और प्रदर्शन परीक्षण के कुछ आशाजनक परिणाम आरोन बर्ट्रेंड के इस ब्लॉग पोस्ट में हैं


13

यह उन लोगों के लिए .NET जैसा है, जो उस फ़ंक्शन से परिचित हैं:

CREATE FUNCTION dbo.[String.Split]
(
    @Text VARCHAR(MAX),
    @Delimiter VARCHAR(100),
    @Index INT
)
RETURNS VARCHAR(MAX)
AS BEGIN
    DECLARE @A TABLE (ID INT IDENTITY, V VARCHAR(MAX));
    DECLARE @R VARCHAR(MAX);
    WITH CTE AS
    (
    SELECT 0 A, 1 B
    UNION ALL
    SELECT B, CONVERT(INT,CHARINDEX(@Delimiter, @Text, B) + LEN(@Delimiter))
    FROM CTE
    WHERE B > A
    )
    INSERT @A(V)
    SELECT SUBSTRING(@Text,A,CASE WHEN B > LEN(@Delimiter) THEN B-A-LEN(@Delimiter) ELSE LEN(@Text) - A + 1 END) VALUE      
    FROM CTE WHERE A >0

    SELECT      @R
    =           V
    FROM        @A
    WHERE       ID = @Index + 1
    RETURN      @R
END

SELECT dbo.[String.Split]('121,2,3,0',',',1) -- gives '2'

9

यहाँ फूट फंक्शन है जो आपने पूछा है

CREATE FUNCTION [dbo].[split](
          @delimited NVARCHAR(MAX),
          @delimiter NVARCHAR(100)
        ) RETURNS @t TABLE (id INT IDENTITY(1,1), val NVARCHAR(MAX))
        AS
        BEGIN
          DECLARE @xml XML
          SET @xml = N'<t>' + REPLACE(@delimited,@delimiter,'</t><t>') + '</t>'

          INSERT INTO @t(val)
          SELECT  r.value('.','varchar(MAX)') as item
          FROM  @xml.nodes('/t') as records(r)
          RETURN
        END

फ़ंक्शन को इस तरह निष्पादित करें

select * from dbo.split('1,2,3,4,5,6,7,8,9,10,11,12,13,14,15',',')

5
DECLARE
    @InputString NVARCHAR(MAX) = 'token1,token2,token3,token4,token5'
    , @delimiter varchar(10) = ','

DECLARE @xml AS XML = CAST(('<X>'+REPLACE(@InputString,@delimiter ,'</X><X>')+'</X>') AS XML)
SELECT C.value('.', 'varchar(10)') AS value
FROM @xml.nodes('X') as X(C)

इस प्रतिक्रिया का स्रोत: http://sqlhint.com/sqlserver/how-to/best-split-function-tsql-delimited


जब भी यह सैद्धांतिक रूप से प्रश्न का उत्तर दे सकता है, तो उत्तर के आवश्यक भागों को शामिल करना और संदर्भ के लिए लिंक प्रदान करना बेहतर होगा
ज़ावि लोपेज़

1
@Xavi: ठीक है, मैंने उत्तर के आवश्यक भागों को शामिल किया है। आपके संकेत के लिए धन्यवाद।
महाई बेज़ेनारियो

3

मैं अपने पसंदीदा समाधान में निचोड़ने के लिए परीक्षा में हूं। परिणामी तालिका में 2 कॉलम शामिल होंगे: पाया पूर्णांक की स्थिति के लिए PosIdx; और पूर्णांक में मान।


create function FnSplitToTableInt
(
    @param nvarchar(4000)
)
returns table as
return
    with Numbers(Number) as 
    (
        select 1 
        union all 
        select Number + 1 from Numbers where Number < 4000
    ),
    Found as
    (
        select 
            Number as PosIdx,
            convert(int, ltrim(rtrim(convert(nvarchar(4000), 
                substring(@param, Number, 
                charindex(N',' collate Latin1_General_BIN, 
                @param + N',', Number) - Number))))) as Value
        from   
            Numbers 
        where  
            Number <= len(@param)
        and substring(N',' + @param, Number, 1) = N',' collate Latin1_General_BIN
    )
    select 
        PosIdx, 
        case when isnumeric(Value) = 1 
            then convert(int, Value) 
            else convert(int, null) end as Value 
    from 
        Found

यह डिफ़ॉल्ट रूप से 1 से 100 तक स्थिति की सूची के रूप में पुनरावर्ती CTE का उपयोग करके काम करता है। यदि आपको 100 से अधिक लंबे समय तक स्ट्रिंग के साथ काम करने की आवश्यकता है, तो निम्न की तरह 'विकल्प (अधिकतम 4000)' का उपयोग करके इस फ़ंक्शन को कॉल करें:


select * from FnSplitToTableInt
(
    '9, 8, 7, 6, 5, 4, 3, 2, 1, 0, ' + 
    '9, 8, 7, 6, 5, 4, 3, 2, 1, 0, ' +
    '9, 8, 7, 6, 5, 4, 3, 2, 1, 0, ' +
    '9, 8, 7, 6, 5, 4, 3, 2, 1, 0, ' +
    '9, 8, 7, 6, 5, 4, 3, 2, 1, 0'
) 
option (maxrecursion 4000)

2
अधिकतम वेतन विकल्प का उल्लेख करने के लिए +1। स्पष्ट रूप से भारी पुनरावृत्ति का उपयोग उत्पादन परिवेश में देखभाल के साथ किया जाना चाहिए, लेकिन भारी डेटा आयात या रूपांतरण कार्य करने के लिए सीटीई का उपयोग करना बहुत अच्छा है।
टिम मेडोरा

3
CREATE FUNCTION Split
(
  @delimited nvarchar(max),
  @delimiter nvarchar(100)
) RETURNS @t TABLE
(
-- Id column can be commented out, not required for sql splitting string
  id int identity(1,1), -- I use this column for numbering splitted parts
  val nvarchar(max)
)
AS
BEGIN
  declare @xml xml
  set @xml = N'<root><r>' + replace(@delimited,@delimiter,'</r><r>') + '</r></root>'

  insert into @t(val)
  select
    r.value('.','varchar(max)') as item
  from @xml.nodes('//root/r') as records(r)

  RETURN
END
GO

प्रयोग

Select * from dbo.Split(N'1,2,3,4,6',',')

3

यह सरल सीटीई देगा जो आवश्यक है:

DECLARE @csv varchar(max) = '1,2,3,4,5,6,7,8,9,10,11,12,13,14,15';
--append comma to the list for CTE to work correctly
SET @csv = @csv + ',';
--remove double commas (empty entries)
SET @csv = replace(@csv, ',,', ',');
WITH CteCsv AS (
    SELECT CHARINDEX(',', @csv) idx, SUBSTRING(@csv, 1, CHARINDEX(',', @csv) - 1) [Value]
    UNION ALL
    SELECT CHARINDEX(',', @csv, idx + 1), SUBSTRING(@csv, idx + 1, CHARINDEX(',', @csv, idx + 1) - idx - 1) FROM CteCsv
    WHERE CHARINDEX(',', @csv, idx + 1) > 0
)

SELECT [Value] FROM CteCsv

@jinsungy आप इस उत्तर को देखना चाहते हैं, यह स्वीकृत उत्तर की तुलना में अधिक कुशल है और सरल है।
माइकेल टुरकिन

2

यह एक और संस्करण है जिसमें वास्तव में कोई प्रतिबंध नहीं है (उदाहरण के लिए: xml दृष्टिकोण का उपयोग करते समय विशेष वर्ण, CTE दृष्टिकोण में रिकॉर्ड की संख्या) और यह 10M + रिकॉर्ड पर आधारित एक परीक्षण के आधार पर बहुत तेजी से चलता है स्रोत 4000 की औसत स्ट्रिंग लंबाई के साथ। मदद कर सका।

Create function [dbo].[udf_split] (
    @ListString nvarchar(max),
    @Delimiter  nvarchar(1000),
    @IncludeEmpty bit) 
Returns @ListTable TABLE (ID int, ListValue nvarchar(1000))
AS
BEGIN
    Declare @CurrentPosition int, @NextPosition int, @Item nvarchar(max), @ID int, @L int
    Select @ID = 1,
   @L = len(replace(@Delimiter,' ','^')),
            @ListString = @ListString + @Delimiter,
            @CurrentPosition = 1 
    Select @NextPosition = Charindex(@Delimiter, @ListString, @CurrentPosition)
   While @NextPosition > 0 Begin
   Set  @Item = LTRIM(RTRIM(SUBSTRING(@ListString, @CurrentPosition, @NextPosition-@CurrentPosition)))
   If      @IncludeEmpty=1 or LEN(@Item)>0 Begin 
     Insert Into @ListTable (ID, ListValue) Values (@ID, @Item)
     Set @ID = @ID+1
   End
   Set  @CurrentPosition = @NextPosition+@L
   Set  @NextPosition = Charindex(@Delimiter, @ListString, @CurrentPosition)
  End
    RETURN
END

1

यहां टैली टेबल का उपयोग करने से जेफ मोदेन द्वारा एक स्प्लिट स्ट्रिंग फंक्शन (सबसे अच्छा संभव तरीका) होता है

CREATE FUNCTION [dbo].[DelimitedSplit8K]
        (@pString VARCHAR(8000), @pDelimiter CHAR(1))
RETURNS TABLE WITH SCHEMABINDING AS
 RETURN
--===== "Inline" CTE Driven "Tally Table" produces values from 0 up to 10,000...
     -- enough to cover NVARCHAR(4000)
  WITH E1(N) AS (
                 SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL 
                 SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL 
                 SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1 UNION ALL SELECT 1
                ),                          --10E+1 or 10 rows
       E2(N) AS (SELECT 1 FROM E1 a, E1 b), --10E+2 or 100 rows
       E4(N) AS (SELECT 1 FROM E2 a, E2 b), --10E+4 or 10,000 rows max
 cteTally(N) AS (--==== This provides the "base" CTE and limits the number of rows right up front
                     -- for both a performance gain and prevention of accidental "overruns"
                 SELECT TOP (ISNULL(DATALENGTH(@pString),0)) ROW_NUMBER() OVER (ORDER BY (SELECT NULL)) FROM E4
                ),
cteStart(N1) AS (--==== This returns N+1 (starting position of each "element" just once for each delimiter)
                 SELECT 1 UNION ALL
                 SELECT t.N+1 FROM cteTally t WHERE SUBSTRING(@pString,t.N,1) = @pDelimiter
                ),
cteLen(N1,L1) AS(--==== Return start and length (for use in substring)
                 SELECT s.N1,
                        ISNULL(NULLIF(CHARINDEX(@pDelimiter,@pString,s.N1),0)-s.N1,8000)
                   FROM cteStart s
                )
--===== Do the actual split. The ISNULL/NULLIF combo handles the length for the final element when no delimiter is found.
 SELECT ItemNumber = ROW_NUMBER() OVER(ORDER BY l.N1),
        Item       = SUBSTRING(@pString, l.N1, l.L1)
   FROM cteLen l
;

टैली ओह से संदर्भित ! एक बेहतर SQL 8K "CSV फाड़नेवाला" समारोह


0

यह ब्लॉग टी-एसक्यूएल में एक्सएमएल का उपयोग करके एक बहुत अच्छा समाधान के साथ आया था।

यह वह फ़ंक्शन है जो मैं उस ब्लॉग (परिवर्तन फ़ंक्शन का नाम और परिणाम प्रकार की आवश्यकता के अनुसार) के आधार पर लाया था:

SET ANSI_NULLS ON
GO
SET QUOTED_IDENTIFIER ON
GO
CREATE FUNCTION [dbo].[SplitIntoBigints]
(@List varchar(MAX), @Splitter char)
RETURNS TABLE 
AS
RETURN 
(
    WITH SplittedXML AS(
        SELECT CAST('<v>' + REPLACE(@List, @Splitter, '</v><v>') + '</v>' AS XML) AS Splitted
    )
    SELECT x.v.value('.', 'bigint') AS Value
    FROM SplittedXML
    CROSS APPLY Splitted.nodes('//v') x(v)
)
GO

0
CREATE Function [dbo].[CsvToInt] ( @Array varchar(4000)) 
returns @IntTable table 
(IntValue int)
AS
begin
declare @separator char(1)
set @separator = ','
declare @separator_position int 
declare @array_value varchar(4000) 

set @array = @array + ','

while patindex('%,%' , @array) <> 0 
begin

select @separator_position = patindex('%,%' , @array)
select @array_value = left(@array, @separator_position - 1)

Insert @IntTable
Values (Cast(@array_value as int))
select @array = stuff(@array, 1, @separator_position, '')
end

0
/* *Object:  UserDefinedFunction [dbo].[Split]    Script Date: 10/04/2013 18:18:38* */
SET ANSI_NULLS ON
GO
SET QUOTED_IDENTIFIER ON
GO
ALTER FUNCTION [dbo].[Split]
(@List varchar(8000),@SplitOn Nvarchar(5))
RETURNS @RtnValue table
(Id int identity(1,1),Value nvarchar(100))
AS
BEGIN
    Set @List = Replace(@List,'''','')
    While (Charindex(@SplitOn,@List)>0)
    Begin

    Insert Into @RtnValue (value)
    Select
    Value = ltrim(rtrim(Substring(@List,1,Charindex(@SplitOn,@List)-1)))

    Set @List = Substring(@List,Charindex(@SplitOn,@List)+len(@SplitOn),len(@List))
    End

    Insert Into @RtnValue (Value)
    Select Value = ltrim(rtrim(@List))

    Return
END
go

Select *
From [Clv].[Split] ('1,2,3,3,3,3,',',')
GO

-4

आप इस फ़ंक्शन को sql सर्वर में लिखते हैं उसके बाद समस्या हल हो जाएगी।

http://csharpdotnetsol.blogspot.in/2013/12/csv-function-in-sql-server-for-divide.html


न केवल लिंक की नकल करें ... यह अच्छे सवालों का संकेत नहीं है ... आपको विस्तार से awer को समझाने की जरूरत है
The Hungry Dictator
हमारी साइट का प्रयोग करके, आप स्वीकार करते हैं कि आपने हमारी Cookie Policy और निजता नीति को पढ़ और समझा लिया है।
Licensed under cc by-sa 3.0 with attribution required.