【问题标题】:split semicolon delimiter SQL to rows [duplicate]将分号分隔符 SQL 拆分为行 [重复]
【发布时间】:2017-06-19 08:14:38
【问题描述】:

只是想寻求帮助。 我正在尝试使用分号作为分隔符来拆分分隔值。 逗号不能替换为分号,因为有些值有逗号。

ID   Value
1   | A&B;C;D;E, F

转换为:

ID   Value
1    A&B
1    C
1    D
1    E, F

我尝试调整我上网的 SQL 脚本,但没有成功

SELECT F1.ID,
 O.splitdata 
FROM
 (
 SELECT OldID,
 cast('<X>'+replace((SELECT ColumnName + '' FOR XML PATH('')),';','</X><X>')+'</X>' as XML) as xmlfilter from TableName F
 )F1
 CROSS APPLY
 ( 
 SELECT fdata.D.value('.','varchar(max)') as splitdata 
 FROM f1.xmlfilter.nodes('X') as fdata(D)) O

它适用于我的某些列,但如果列有特殊或非法字符,它会输出此错误:

Msg 9411, Level 16, State 1, Line 2
XML parsing: line 1, character 16, semicolon expected

谢谢!

【问题讨论】:

  • 有很多字符串拆分技术,您不必使用基于 XML 的函数。阅读 Aaron bertrand 的 Split strings the right way – or the next best way 并选择不同的功能。
  • sql split string on delimiter 这样的快速谷歌提供了很多选择,包括上面链接的Zohar Peled 的优秀文章 - 你尝试过任何易于谷歌搜索的替代方法吗?
  • 如果您删除并且您的查询将正常工作@mirelle
  • @mohan111 我刚刚发布了一个答案,它允许在 XML-string-splitting 中使用此类字符。
  • 链接的possible duplicate(由 Serg 提供)是一个很好的可能方法列表,但相当陈旧。那里的许多答案都已过时...我将用提示将其关闭为重复项,以便在那里寻找更新的答案...

标签: sql sql-server csv split


【解决方案1】:

请使用下面的函数通过特定的分隔符来分割字符串:

CREATE FUNCTION [dbo].[Split](@String varchar(8000), @Delimiter char(1))        
returns @temptable TABLE (SplitValue varchar(8000))        
as        
begin        
    declare @idx int        
    declare @slice varchar(8000)        

    select @idx = 1        
       if len(@String)<1 or @String is null  return        

    while @idx!= 0        
    begin        
        set @idx = charindex(@Delimiter,@String)        
        if @idx!=0        
            set @slice = left(@String,@idx - 1)        
        else        
            set @slice = @String        

        if(len(@slice)>0)   
            insert into @temptable(SplitValue) values(@slice)        

        set @String = right(@String,len(@String) - @idx)        
        if len(@String) = 0 break        
    end    
return       
end

如果您有任何疑问,请告诉我。

谢谢。

【讨论】:

  • 使用循环的方法已经过时...
【解决方案2】:

带有 UDF 的选项 1

Declare @YourTable table (ID int, Value varchar(max))
Insert Into @YourTable values
(1,'A&B;C;D;E, F')

Select A.ID
      ,B.*
 From @YourTable A
 Cross Apply [dbo].[udf-Str-Parse-8K](A.Value,';') B

没有 UDF 的选项 2

Select A.ID
      ,B.*
 From @YourTable A
 Cross Apply (
                Select RetSeq = Row_Number() over (Order By (Select null))
                      ,RetVal = LTrim(RTrim(B.i.value('(./text())[1]', 'varchar(max)')))
                From  (Select x = Cast('<x>' + replace((Select replace(A.Value,';','§§Split§§') as [*] For XML Path('')),'§§Split§§','</x><x>')+'</x>' as xml).query('.')) as A 
                Cross Apply x.nodes('x') AS B(i)
              ) B

都返回

ID  RetSeq  RetVal
1   1       A&B
1   2       C
1   3       D
1   4       E, F

此 UDF 是 XML 安全且非常快速的

CREATE FUNCTION [dbo].[udf-Str-Parse-8K] (@String varchar(max),@Delimiter varchar(25))
Returns Table 
As
Return (  
    with   cte1(N)   As (Select 1 From (Values(1),(1),(1),(1),(1),(1),(1),(1),(1),(1)) N(N)),
           cte2(N)   As (Select Top (IsNull(DataLength(@String),0)) Row_Number() over (Order By (Select NULL)) From (Select N=1 From cte1 a,cte1 b,cte1 c,cte1 d) A ),
           cte3(N)   As (Select 1 Union All Select t.N+DataLength(@Delimiter) From cte2 t Where Substring(@String,t.N,DataLength(@Delimiter)) = @Delimiter),
           cte4(N,L) As (Select S.N,IsNull(NullIf(CharIndex(@Delimiter,@String,s.N),0)-S.N,8000) From cte3 S)

    Select RetSeq = Row_Number() over (Order By A.N)
          ,RetVal = LTrim(RTrim(Substring(@String, A.N, A.L)))
    From   cte4 A
);
--Orginal Source http://www.sqlservercentral.com/articles/Tally+Table/72993/
--Much faster than str-Parse, but limited to 8K
--Select * from [dbo].[udf-Str-Parse-8K]('Dog,Cat,House,Car',',')
--Select * from [dbo].[udf-Str-Parse-8K]('John||Cappelletti||was||here','||')

【讨论】:

    【解决方案3】:

    如果您不喜欢某个函数,或者您没有创建新函数的权限,您可以使用相当快速的 XML 方法。在你的情况下,它需要一些额外的努力来获得这个 XML 安全(由于特殊字符和 ; 作为分隔符):

    Declare @Dummy table (ID int, SomeTextToSplit varchar(max))
    Insert Into @Dummy values
     (1,'A&B;C;D;E, F')
    ,(2,'"C" & "D";<C>;D;E, F');
    
    DECLARE @Delimiter VARCHAR(10)=';';
    WITH Casted AS
    (
        SELECT *
              ,CAST('<x>' + REPLACE((SELECT REPLACE(SomeTextToSplit,@Delimiter,'§§Split$me$here§§') AS [*] FOR XML PATH('')),'§§Split$me$here§§','</x><x>') + '</x>' AS XML) AS SplitMe
        FROM @Dummy
    )
    SELECT Casted.*
          ,x.value('.','nvarchar(max)') AS Part 
    FROM Casted
    CROSS APPLY SplitMe.nodes('/x') AS A(x)
    

    结果

    1   A&B
    1   C
    1   D
    1   E, F
    2   "C" & "D"
    2   <C>
    2   D
    2   E, F
    

    【讨论】:

    • 非常好 - 已迁移到我的 XML 解析函数中
    • 感谢这个!它确实有效。只需注意 NULL 值将变为空白。但尽管如此,它工作得很好。与运行 10 分钟的光标脚本相比,它运行了 28 秒。
    • @MirelleGameng,不太正确...如果您的字符串一个接一个地包含两个 分号 (SomeValue;;More),则这两者之间没有字符。这不会读作空白 (=space),而是读作 空字符串 (=*zero-length-string*)。如果需要,您可以使用 NULLIF() 将其转换为 NULL。如果可行,请接受答案,谢谢!
    • 已被接受。再次感谢@Shnugo :)
    猜你喜欢
    • 2013-10-05
    • 2018-07-29
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-04-09
    • 2019-09-11
    • 2021-08-31
    • 1970-01-01
    相关资源
    最近更新 更多