【问题标题】:SQL Server split a single column multiple timesSQL Server 多次拆分单个列
【发布时间】:2011-09-20 09:19:47
【问题描述】:

我有一个数据库表,其中有一列包含两个级别的堆叠数据,其中一列我想拆分一部分。这是数据的示例(数据更改以保护无辜者:):

表格

ID = varchar(100)
CarData = varchar(1000)

ID       CarData
1        Nissan:blue:20000,Ford:green:10000
2        Nissan:steel:20001,Ford:blue:10001,Chevy:blue:10000,Ford:olive:10000
** Note that cardata can is not fixed, and can have many cars in it

所需的输出:

ID   Manufacture    Color     Cost
1    Nissan         Blue      20000
1    Ford           green     10000
2    Nissan         steel      20001
... and on

简单地说,我需要将第一个堆叠字段(逗号)拆分并为其创建一行,然后将第二个堆叠字段(冒号)拆分为列。

任何帮助将不胜感激。

【问题讨论】:

  • 您是否可以纠正这种可怕的糟糕数据库设计?
  • @JNK:希望他的问题的答案是更大努力的一部分。
  • 如果您需要经常运行它,创建 CLR 函数并利用现有的字符串库(更快、更好等)可能会更好地为您服务sqlblog.com/blogs/adam_machanic/archive/2009/04/26/…
  • 请注意,您提出的建议可能会创建相同的记录。一个实体有可能拥有两辆蓝色福特汽车,价格均为 20000。您需要一个额外的列,可以是序数或另一个 ID。
  • @bilinkc - 如果他需要经常运行这个,他真的需要重新设计表格,或者至少把它变成一个索引看法。我想我们大多数人都希望这是重新设计表格的一部分。

标签: sql sql-server split


【解决方案1】:

使用this string splitting function 生成结果表。

我会首先使用, 作为分隔符来调用dbo.split()。然后你会得到一个项目列表,例如:

Nissan:blue:20000
Ford:green:10000
Nissan:steel:20001
Ford:blue:10001
Chevy:blue:10000
Ford:olive:10000

从那里您可以使用: 作为分隔符再次调用dbo.split()。每次调用都会产生三条记录(假设您的设计至少是“正常”的)。

正如@JNK 在他的评论中提到的,希望这不是你想要定期运行的东西。

编辑:

一些示例代码可以帮助您入门:

SELECT *
INTO #YuckyCar
FROM (
  SELECT 1 ID, 'Nissan:blue:20000,Ford:green:10000' CarData
  UNION
  SELECT 2, 'Nissan:steel:20001,Ford:blue:10001,Chevy:blue:10000,Ford:olive:10000'
) T;

-- Shows logical step #1
SELECT ID, X.items MoreCarData
FROM #YuckyCar CROSS APPLY dbo.Split(CarData, ',') X;

-- Shows logical step #2
SELECT Q.ID, Y.items
FROM (
  SELECT ID, X.items MoreCarData
  FROM #YuckyCar CROSS APPLY dbo.Split(CarData, ',') X) Q CROSS APPLY dbo.Split(Q.MoreCarData, ':') Y

DROP TABLE #YuckyCar;

最后一部分的问题是你不能保证第 1 行 = 制造商,第 2 行 = 颜色,第 3 行 = 成本。

【讨论】:

  • 是的,我必须每天多次运行此查询,它是一个小组数据库。
【解决方案2】:
-- Sample data
declare @T table(ID int, CarData varchar(100))
insert into @T values 
(1,        'Nissan:blue:20000,Ford:green:10000'),
(2,        'Nissan:steel:20001,Ford:blue:10001,Chevy:blue:10000,Ford:olive:10000')

-- Recursice CTE to get one row for each car
;with cte(ID, Car, CarData) as
(
  select ID,
         cast(substring(CarData+',', 1, charindex(',', CarData+',')-1) as varchar(100)),
         stuff(CarData, 1, charindex(',', CarData), '')+','
  from @T
  where len(CarData) > 0
  union all
  select ID,
         cast(substring(CarData, 1, charindex(',', CarData)-1) as varchar(100)),
         stuff(CarData, 1, charindex(',', CarData), '')
  from cte
  where len(CarData) > 0
)
-- Use parsename to split the car data
select ID,
       parsename(replace(Car, ':', '.'), 3) as Manufacture,
       parsename(replace(Car, ':', '.'), 2) as Color,
       parsename(replace(Car, ':', '.'), 1) as Cost
from cte
order by ID

结果:

ID  Manufacture  Color   Cost
--  -----------  ------   -----
1   Nissan       blue    20000
1   Ford         green   10000
2   Nissan       steel   20001
2   Ford         blue    10001
2   Chevy        blue    10000
2   Ford         olive   10000

编辑 1

如果颜色、成本或制造商名称包含.,您将无法使用parsename。如果是这种情况,你应该试试这个。

-- Sample data
declare @T table(ID int, CarData varchar(100))
insert into @T values 
(1,        'Nissan:blue:20000,Ford:green:10000'),
(2,        'Nissan:steel:20001,Ford:blue:10001,Chevy:blue:10000,Ford:olive:10000')

-- Recursice CTE to get one row for each car
;with cte(ID, Car, CarData) as
(
  select ID,
         cast(substring(CarData+',', 1, charindex(',', CarData+',')-1) as varchar(100)),
         stuff(CarData, 1, charindex(',', CarData), '')+','
  from @T
  where len(CarData) > 0
  union all
  select ID,
         cast(substring(CarData, 1, charindex(',', CarData)-1) as varchar(100)),
         stuff(CarData, 1, charindex(',', CarData), '')
  from cte
  where len(CarData) > 0
)
-- Split the car data with substring
select ID,
       substring(Car, 1, P1.Pos-1) as Manufacture,
       substring(Car, P1.Pos+1, P2.Pos-P1.Pos-1) as Color,
       substring(Car, P2.Pos+1, len(Car)-P2.Pos) as Cost
from cte
  cross apply (select charindex(':', Car)) as P1(Pos)
  cross apply (select charindex(':', Car, P1.Pos+1)) as P2(Pos)
order by ID

【讨论】:

  • 太棒了。秒杀我。
  • 太棒了,我会在接下来的一个小时内开始看这个,这么快就感谢所有的帮助......我知道数据库设计是垃圾,我所在的团队不了解数据库设计...
  • 好的,我有 90% 的查询使用我的真实数据,但是,我在外部查询中得到 Car = 组合字段,该字段从逗号分隔中解析出来。但是我没有从 parsename(replace(Car, ':', '.'), 1) 中获取任何数据作为成本。现在你的工作完美,我只是想知道你是否能解释一下 parsename 正在做什么以及 '.' 是什么。代表?
  • 哇!由于 'sysname' 的限制,我从未使用过 'PARSENAME' ,但在这种情况下工作得非常快。 +1 因为我不能 +1000 :)
  • @Michael - 你可以在这里阅读parsename msdn.microsoft.com/en-us/library/ms188006.aspx。该函数用于分隔四个部分名称Server.DataBase.Owner.Table。如果您有四个以上的单词,它将不起作用。分隔符为.,因此您需要先将所有: 替换为.
【解决方案3】:

这应该可以解决您的问题:

[EDIT] 你的 ID 是一个 varchar(100) 并且你没有指定它是否是主键,所以我做了一些改变...... ID 不必是主键在这种情况下。

declare @T table(ID varchar(100), CarData varchar(1000))
declare @OUT table(pk INT IDENTITY(1,1), ID varchar(100), Manufacture varchar(100), Color VARCHAR(100), Cost INT)
insert into @T (ID, CarData) values 
('1', 'Nissan:blue:20000,Ford:green:10000'),
('2', 'Nissan:steel:20001,Ford:blue:10001,Chevy:blue:10000,Ford:olive:10000')

DECLARE @x XML, @i INT, @ID VARCHAR(100), @maxi INT; 
;WITH list AS (SELECT pk = ROW_NUMBER() OVER(ORDER BY ID), * FROM @T)
  SELECT @i=1, @maxi=MAX(pk) FROM list;
WHILE @i <= @maxi
BEGIN
  ;WITH list AS (SELECT pk = ROW_NUMBER() OVER(ORDER BY ID), * FROM @T)
    SELECT
       @x = CAST( '<root><car><prop>' + 
                  REPLACE(
                    REPLACE(
                       CarData
                      ,':'
                      ,'</prop><prop>'
                    )
                    ,','
                    ,'</prop></car><car><prop>'
                  ) + 
                  '</prop></car></root>'
             AS XML)
     , @ID = ID 
    FROM list 
    WHERE pk = @i

  INSERT INTO @OUT 
    SELECT 
       ID = @ID
      ,Manufacture = x.value('./prop[1]','VARCHAR(100)')
      ,Color   = x.value('./prop[2]','VARCHAR(100)')
      ,Cost    = x.value('./prop[3]','INT')
    FROM @x.nodes('/root/car') AS T(x)

  SET @i = @i + 1;
END

SELECT * FROM @OUT

/* -- OUTPUT
ID  Manufacture   Color   Cost
--------------------------------
1   Nissan        blue    20000
1   Ford          green   10000
2   Nissan        steel   20001
2   Ford          blue    10001
2   Chevy         blue    10000
2   Ford          olive   10000
*/

【讨论】:

  • @EricZ:谢谢,但是如果您针对 25000 条记录运行我的解决方案,它看起来就像一个糟糕的笑话(我尝试对其进行测试,而 Mikael 的解决方案的 1 秒比我的解决方案快得多)。跨度>
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2016-08-21
  • 1970-01-01
  • 2023-04-02
  • 1970-01-01
  • 1970-01-01
  • 2019-11-03
  • 1970-01-01
相关资源
最近更新 更多