测试数据:2亿行,被筛选出的数据,3KW多行。

众所周知 like %str%无法走索引,但是我们如果实在是有这种需求要达到like '%str%'的筛选目的,怎么优化好一些呢?

以下是我的一些思考:

(1)全文索引:原理是利用倒排索引,构建由谓词、短语、关键词等组成记录索引。但其实如果词用的不好会有问题,而且并不够精准,可能str相关的也出来了,且并不包含str这个字符串;

(2)构建计算列: 

  如果数据量少,直接基于要like的A列,再构造一个函数计算列B列取值为reverse(A),然后每次A列生成字符串,B列会自动产生反向字符串。
  
  然后 比如A列为‘abcde’ 原本 我要like '%bc%',现在只需要A B列都加上索引,条件给 AND A like 'bc%' AND B like 'cb%'就好了。
 
(3)强行用其他办法试一波
【1】反向
关于like %%的优化思路

 

【2】charindex

对比,直接like花费13分钟

关于like %%的优化思路

使用charindex

关于like %%的优化思路

 

相关文章:

  • 2022-12-23
  • 2022-03-09
  • 2022-12-23
  • 2021-11-24
  • 2021-08-07
  • 2021-12-18
  • 2021-08-04
猜你喜欢
  • 2022-01-01
  • 2022-12-23
  • 2021-11-23
  • 2021-10-26
  • 2022-12-23
  • 2022-01-20
相关资源
相似解决方案