查询在 Azure 中执行缓慢的瓶颈是什么答案

【问题标题】：What is bottleneck for query to perform slow in Azure查询在 Azure 中执行缓慢的瓶颈是什么
【发布时间】：2017-07-14 07:30:22
【问题描述】：

我有 标准层的 Azure SQL 数据库，10 DTU。

我如何“预测” CPU 密集型查询的性能（因为这似乎是缓慢的原因）？

为了说明问题将使用 perf_test 表，可以像这样填充（脚本可以改进很多，但这不是重点）：

CREATE TABLE dbo.perf_Test
(
    PolicyDescriptionID INT IDENTITY PRIMARY KEY,
    col1 NVARCHAR(100),
    col2 NVARCHAR(100),
    col3 NVARCHAR(100),
    col4 NVARCHAR(100),
    col5 NVARCHAR(100),
)

GO
SET NOCOUNT ON; 

DECLARE @i INT = 0
WHILE @i < 100000
BEGIN 
    DECLARE @NumberI int = CAST(RAND() * 100000 AS INT);
    DECLARE @NumberC VARCHAR(6);
    SET @NumberC = 
        CASE
            WHEN @NumberI < 10 THEN '00000' + CAST(@NumberI AS VARCHAR(6))
            WHEN @NumberI < 100 THEN '0000' + CAST(@NumberI AS VARCHAR(6))
            WHEN @NumberI < 1000 THEN '000' + CAST(@NumberI AS VARCHAR(6))
            WHEN @NumberI < 10000 THEN '00' + CAST(@NumberI AS VARCHAR(6))
            WHEN @NumberI < 100000 THEN '0' + CAST(@NumberI AS VARCHAR(6))
            ELSE CAST(@NumberI AS VARCHAR(6))
        END;

    INSERT INTO dbo.perf_Test(col1, col2, col3, col4, col5)
            VALUES(
                @NumberC, -- char
                @NumberC + RIGHT(@NumberC, 3) + @NumberC, -- casts as nvarchar
                @NumberC + 'adslk3ājdsfšadjfads',
                @NumberC, 
                @NumberC
                );
    SET @i = @i + 1;
END

对于许多查询，azure 将执行与本地计算机相同的操作。但对于 ugly 查询，它的表现要差得多：

SELECT * 
FROM dbo.perf_Test
WHERE 
       col1 LIKE '%263a%'
    OR col2 LIKE '%263a%'
    OR col3 LIKE '%263a%'
    OR col4 LIKE '%263a%'
    OR col5 LIKE '%263a%'

天蓝色：扫描计数 1，逻辑读取 1932（其余 0） SQL Server 执行时间：CPU 时间 = 16 毫秒，已用时间 = 6718 毫秒

本地：扫描计数 1，逻辑读取 1932 SQL Server 执行时间：CPU 时间 = 563 毫秒，已用时间 = 482 毫秒。

逻辑读取与“坏”示例相同，但此查询在 azure 中的执行大致相同：

SELECT * 
FROM dbo.perf_Test
WHERE col2 = '038743743038743'

天蓝色：扫描计数 1，逻辑读取 1932 SQL Server 执行时间：CPU 时间 = 32 毫秒，运行时间 = 22 毫秒。

本地：扫描计数 1，逻辑读取 1932 SQL Server 执行时间：CPU 时间 = 16 毫秒，运行时间 = 7 毫秒。

返回的行数约为 100 行 - 与“坏”示例相同，但此查询在 azure 中的执行大致相同

SELECT * 
FROM dbo.perf_Test
WHERE col1 like N'0975%'

天蓝色：扫描计数 1，逻辑读取 1932 SQL Server 执行时间：CPU 时间 = 16 毫秒，运行时间 = 26 毫秒。

本地：扫描计数 1，逻辑读取 1932 SQL Server 执行时间：CPU 时间 = 15 毫秒，运行时间 = 35 毫秒。

如果我进行一些 CPU 密集型查询，差异又是巨大的（在 azure 中为 2 秒对 35 秒）：

SELECT SUM(CAST(t1.col1 AS BIGINT) + CAST(t2.col1 AS BIGINT)), COUNT(t2.col1)
FROM dbo.perf_Test t1
    CROSS JOIN dbo.perf_Test t2
WHERE t1.col3 LIKE '%263a%'
OPTION (MAXDOP 1)

【问题讨论】：

标签： sql azure-sql-database sql-server-2016

【解决方案1】：

如果我进行一些 CPU 密集型查询，差异又是巨大的（在 azure 中为 2 秒对 35 秒）：

这是因为查询可能会受到限制，直到资源可用并且您将本地部署与 SQLAZURE（标准第 10 层 DTU）进行比较，这是不准确的比较

下图显示了服务层的一些粗略读写

您可以假设，标准层测量值会少得多，并且当资源不可用于查询时，它会等待。

使用 Azure 有一些好处，例如透明补丁、备份、高可用性、始终使用企业级......所以当你使用云时，你必须做出一些权衡

以下是我将按顺序尝试的步骤

1.运行下面的查询以查看是否有任何 DTU 指标在一段时间内始终 >90%，如果是，我将升级到下一个服务层

select   top 1 with ties end_time,B.DTUpcnt,b.DTUMetric
 from sys.dm_db_resource_stats t
 cross apply
(values
     (avg_cpu_percent,'avg_cpu_percent'),
     (avg_data_io_percent,'avg_data_io_percent'),
     (avg_memory_usage_percent,'avg_memory_usage_percent'),
     (avg_log_write_percent,'avg_log_write_percent')
     )b(DTUPcnt,DTUMetric)
     order by row_number() over (partition by end_time order by DTUMetric desc)

2.我也会尝试微调使用更多 DTU 或提供更多计算能力的查询

要预测交叉连接查询的性能，您需要确保这些表在缓冲区中，因此不会有 IO，这反过来会降低 CPU 使用率..

您还可以在 azure 中尝试内存中的 oltp 表，以获取关键表

【讨论】：

我试图找出查询是否受到限制，但据我了解并非如此。 DTU 的使用量也没有消耗太多——查询中的 DTUpcnt 显示使用了 5.9%（基本上该数据库上没有发生任何其他事情）。还显示的是所有查询的逻辑读取。数据量非常小（实际情况下为 50 000 行），因此很难证明更高层的成本是合理的（目前未使用弹性池）。
如果您的读/写或超过限制，它们将被限制，您能否在查询运行期间收集等待统计信息
在执行大约 34 秒的查询之前/之后检查的增量在 SOS_SCHEDULER_YIELD = 31847 (wait_time_ms) 中。我从 sys.dm_db_wait_stats 视图中获取它，执行之间没有其他等待值增加。我能从中得出一些结论吗？
sos_Scheduler_yield 属于 cpu 等待类别，您可能需要提高层级