【问题标题】:It was not possible to connect to the redis server(s); ConnectTimeout无法连接到 redis 服务器;连接超时
【发布时间】:2019-10-18 22:16:33
【问题描述】:

我正在使用带有 StackExchange.Redis 1.2.6 的 Azure Function V1。每分钟接收 1000 条消息的功能,对于每条消息,对于每台设备,我正在检查 Redis。我注意到当我们当时有更多消息时,我们会遇到错误。

执行函数时出现异常:TSFEventRoutingFunction 没有可用于服务此操作的连接:HGET GEO_DYNAMIC_hash;无法连接到 redis 服务器;连接超时; IOCP: (Busy=1,Free=999,Min=24,Max=1000), WORKER: (Busy=47,Free=32720,Min=24,Max=32767), Local-CPU: n/a 不是可以连接到 redis 服务器;连接超时

CacheService 由 MS 推荐

public class CacheService : ICacheService
{
    private readonly IDatabase cache;
    private static readonly string connectionString = ConfigurationManager.AppSettings["RedisConnection"];

    public CacheService()
    {
        this.cache = Connection.GetDatabase();
    }

    private static Lazy<ConnectionMultiplexer> lazyConnection = new Lazy<ConnectionMultiplexer>(() =>
    {
        return ConnectionMultiplexer.Connect(connectionString);
    });

    public static ConnectionMultiplexer Connection
    {
        get
        {
            return lazyConnection.Value;
        }
    }

    public async Task<string> GetAsync(string hashKey, string ruleKey)
    {
        return await this.cache.HashGetAsync(hashKey, ruleKey);
    }
}

我在 Azure 函数中注入 ICacheService 并在每个请求上调用 GetAsync 方法。

使用 Azure Redis 实例 C3

目前,您可以看到我只有一个连接,创建多个连接将有助于解决这个问题吗?或任何其他解决/理解此问题的建议。

【问题讨论】:

    标签: c# redis stackexchange.redis azure-redis-cache


    【解决方案1】:

    您遇到的错误有很多不同的原因。以下是我能想到的一些(不按任何特定顺序):

    1. 您的 connectTimeout 太小。我经常看到客户经常设置一个小的连接超时,因为他们认为这将确保在该时间跨度内建立连接。这种方法的问题在于,当出现问题(高客户端 CPU、高服务器 CPU 等)时,连接尝试将失败。这通常会使糟糕的情况变得更糟 - 它没有帮助,反而通过强制系统重新启动尝试重新连接的过程来加剧问题,通常导致 connect -> fail -> retry 循环。我通常建议您将 connectionTimeout 设置为 15 秒或更高。最好让你的连接尝试在 15 或 20 秒后成功,而不是让它在 5 秒后反复失败,从而导致持续几分钟的中断,直到系统最终恢复。

    2. 发生服务器端故障转移。由于某种类型的从主服务器到副本的故障转移,服务器断开了连接。如果在 Redis 层、OS 层或托管层更新服务器端软件,就会发生这种情况。

    3. 某种类型的网络基础设施故障(位于客户端和服务器之间的硬件出现某种类型的问题)。

    4. 您更改了 Redis 实例的访问密码。更改密码将重置与所有客户端的连接以强制它们重新进行身份验证。

    5. 需要调整线程池设置。如果您的线程池设置未针对您的工作负载正确调整,那么您可能会在启动新线程时遇到延迟,如explained here

    我写了一堆best practices for Redis,它们也可以帮助您避免其他问题。

    【讨论】:

    • 您可以看到繁忙线程 (47) 大于最小 (24) 线程。是不是也是报错的原因。我在看你的帖子gist.github.com/JonCole/e65411214030f0d823cb
    • @PankajRawat - 是的,错过了。我将更新我上面的列表以包括线程池设置。感谢您接获此案。
    【解决方案2】:

    我们通过将StackExchange.Redis 升级到2.1.30 解决了这个问题。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2013-02-25
      • 2017-03-01
      • 1970-01-01
      • 1970-01-01
      • 2015-11-14
      • 2012-05-26
      • 1970-01-01
      • 2021-10-25
      相关资源
      最近更新 更多