TKE 容器网络中的 ARP Overflow 问题探究及其解决之道

作者朱瑜坚,腾讯云后台开发工程师,熟悉 CNI 容器网络相关技术,负责腾讯云 TKE 的容器网络的构建和相关网络组件的开发维护工作,作为主力开发实现了 TKE 下一代容器网络方案。 1. 问题背景 1.1 问题描述 最近,某内部客户的 TKE VPC-CNI 模式的独立网卡集群上出现了 pod 间访 ... »

腾讯云容器服务 TKE 拿下新加坡 MTCS 最高级别安全认证

近日,腾讯云容器服务 TKE 荣获新加坡 MTCS 最高级安全认证,标志着腾讯云 TKE 在为用户提供可靠、易部署、灵活扩展等基础服务上,已经全面满足了新加坡监管机构以及多个行业客户对服务安全的要求。 科普一下: 可能很多人对新加坡 MTCS 认证还不熟悉,这里小编来给大家科普一下吧。 »

Prometheus时序数据库-磁盘中的存储结构

Prometheus时序数据库-磁盘中的存储结构 前言 之前的文章里,笔者详细描述了监控数据在Prometheus内存中的结构。而其在磁盘中的存储结构,也是非常有意思的,关于这部分内容,将在本篇文章进行阐述。 磁盘目录结构 首先我们来看Prometheus运行后,所形成的文件目录结构 在笔者自己的机 ... »

ImageApparate(幻影)镜像加速服务让镜像分发效率提升 5-10 倍

作者介绍 李昂,腾讯高级开发工程师,主要关注容器存储和镜像存储相关领域,目前主要负责腾讯容器镜像服务和镜像存储加速系统的研发和设计工作。 李志宇,腾讯云后台开发工程师。负责腾讯云 TKE 集群节点和运行时相关的工作,包括 containerd、docker 等容器运行时组件的定制开发和问题排查。 洪 ... »

在 TKE 中使用 Velero 迁移复制集群资源

概述 Velero(以前称为Heptio Ark)是一个开源工具,可以安全地备份和还原,执行灾难恢复以及迁移 Kubernetes 群集资源和持久卷,可以在 TKE 集群或自建 Kubernetes 集群中部署 Velero 用于: 备份集群并在丢失的情况下进行还原。 将集群资源迁移到其他集群。 将 ... »

Prometheus时序数据库-内存中的存储结构

Prometheus时序数据库-内存中的存储结构 前言 笔者最近担起了公司监控的重任,而当前监控最流行的数据库即是Prometheus。按照笔者打破砂锅问到底的精神,自然要把这个开源组件源码搞明白才行。在经过一系列源码/资料的阅读以及各种Debug之后,对其内部机制有了一定的认识。今天,笔者就来介绍 ... »

手把手教你在容器服务 TKE 中使用动态准入控制器

在 TKE 中使用动态准入控制器 原理概述 动态准入控制器 Webhook 在访问鉴权过程中可以更改请求对象或完全拒绝该请求,其调用 Webhook 服务的方式使其独立于集群组件,具有非常大的灵活性,可以方便的做很多自定义准入控制,下图为动态准入控制在 API 请求调用链的位置(来源于 Kubern ... »

边缘计算场景下云边端一体化的挑战与实践

本文整理自腾讯云专家工程师王继罗在 2020年12月深圳 Qcon 大会上的分享内容——边缘计算场景下云边端一体化的挑战与实践 。 边缘计算想必大家都已经听过了,但是如何将业务扩展到边缘,从而实现更大的业务价值呢? 关于这个问题,腾讯云早在几年前就已开始进行思考,并且着手打造了云边端一体化的超融合平 ... »

使用 tke-autoscaling-placeholder 实现秒级弹性伸缩

背景 当 TKE 集群配置了节点池并启用了弹性伸缩,在节点资源不够时可以触发节点的自动扩容 (自动买机器并加入集群),但这个扩容流程需要一定的时间才能完成,在一些流量突高的场景,这个扩容速度可能会显得太慢,影响业务。 tke-autoscaling-placeholder 可以用于在 TKE 上实现 ... »

被集群节点负载不均所困扰?TKE 重磅推出全链路调度解决方案

引言 在 K8s 集群运营过程中,常常会被节点 CPU 和内存的高使用率所困扰,既影响了节点上 Pod 的稳定运行,也会增加节点故障的几率。为了应对集群节点高负载的问题,平衡各个节点之间的资源使用率,应该基于节点的实际资源利用率监控信息,从以下两个策略入手: 在 Pod 调度阶段,应当优先将 Pod ... »

一文读懂 TKE 及 Kubernetes 访问权限控制

你有了解过Kubernetes的认证授权链路吗?是否对TKE的权限控制CAM策略、服务角色傻傻分不清楚?本文将会向你介绍腾讯云TKE平台侧的访问控制、Kubernetes访问控制链路,以及演示如何将平台侧账号对接到Kubernetes内。 当你在使用腾讯云容器服务TKE(Tencent Kubern ... »

一文读懂 Kubernetes APIServer 原理

前言 整个Kubernetes技术体系由声明式API以及Controller构成,而kube-apiserver是Kubernetes的声明式api server,并为其它组件交互提供了桥梁。因此加深对kube-apiserver的理解就显得至关重要了。 整体组件功能 kube-apiserver作 ... »

K8s 平台可以如何处理 Pod 预授权问题

前言 TKEx-CSIG 是基于腾讯公有云 TKE 和 EKS 容器服务开发的内部上云容器服务平台,为解决公司内部容器上云提供云原生平台,以兼容云原生、适配自研业务、开源协同为最大特点。 业务容器上云过程中,会遇到一些问题,有的需要业务进行容器化改造,有的需要平台赋能。平台赋能的部分,有一类问题是 ... »

【从0到1学习边缘容器系列-4】弱网环境利器之分布式节点状态判定机制

导语 边缘场景下网络常常不可靠,容易误触发 Kubernetes 驱逐机制,引起不符合预期的 Pod 驱逐动作,TKE Edge 首创分布式节点状态判定机制,该机制可以更好地识别驱逐时机,保障系统在弱网络下正常运转,避免服务中断和波动。 边缘计算情境下,边缘节点与云端的网络环境十分复杂,网络质量无法 ... »

容器编排系统K8s之Prometheus监控系统+Grafana部署

Pushgateway组件类似Prometheus retrieval代理,它主要负责收集主动推送指标数据的pod的指标数据,在Prometheus 监控系统中也有主动监控和被动监控的概念,主动监控是指被监控端主动推送数据到server,被动监控是指被监控端被动等待server来拉去数据,默认情况... ... »

二 prometheus 监控 Redis

Prometheus 监控Redis需要用到redis_exporter客户端, Prometheus → redis_exporter这个模式, 类似监控Mysql 一个思路. 1 ) 设置系统代理,golang有可能被墙,导致编译失败. # Enable the go modules featu ... »

7.prometheus之查询API

一、格式概述 二、表达式查询 2.1 Instant queries(即时查询) 2.2 范围查询 三、查询元数据 3.1 通过标签匹配器找到度量指标列表 3.2 获取标签名 3.3 查询标签值 四、表达式查询结果格式 4.1 范围向量 4.2 瞬时向量 4.3 标量 4.4 字符串 五、Targe ... »

Promethues 之 Thanos

Promethues简介和原理 请看我之前写的 Prometheus简介,原理和安装 https://www.cnblogs.com/you-men/p/12839535.html 官方架构问题 官方架构存在一个最大的问题数据量一上去需要尽快拆分,例如在使用中发现Es的Export会拉取大量metr ... »

一文读懂 SuperEdge 边缘容器架构与原理

前言 superedge是腾讯推出的Kubernetes-native边缘计算管理框架。相比openyurt以及kubeedge,superedge除了具备Kubernetes零侵入以及边缘自治特性,还支持独有的分布式健康检查以及边缘服务访问控制等高级特性,极大地消减了云边网络不稳定对服务的影响,同 ... »

Serverless 如何应对 K8s 在离线场景下的资源供给诉求

本文整理自腾讯云云原生产品团队的专家产品经理韩沛在 Techo 开发者大会云原生专题的分享内容——Kubernetes 混部与弹性容器。本次分享主要分为三部分:基于 K8s 的应用混部、提升应用混部效果的关键、弹性容器对混部集群的价值。 讨论 K8s 的混部这个话题,是因为我们发现,在业务 K8s ... »