热线电话:400-882-3320




客户背景
英雄互娱是一家全球领先的互动娱乐品牌,致力于为全球用户提供优质的移动游戏体验。旗下多款游戏受到大众的喜欢,在游戏热度不断提升的同时,也面临以下问题:
针对一些可能爆款的游戏,会存在瞬间出现大量的登录请求的情况。为了更好的应对这种场景,客户在尝试通过服务的容器化部署,并利用HPA (Horizontal Pod Autoscaling) 的功能,在请求量突增的情况下,通过快速的弹性自动扩容来提高系统的承载能力。
使用的公有云上 Kubernetes 集群,期望通过容器服务的自动弹性扩容功能,让业务相关服务能达到瞬时 5W RPS 的承载能力。通过压力测试,发现 6 个Pod 的情况下,RPS 的承载峰值为 2W 左右。增加到 12个 Pod(相同资源配置),RPS 的承载峰值为 2.4W 左右,继续扩展性能几乎不再提高。
解决方案
在容器服务环境中部署 DataKit,接入链路和日志数据。
在压测的过程中通过观测云应用性能监测的服务概览页面,可以快速定位疑似性能瓶颈的服务和相关资源。结合云上 Redis 的分析,对 Redis 的使用请求基本达到了配置规格能支持量的峰值。
在观测云中开启 Profile 的采集功能,结合应用链路进行性能分析,主要关注在“Lock Wait Time” 和 “Socket I/O Read Time” 的指标上,从而定位到代码中通过不同的实现方法在频繁调用Redis来完成相关的操作。反馈给研发,进行代码的调优。
客户收益
代码迭代上线新版本后,在新一轮的压测中,不改变原有资源配置的情况下,RPS 峰值达到 8W 左右,超出客户原来的预期。
更多案例