现象
-
tengine 集群偶现耗时不符合预期(大于1s),通过抓包分析确定是 tengine 侧发生的耗时,同时发现 nginx 进程负载不均匀,与的nginx进程偶尔利用率超过100%
-
尝试开启reuseport解决该问题,修改后灰度过程中发现部分业务反馈耗时增加,少量499请求
-
关闭reuseport之后499请求恢复
配置 nginx 配置 revice buffer 为 8M worker_connections 65535; worker_processes auto
日志相关 没有错误日志 access.log里面显示upstream_response_time 超过1s,但是在上游服务抓包显示耗时非上游服务