记录一次游戏服务器的压测调优记录(Golang语言)

来自:烧书煮石_

记录一次游戏服务器的压测调优记录(Golang语言) - 简书 (jianshu.com)

前言

辛苦开发了一年的服务,终于要上线了,进入了关键的质检阶段--压力测试环节。
目标值:一千个用户,300rps

问题

因开发节奏的紧张,初期并没有注重优化,果不其然,一压测就爆炸了,主要问题有如下:

  1. RPS太低,1000个用户下,rps初期仅100
  2. 随着时间的推移,rps逐步降低
  3. 服务器随时闪崩

很明显,压测后感觉我们的代码是一坨乐色,还能咋办呢,慢慢排查吧。

思考

1.服务器为什么会崩溃?
2.为什么请求的响应耗时很奇怪,时而快时而慢(且多次随着时间的推移 响应越来越慢)?
3.rps为什么那么低?瓶颈点在哪里?如何优化?
4.某些业务,没有复杂业务逻辑,却耗时较高,且不稳定

排查过程

  1. 服务器突然崩掉,必须优先排查,为什么崩掉呢?

    1. 资源不足,如cpu 内存等资源不足,导致服务太卡顿或内存溢出

       1.考虑压测服务本身是和其他服务共用资源,导致压测数据有波动(时而快时而慢),内存不足导致崩溃2.内存泄露,导致压测后期崩掉,内存不足导致崩溃(通过pprof排查)3.排查过程中,因埋点太多,导致日志发送太多,因公司的日志组件实现,若不能及时发送到远程,会堆积在本地,则导致本地磁盘占满,服务器打开了太多文件句柄,导致内存溢出.(后提出优化,若磁盘占用一定大小,则先删旧的文件,再写入新文件)
      
    2. 协程没有捕获panic
       最常见的服务崩溃,但排查后发现,无论是异步业务,或者普通请求,都有捕获,并不是该原因
      
    3. 并发问题
       代码很难看出来,经过多次排查日志,发现部分崩溃原因是因为未对map加锁(尽量使用sync.map)
      
  2. rps 太低,(大部分业务耗时都大于300毫秒),那原因何在?
    1. 可能是业务逻辑错误,混乱,导致问题。

       排查方向,写一个中间件工具,针对压测结果,出错业务单独埋点,第一步,第二步的耗时此时出现问题,对某个接口的压测结果,时快时慢(发现是资源问题)。
      
    2. 可能是数据库耗时太久,有大量慢查询。
       排查方向,在最底层,每一步对数据库的操作,都埋点排查(优化慢查询,all查询,建立索引)
      
    3. 网络延迟(脚本计算错误)
       发现日志记录 和压测结果不符,多方讨论后,得出问题在于压测脚本。
      
    4. 可能是加锁,死锁等原因
       对加锁埋点记录,发现部分业务加锁不正确,如某个死锁问题,导致用户超时断线,则脚本中丢失了一个用户数,使后期rps越来越低
      

总结

总的来说,遇到很多很多问题,算是各方面的大坑都踩了个遍,大概有以下几个:

  1. 针对关键业务埋点,优化部分接口(通过压测结果分析)(如分对推送数据做优先级,分多次下发,和某些业务的异步处理)
  2. 排查内存泄露(通过pprof抓取)
  3. 排查锁问题,对不可重入锁,重复加锁(多次调用中间件 重复对不可重入锁加锁)
  4. 排查并发问题(检查代码和日志)
  5. 压测服务,独立部署,升级配置(通过Grafana监控)

感悟

总的来说,个人主导的该压测优化过程,历经三天四夜,圆满结束.(压测稳定,上线不慌)

过程中有疑惑,有压力,有烦躁也有感悟,不过耐心细致的分析排查,进行了七八个优化,解决了三五个隐患,最终顺利的结束压测,还是很有成就感的.

这是一次很好的解决问题过程,故做此记录.最终达到1500个用户量,450rps,其中98%的请求耗时,都在200ms内,90%耗时都在50ms内.且后续进行压测48小时,仍能保持稳定的rps和合理的资源占用.(撒花 ✿✿ヽ(°▽°)ノ✿)

分享

另外分享排查过程中,几个常用的pprof命令:
可实时抓取目标服务的状态,并在本地web直接查看火焰图属性,非常方便.

  1. pprof 实时 查看实时内存:
go tool pprof -http=:[本地解析pprof文件的端口(随便填)] http://[目标服务器IP:端口]/debug/pprof/heap
例子:
go tool pprof -http=:8001 http://127.0.0.1:8087/debug/pprof/heap
  1. pprof 压测 实时 查看实时协程:
go tool pprof -http=:[本地端口] http://[目标服务器IP:端口]/debug/pprof/goroutine
  1. pprof 压测 实时 查看60s 的cpu占用情况:
go tool pprof -http=:[本地端口] http://[目标服务器IP:端口]/debug/pprof/profile  --second=60

记录一次游戏服务器的压测调优记录(Golang语言)相关推荐

  1. STS卡顿(一次STS IDE 优化调优记录)

    说在前面的话 前几天在电脑上安装了一款 Spring Boot 专用的开发工具 STS IDE,但是这厮使用起来真的慢的让人不可接受,不但窗口拖动慢,而且运行程序也慢,每次编写完成一个代码块后,一保存 ...

  2. Jmeter对服务器的压测

    1.对本地数据库进行压测 1.添加一个线程组和驱动 2.添加一个JDBC Connection Configuration,连接池配置文件.右键线程组[添加]–[配置元件]–[JDBC Connect ...

  3. 我的世界服务器在线压测,我朋友的我的世界服务器一直被压测怎么办啊

    我的世界开服时遇到压测攻击可以说是非常习以为常的事情,而压测的防御其实也并不是很简单,目前比较常用的防压测方法是物理防御及通过插件避免压测程序频繁的获取服务器详情,以下是一套卓有成效的防压测方案以及对 ...

  4. 性能测试分析与性能调优诊断--史上最全的服务器性能分析监控调优篇

    来源: https://www.cnblogs.com/laoqing/p/11629941.html 一个系统或者网站在功能开发完成后一般最终都需要部署到服务器上运行,那么服务器的性能监控和分析就显 ...

  5. 走进“开心农场主”:游戏数据分析的架构及调优

    发表于 1小时前|  1164次阅读| 来源 CSDN|  1 条评论| 作者 穆黎森 大数据 Hadoop HBase MySQL Java 摘要:08年,他们以<开心农场>打开国际化社 ...

  6. python--爬虫--积累--多图片网站抓取加速方案和调优记录

    最近在处理多图片数据网站的抓取案例. 对抓取的速度有一定的要求.短时间内需要获取大量的图片. 在部署分布式抓取时有很多个因素是需要调优的. 1.每次读取数据库mongodb需要处理的记录的条数 2.协 ...

  7. Linux服务器性能查看分析调优

    一 linux服务器性能查看 1.1 cpu性能查看 1.查看物理cpu个数: cat /proc/cpuinfo |grep "physical id"|sort|uniq|wc ...

  8. tomcat提高图片服务器性能,Tomcat性能调优(windows)

    1.目录: a.基础调优 b.JVM 优化 c.高级调优 2.基础调优: 2.1.tomcat的各版本的优化参数有点不一样,可以启动tomcat之后访问[http://127.0.0.1:8080/d ...

  9. kettle 提交数据量_Kettle数据同步速度调优记录

    Msyql到Vertica 1.mysql中在openshop 数据库中选择其中一个300W左右数据的表 create table ip_records_tmp_01 AS SELECT * FROM ...

最新文章

  1. eeglab中文教程系列(8)-选择数据的epochs并进行比较
  2. LeetCode 20. 有效的括号(Valid Parentheses)
  3. 各大公司官网都有哪些显而易见的Bug?
  4. Java反射及 IoC原理、内省机制
  5. java.lang.StringBuffer源码分析
  6. 常用的python模块及安装方法
  7. .config文件与.xml文件的关系
  8. 【python】CNN算法
  9. 暨南大学人文社科a类期刊_关于调整人文社科B类和C类期刊目录的通知
  10. BIGEMAP教您如何选择分度带(中央子午线)
  11. c语言中char有无符号,char代表有符号还是无符号?
  12. Aviary集成心得
  13. habor-deploy docker https 私有仓库搭建
  14. qpython3使用手册图_qpython 图
  15. iphone12android在线啥意思,iOS12要来了,你还不知道这些iPhone的隐藏功能?
  16. 计算机学业水平考试的选择题,信息技术学业水平考试选择题带答案.doc
  17. 产业分析:短视频及直播营销报告
  18. QT 如何计算中英文字符串的长度
  19. 弘辽科技:如何获取淘宝推广链接?有哪些推广方法?
  20. 浩方对战平台 V4.54 Build0330 优化绿色特别版

热门文章

  1. 四轮驱动(SSMR)移动机器人运动模型及应用分析
  2. 开源 画图_[软件使用05] 快速使用 Deeptools 对 ChIP-seq 数据画图!
  3. 关于Mysql8.0.26版本与IDEA连接的配置
  4. -moz、-ms、-webkit
  5. MySQL优化之——触发器
  6. spring cloud gateway Unhandled failure: Only one connection receive subscriber allowed.
  7. 【python实战】使用 pygame 写一个 flappy-bird 类小游戏 | 涉及思路+项目结构+代码详解 | 新手向
  8. 云ubuntu服务器配置
  9. 【数据结构笔记13】C实现:判别是否是同一颗二叉搜索树(BST)
  10. java spring多数据源配置文件_基于注解实现SpringBoot多数据源配置