页游运维“摸爬滚打”那些年~(2)
? 手动的人工解析,二十只手脚指一起忙活,估计也是累的够呛,可能还不能满足需求,咱们可是集网络、系统 、开发于一身的高质量高学历的“复合性人才”,怎么可以做这么low的事呢,那必须不行啊,这是不符合身份的 优化改进 开发自动化域名解析后台,实现海量域名自动化自助化的批量解析 除此之外,也可通过整改游戏架构的方式,统一前端入口,把所有前端集合在一台或者多台机器上面,当区服被合服时,源服的前端直接软链到目标服,从而实现访问源机会自动连接目标服的结果,规避掉重新解析域名,如下图: 当然还可以以cname 的方式解析,但cname方式同样是需要重新解析一遍,并且随着合服次数的增多,某目标服存在多次合服的可能,这样cname重数多了,可能会引起问题,不确定哟. 2.3 不可抗力的天朝网络2.3.1 BGP转发 游戏玩家分布全国各地,而国内网络错综复杂,会存在因为种种网络问题导致部分玩家连不上游戏gateway的端口,像一些小运营商网络的玩家,因为本身网络运营商的原因,我们会不可控,眼睁睁的看着玩家流失.再加上时不时的南北骨干网络抽风一下,站在技术小白玩家的角度来说,会造成极差的体验,最后就是玩家会说:“怪我咯?肯定都是你们的错了.” 优化改进 选用优质网络的BGP机房部署中转服务器,结合客户端的逻辑判断处理,如果玩家连接不上游戏服gateway的端口则尝试通过中转机器进行重连,以增大游戏联通率.通过我们最新的定制策略,大概可以挽回10%左右用户的游戏体验. 2.3.2 APM实时地域性监控报警 以前没有APM时,当玩家登录异常报障,往往需要玩家配合帮忙收集信息才能定位问题,特别是手游时代更是繁琐,例如需要安装DNS&Ping软件啥的,加上大世界手游产品模块架构本身就相对复杂,玩家到游戏的整个逻辑交互过程不透明,若是发生区域性网络问题,那就更坑爹了,巨耗时间不说,吃力也不讨好呀. 优化改进 开发APM性能监控后台,把玩家连接游戏的整个逻辑交互过程数据化、透视化.
3 总结上述问题及优化来源于我们的“错题本”的归纳与总结,都是曾经的血泪史,若对你产生点点作用,请不吝点赞打赏,哈哈,最后 我们走的可能不快,但我们一直在进步,just do it,肯定有一份收获属于你.干了这碗毒鸡汤,继续搬砖了,哎妈,骨干又抽了…… 原文来自微信公众号:运维军团 (编辑:ASP站长网) |