大战黑客,一路披荆斩棘,百亿互联网金融平台救火故事!(6)
当天的派息标的比较多,跑了一个半小时,就导致了派息和到期的两个定时任务同时进行,转账有了并发,第三方支付的接口不稳定给我们返回的失败,其实有的是成功的,这就导致了我们进行了二次的扣款尝试引发了此问题。 这个事情给我带来了非常大的教训,对于金融扣款的这种事情一定需要谨慎,那怕付款引发报警之后再人工处理,也不能盲目重试可能引发雪崩效应。 03、杂七杂八还有就是其他一些零碎的问题了,记的有一次对用户的登录过程进行优化,导致有一块判断少了一个括号结果用户在那两个小时内,只要输入账户,任意密码就可以登录了。 幸好我及时发现这个问题,正是这个问题才导致了我们正式确立了规范的上线流程,为以后的上线制度建定了基础。 还有一次我们在模拟用户投资一种标的时候,留了一个入口通过 HTTP 就可以调用,测试也没有问题,有一天正好给领导演示呢,就再次用 HTTP请求的方式在浏览器执行了一下,前端就会看到自动投标的过程。 因为生产的数据有点多,投标的过程有点长,我们为了加快进度,找了好几个人同时来执行这 HTTP请求,导致最后出现了问题,最后发现写测试脚本的这个同事根本就没有考虑并发的情况,才导致出现了问题。 我们也做了很多的活动,记得做一个网贷之家的一个活动的时候,活动上线比较紧张,我们团队曾经连续工作超过 30 个小时(一天一夜再一天),当天晚上我 2点左右写完程序,然后测试从 2 点到早上 9 点,最终确认没有任何问题,才进行投产。 半夜公司没有暖气,我们实在冻的不行了,就在办公室跑步,从这头跑到那头,第二天上线之后,又害怕出现问题,监控了一天,确认没有任何问题,才到下午正常下班回家,那时候真是激情满满呀。 说到做活动肯定少不了羊毛党,说哪一家互金公司没有遇到过羊毛党那很少见,而且现在的羊毛党规模简直逆天了,我们用户里面就有一个羊毛党在两三天之内邀请了六七千位用户。 如果说邀请一个用户送 1元,那这个用户就可以搞几千块一次,而且有很多专业的网站、QQ群、微信公共账号都是他们的聚集地,哪天哪个平台有活动门清,他们写的淘羊毛操作手册有时候比我们官网的帮助文档还清晰。 所以做活动的时候要考虑特别周全,各种限制,有封顶、有预案、讲诚信,只要是符合我们活动规则的坚决按照流程走。 还有一个有趣的事情,APP 推送,一次我在公交车上就看到 xx 盒子 APP 弹出 hhhhh 的推送,这个事情我们也搞过。 因为在调试的时候生产和测试就差了一个参数,有时候开发人员不注意就把生产参数部署到 uat环境了,测试一发送就跑到生产了,这方面只能严格按照流程管理来防止。 其实还有很多问题:Mongodb 集群和 MySQL 的同步出现的一些状况、后台大量数据查询下的 SQL 优化、Golang 使用 mapreduce碰到的问题。 其实每次出现问题都是对团队一次非常好的锻炼机会,通过发现问题,定位问题,解决问题,再次回过头来反思这些问题;重新梳理整个环节,举一反三避免下次再次出现类似的问题。 正是因为经历这些种种的困难、考验才让团队变的更强大更稳定,也更体现了流程的重要性,更是避免再次发生类似问题。 (编辑:ASP站长网) |