阿里云道哥自述:重回阿里的29个月(4)
这次故障后,整个阿里云从上到下进行了很大的反思,也更让我们刻骨铭心的体会到云计算作为基础设施对客户来说意味着身家性命,这和阿里以往的业务是很不一样的。我们需要时刻心怀敬畏。我们把稳定性建设,作为了研发团队的永久性战略目标。我也把每年的9月1号,定为了云盾日,希望团队能够好好反思历史上遭遇的所有挫折。也希望能够好好的感恩和回馈那些在危难时刻对我们依旧不离不弃的客户,没有这些客户与我们一起共同成长,我们也无法走下去,走得远。 | 数据化是未来 这29个月里,我还学到了数据化的重要性。阿里是一家人工智能驱动的数据化公司,我们认为互联网公司最重要的资产就是数据。未来所有的产品改进,都应该是通过数据化驱动,而非功能驱动。如果一家公司的竞争力还依旧停留在硬件、软件的功能上,那么这是上一个时代的公司,没有什么前途。以现在的计算机编码发展水平,只要你能想得到,没有什么功能是写不出来的,缺的只是时间和投入而已。面向未来的公司一定是数据驱动的,只有数据驱动才能像滚雪球一样将竞争力做厚,才能在最短的时间内完成高效的规模化,建立起更高的门槛和壁垒。淘宝的搜索和商品推荐,取得了商业上的巨大成功,背后依赖的正是每天海量数据的计算。大约在2013年左右,淘宝用于后台数据计算的服务器数量,增幅超过了前台用于事务处理的服务器数量,这是一个里程碑,标志着阿里正式成为了一家数据化公司。 所以我们看一家公司是不是数据公司,有一个简单的判断标准,看他有多少台服务器用作了数据计算。一些传统做硬件设备的公司,和一些销售本地化软件的公司,几乎没有任何数据分析的需求,自然也谈不上是数据公司。还有一些公司,数据很多,但是没有计算的能力,只能存放在存储里,用于计算的服务器数量也很少,这也不是数据公司。 在云盾的态势感知产品中,阿里云的计算集群每天会调用超过数十万个核(我写这篇文章用的Macbook Air的CPU有两个核)用于海量数据的计算,来分析每一个客户遇到的安全问题。这些数据来自于客户在开通态势感知时授权云盾出于安全的目的进行计算。在这么大的计算量下,很多问题都是没有答案的,需要我们摸着石头过河。阿里云在安全态势感知上的挑战,是替整个安全行业在探索大数据的边界和瓶颈。 态势感知这个产品的来历也颇有意思,这个概念最早是出现在军事领域,但是欧美的安全行业里几乎没有这个概念,可是最近一年在中国变得非常热门。 2015年4月的时候,春暖花开,在西溪湿地的一个茶馆里,阿里云安全的核心管理团队开了一个为期两天的战略会,讨论未来的规划。当时参加这个会议的人还包括了肖力、云舒、老聂、方兴、王伟等人。我们当时觉得整个安全行业都出了比较大的问题,几乎没有厂商对客户的安全负责了,而且大多数安全产品用了后还是不能解决安全问题。我们在会上冥思苦想,这中间缺少的那一环到底是什么?最后憋出来四个字,就是「态势感知」。 我们认为只有用大数据的手段先解决看问题的全面性,才有可能真正解决安全问题,很多安全解决方案的失败,不是在于防护做得不好,而是在于根本没看见敌人,防护就无从谈起。因为过去缺少对原始数据的计算能力,只靠单机设备想全面的看各个纬度的数据从而分析出威胁几乎是不可能的事情。我们当时曾斟酌过要不要用「威胁感知」来表达我们的想法,最后是方兴提出建议,认为威胁感知还是不够全面,用「态势」会更合适一些。最后我领了个任务,要去把纸上的四个字「态势感知」做出来。那时候安全行业还没有人提「态势感知」这个概念。 到了2015年7月份,在北京举行的阿里安全峰会上,我正式做了一次产品发布,用的标题是「安全的未来是态势感知」,阐述了我们的理念。在此之后,国内的安全厂商忽然都开始做态势感知了。直到2016年4月19号,习大大在网络安全和信息化工作座谈会上,提出了「要树立正确的网络安全观,加快构建关键信息基础设施安全保障体系,全天候全方位感知网络安全态势,增强网络安全防御能力和威慑能力。」。于是乎,4.19讲话后,各种各样的态势感知系统如雨后春笋般冒了出来,很多厂商直接把过去的老产品比如SIEM、SOC改了个名字叫态势感知就拿出来卖。 到了2016年12月27日,这段话直接写进了国务院全文刊发的《“十三五”国家信息化规划》里,同时公安部也在规划中的下一代等级保护标准里写入了态势感知。态势感知即将成为合规性需求。 其实到今天为止,我都不知道蝴蝶的翅膀是怎么扇起来的。作为最早实践态势感知的人,我也至今还在探索什么样的系统、什么样的能力才称得上是态势感知,什么样的客户才需要态势感知。可是忽然一夜之间,行业里多出来了好多态势感知的专家,这让我很困惑。 态势感知将承载大数据在安全行业落地的使命,但是需要数据化的却不仅仅是态势感知。在2017年,云盾的产品会全面拥抱数据化,这也是我们区别于其他厂商解决方案的最大不同。比如云盾的WAF将不再是一个软件或硬件,也不是一个基于转发或流量过滤的集群,而是一个旁挂了大数据计算集群的WAF。我们将带着阿里云数十万个核的大数据计算集群和其他厂商的单机设备竞争,这是两个时代的竞争。我也期待着云盾用于后台计算的服务器数量,超过用于前台事务处理的服务器数量的那天尽快到来。 | 总结 这29个月里的每一天,对我来说,都过得非常的充实。我的性格变得比以往更加的锋利,正如我的网名「刺」一样,我比以往任何时候都更加带刺,也自然会伤到很多人。会不会得罪人永远不是我优先考虑的,因为根本没有时间去顾及别人是不是开心,时间紧迫,要做的事情却很多、很难。我常自嘲在团队内部我就像一个暴君,也因此我需要感谢所有能忍受我脾气的同事。创业不是一将功成万骨枯,创业是一个团队的成功。我很高兴我在一个值得信赖的团队,共同奋斗,建设更安全的互联网。 小编,。 (编辑:ASP站长网) |