前Google工程师谈分布式系统的特点以及设计理念(2)
因为分布式系统的服务器都是廉价的PC服务器,硬件不能保证100%可靠,所以分布式系统默认每台服务器随时都可能发生故障挂掉.同时分布式系统必须要提供高可靠服务,不允许出现单点失效,因此分布式系统里运行的每个应用服务都有多个运行实例跑在多个节点上,每个数据点都有多个备份存在不同的节点上.这样一来,多个节点同时发生故障,导致某个应用服务的所有实例都挂掉、或某个数据点的多个备份都不可读的概率大大降低,进而有效防止单点失效. 通常情况,不要让服务器满负荷运行,服务器长时间满负荷运行的话,出故障的概率显著升高.所以分布式系统采用一大堆中低性能的PC服务器,尽可能把负载均摊到所有服务器上,让每台服务器的负载都不高,保证集群整体稳定性. 4. 分布式系统尽可能减少节点间通讯开销如前所述,分布式系统的整体性能瓶颈在于内部网络开销.目前网络传输的速度还赶不上CPU读取内存或硬盘的速度,所以减少网络通讯开销,让CPU尽可能处理内存的数据或本地硬盘的数据,能显著提高分布式系统的性能.典型的例子就是Hadoop MapReduce,把计算任务分配到要处理的数据所在的节点上运行,从而避免在网络上传输数据. 5. 分布式系统应用服务最好做成无状态的应用服务的状态是指运行时程序因为处理服务请求而存在内存的数据.分布式应用服务最好是设计成无状态.因为如果应用程序是有状态的,那么一旦服务器宕机就会使得应用服务程序受影响而挂掉,那存在内存的数据也就丢失了,这显然不是高可靠的服务.把应用服务设计成无状态的,让程序把需要保存的数据都保存在专门的存储上,这样应用服务程序可以任意重启而不丢失数据,方便分布式系统在服务器宕机后恢复应用服务. 比如,在设计网站后台的时候,对于用户登陆请求,可以把登陆用户的session相关信息保存在Redis或Memcached等缓存服务中,这样每个网站的后台实例不保存用户登录状态,这样即使重启网站后台程序也不丢失用户的登录状态信息;如果把用户的session相关信息保存在网站后台程序的内存里,那一旦受理用户登录的网站后台程序实例挂掉,必然有用户的登录状态信息会丢失. 总而言之,分布式系统是大数据时代企业级应用的首选平台,它有良好的可扩展性,尤其是横向可扩展性(Scale Out),使得分布式系统非常灵活,能应对千变万化的企业级需求,而且降低了企业客户对服务器硬件的要求,真正能做到应用服务层面的弹性扩展(auto-scaling). 作者介绍王璞,2002年北京航空航天大学获得力学学士学位,2007年北京大学获得计算机硕士,2011年美国George Mason University获得计算机博士学位,研究方向机器学习,发表十余篇机器学习以及数据挖掘相关论文.毕业后在硅谷先后供职StumbleUpon,Groupon和Google三家公司.专长海量数据处理,分布式计算,以及大规模机器学习.于2014年回国创办数人科技,专注于为企业客户提供大数据分析处理一站式解决方案. 文章出处:聊聊架构 (编辑:ASP站长网) |