如何建造一台超级计算机
《如何建造一台超级计算机》要点: 你需不需要一台每秒可以进行数百万亿次浮点运算的机器?或者,你想不想知道点关于你家地下室里的超级计算机是如何上电运行的趣事儿?建造一台属于自己的计算集群——亦即超级计算机——是每个闲得发慌还有钱烧的专业极客都能做到的事情!从技术上来讲,一台现代多处理器超级计算机实际上是一个计算机网络,这些计算机并行地工作以解决特定的计算问题.本文将从硬件和软件两个角度为你解开建造一台超级计算机的神秘面纱. Steps1.首先要确定硬件部件和所需要的资源你需要一个头节点(head node),至少一打的计算节点(compute node),一台以太网交换机,一个电源分配单元(power distribution unit)和一个服务器机架.计算一下电力消耗,冷却需求和占地需求.同样,你需要确定你的私有网络的IP地址段,节点的命名,预计使用的软件包以及搭建服务集群所用的技术(后面会有更多解释).
2.建立计算节点你需要自己组装计算节点,或者你也可以使用预配置的服务器.
3.将服务器装在机架上安装的时候从下面开始,这样可以避免机架头重脚轻.你可能会需要朋友的帮助才能完成这件事——这么多的服务器将非常的重,把它们放到机架的滑轨上会非常困难. 4.在机架顶端安装以太网交换机现在来配置交换机:允许9000字节的大的帧,将IP地址设置为你在第一步里面确定的静态地址,关闭例如SMTP嗅探这样不必要的路由协议. 5.安装能源分配单元根据目前你的节点的最大需求,可能220V就能满足你的高性能计算需求了. 6. 一切都安装妥当之后,就可以开始配置环节了Linux是高性能计算集群(HPC Cluster)操作系统的事实标准,这不仅因为Linux是科学计算的理想环境,也是由于在数以百计甚至千计的节点上安装的时候,Linux不会产生任何花费.设想一下,在如此多的节点上安装Windows会花掉你多少钱呢?
7. 安装消息传送界面、资源管理器以及其他必须的库如果上一步里你没有选择Rock做为你的节点的操作系统,那么现在你需要手动设置并行计算机制所必需的软件.
8.将所有的计算节点接入网络头节点负责将任务分配到计算节点,计算节点再把结果返回回来,节点间的消息传递也是如此,所以当然是越快越好了.
9.对集群进行测试在你把你强大的Top500计算集群交付给客户之前,你还要测试一下它的性能.HPL(High Performance Lynpack)评测软件包是测试集群的计算速度的常见选择.你需要从源代码编译它,编译的时候根据你选择的架构,打开所有可能的优化选项.
(编辑:ASP站长网) |