高性能计算服务器集群系统如何解决?
HPC高性能计算服务器集群系统是高性能计算和高可用技术有机结合的性能强大、高可用的集群系统。在实际应用中,许多科学研究和商业企业的计算问题都可以通过HPC系统来解决。
HPC可以在下列领域能够帮助开发和研究人员进行建模和模拟,同时,以最快的速度计算出模拟的结果,为下一步开发和最终结构的确定提供及时可靠的依据:天气预报气象制药企业的药理分析科研人员的大型科学计算问题石油勘探中对石油储量的分析航空航天企业的设计和模拟化工企业中对分子结构的分析计算制造业中的CAD/CAM系统和模拟试验分析银行和金融业对经济情况的分析生物/生命科学中生物分子研究和基因工程计算宝德HPC系统由高性能并行计算应用系统,集群控制节点、通信库以及管理服务器,数据库存储系统,各节点操作系统,节点通信系统,各计算节点,以及系统运行环境等组成。
★高性能计算应用系统 各种并行计算的应用程序,针对不同的应用对象和问题而设计的软件系统。
★集群控制节点、通信库及管理服务器集群控制节点是HPC的核心设备,担任着运行主控程序和作业分发的任务。其上的集群管理软件是整个高性能计算系统的管理者。
HPC控制节点通过集群控制、管理及通讯库将整个系统紧密联系在一起。同时,还要负责初始化集群节点、在所需数量的节点上安装应用程序、并监视集群节点和互连的当前运行状况。
★数据库存储系统 数据库存储系统是高性能计算的后端存储系统,与主控节点相连,高性能计算的结果通过主控节点统一送到该系统进行集中存储。
该系统可以一个RAID存储阵列柜,也可以是一个存储网络,如SAN等。
★节点操作系统 因为Linux操作系统具有开放源码、容易整合和再开发的特点,所以在HPC Cluster中被普遍采纳,占到操作系统的80%以上的比例。而Windows NT受其自身的封闭环境阻碍,Linux 有大量的集群系统可供选择,适合于不同的用途和需要,保证系统可适应最新的工具,有较高的可用性。
★节点通信系统: 一个HPC系统的性能一方面由计算节点的性能决定,另一方面取决于节点通信系统。 设计节点通信系统主要考虑两个因素:延时和带宽。带宽是通信时每秒钟可以传送的最大数据量;延时是指从源节点开始发送数据到目的节点开始接收数据所需要的时间。
★ 计算节点 计算节点是高性能计算HPC系统中的单个主机系统,是构成整个HPC系统最重要的的基础部分,计算节点的计算性能直接影响着整个HPC系统的计算性能。为此,宝德推荐使用最新的双核安腾处理平台来构建计算节点。 全新的双核安腾II处理器(代码名称“Montecito”)采用更高带宽的前端总线能够以每秒 10。
6 GB 的速度在处理器和其它系统部件之间传输数据。与之相比,现有的 400 MHz 前端总线每秒只能传输 6。4 GB 的数据。在极短时间内传输更多数据,这对完成科学、石油和天然气、以及政府等行业的计算密集性应用极为关键。 采用 Montecito 的平台将提供相当于目前英特尔安腾处理器2倍的性能、3倍的系统带宽和 2。
5 倍以上的模上高速缓存。在提升性能的同时,借助于全新的电源管理技术。