用户指南
- 解决方案
宝德HPC在华中科技大学物理学院的成功应用
宝德HPC在华中科技大学物理学院的成功应用
华中科技大学是国家教育部直属的全国重点大学,由原华中理工大学、同济医科大学、武汉城市建设学院于2000年5月26日合并成立,是首批列入国家“211工程”重点建设和“985工程”建设的大学。
学校现有工学、医学、管理学、理学、哲学、经济学、法学、教育学、文学、史学、农学等11大学科门类,设有本科专业78个,硕士学位授权点248个,博士学位授权点173个,博士后科研流动站29个;国家级重点学科29个,省部级重点学科28个。学校占地7000余亩,校园内树木葱茏,碧草如茵,环境优雅,景色秀丽,绿化率达90%以上,被誉为“森林中的大学”。学校为师生员工提供了一流的后勤服务,高性能的网络服务以及丰富的图书资源;同世界上的100余所高校及科研院所建立了合作交流关系,每年有百余名世界知名学者和专家来校访问、讲学。
在“211工程”和“985工程”建设中,学校突破传统学科界限,整合多学科资源,积极参与国家创新体系的建设,构建高水平、跨学科的科技武汉光电国家实验室、数字制造装备与技术、引力研究、移植医学、环境与健康、国防科技等11个科技创新平台以及“科技发展与人文精神”哲学社会科学创新基地进入了全面建设。
按照“应用领先,基础突破,协调发展”的方针,华中科技大学创建了以国家和部省重点实验室为核心的基础研究层、以国家工程研究中心为先导的高新技术研究层、以国家技术转移中心和联合实验室为重点的技术开发层等三个层次纵向部署的科技创新体系。
目前,以华中科技大学为依托单位的武汉国家光电实验室投入了全面建设,脉冲强磁场实验装置重大科技基础设施项目获准立项。学校还拥有4个国家重点实验室和1个国防科技重点实验室,26个省部重点实验室;5个国家工程研究中心,7个省部级工程研究中心,4个省人文社科重点研究中心。
华中科技大学物理学院高性能计算系统是将为教学科研的大型科学问题等进行并行计算和深度计算而需要建立的,属于计算密集型高性能计算项目。对LINKPACK值LINKPACK效率等要求达到最好。对研究方向所涉及的大规模高复杂性系统模型验证算法、大规模数据处理与服务等问题的研究提供有效的支撑平台,对在整个实验室运转过程中的各种高性能与大容量应用要求和服务提供支撑平台。
原先的应用采用小型机的构建方式,TCO成本和维护成本都很高,而现在的科研项目研发要求计算周期短、整体TCO成本降低、有很好的系统扩展能力,小型机不能很好的满足发展需要。
最终华中科技大学决定启动电子商务(或网络系统)的原因及所要达到的目的(目标) 切实实现高性能并行计算应用分析
高性能并行计算的应用软件位于高性能计算生态系统的最上层,针对不同的行业有专业的产品,针对各个领域的科学与工程计算应用,直接为用户创造价值。
这些软件原来大多运行在大型主机上,是面向多个处理器、多进程、多任务的单节点软件,进程之间的通信通过大型主机操作系统的消息机制进行,消息机制的启动通过函数进行调用。
本系统中,应用软件面向教学和科研应用领域的多个方面基于多节点IA架构系统,进程或任务之间的通信,基于多节点集群的中间件提供的并行通信库MPI,物理层是基于标准互联以太网系统。并行库的启动,通过特定的程序语句进行调用。
高性能应用软件总体概括分类:
√多媒体运算
主要使用整型和双精度运算。包括图形图像处理和三维图像生成的高性能计算系统,强调计算节点的多媒体计算功能。计算科学院的大气科学和流体力学应用中需要的许多模拟仿真计算都属于这类计算。
√科学计算
主要使用浮点运算功能,这也是目前高性能计算系统的最主要应用领域。比如:高分子运动分析、石油勘测分析等。计算科学院的大气科学、固体力学、分子力学、流体力学、有限元分析等的主体计算都属于这类计算,这类计算需要系统具有强大的浮点运算能力。本项目的计算属于此类应用。
√数据库应用
主要使用逻辑计算和I/O操作。包括数据库集群系统和网格数据库系统的应用。强调计算节点有很强的I/O处理能力,同时,整个高性能计算系统具有足够的外接存储空间。本系统结合此类应用,奠定未来网格计算的基础。
为积极地帮助最终客户解决面临的难题,英特尔以及解决方案供应商参与其中的热情及努力。 INTEL和宝德技术人员针对华中科技大学物理学院的项目特点,投入极高的专注和热情,在华中科技大学项目前期进行了详细的测试分析(基于安腾2平台),提出系统优化和移植的策略,帮助客户将微分方程数值计算并行模拟器勘测系统移植到IA平台上。
Intel还提供了系列的优化工具、编译工具、集群工具等众多高性能计算组件,为IA架构、标准互联的高性能计算系统应用提供高效率的保证。成为本次HPC项目成功实施的关键。
在Intel的支持下,宝德科技、华中科技大学以及Intel三方以宝德IA 64位双路安腾2为计算节点的宝德Power Cluster8000I高性能计算机系统,采用免费OSCAR中间件实现节点管理、任务分发和集群监控,使用Infiniband MPI的优化通信库模块来实现节点之间的进程通信,近乎达到大型机中多进程间消息传输机制的效率,再加上一套完整的Intel优化编译工具和函数库等软件来优化数科院的应用,使系统的性能得到充分的发挥,成为高校高性能计算系统推广的表率之一。
近年来,高教体系的专项科研项目依托国家863计划,气象建模、模拟撞车试验、人类基因组图谱绘制以及模拟核爆炸等各种与人类生命息息相关的重要领域都要用到 HPC 。高性能计算(HPC)本身通常用于处理世界上最复杂和艰巨的计算难题,并往往能够彻底解决这些问题。突飞猛进的性能、急剧下降的成本以及势如潮涌的需求等众多因素,促使 HPC 迅速走出科研实验室,步入主流商业领域。
2005-3月,由于2004年以来,宝德科技已经和北京大学、北京理工、国家气象局、华南工业大学等等多家科研单位进行了HPC的项目合作,在高校的科研计划中关注到南京师范大学需要类似的计算压力设备,从而开始针对性的洽谈和合作;立足宝德前期的成功合作案例和经验,在INTEL的大力支持下,宝德通过长达2个月的校方应用方向和需求分析,运用INTEL解决方案中心的测试条件,同时兼顾后期校方的更大规模网格计算的扩展需要,针对性的推出了POWER 8000 HPC应用方案;
从CPU/内存/硬盘/容灾/网络拓扑/系统带宽/管理平台/电源系统/机房管理等多个方面,宝德HPC解决方案充分结合客户的实际需要,华中科技大学高性能计算计算集群系统是一个是基于网络、面向科研等的大型高性能并行计算系统,该系统的基础是主控节点、计算节点等硬件基础平台的建设和互联系统的建设。宝德科技为华中科技大学高性能集群系统可提供标准的Intel服务器平台系统,先进的高性能服务器集群系统,具有实时多任务并行操作的高性能、高可用性、高稳定性、可靠性、可扩展性等优势。英特尔服务器采用标准的Intel IA架构机架式设计,及根据系统环境的各种物理机械、电磁兼容性设计及冗余设计等,都严格按照国家规范进行。宝德与Intel联合成立的Intel Solution Center(ISC)设有正规的测试实验室,从产品、系统的研发开始就严把质量关,在网络环境下对各种新产品、新的解决方案系统进行各种满负荷的系统级模拟测试,保证为市场不断提供高稳定、高可用的服务器平台系统。
宝德IA 64位双路安腾2为计算节点的宝德Power Cluster8000I高性能计算机系统,采用免费OSCAR中间件实现节点管理、任务分发和集群监控,使用Infiniband MPI的优化通信库模块来实现节点之间的进程通信,近乎达到大型机中多进程间消息传输机制的效率,再加上一套完整的Intel优化编译工具和函数库等软件来优化数科院的应用,使系统的性能得到充分的发挥,成为高校高性能计算系统推广的表率之一。
采用基于Itanium2处理器的计算平台和Infiniband互联网络,在多个测试实例中,用Intel编译器编译应用程序和MPI库函数比用GNU编译器获得53%-60%的性能提升;
在相同测试条件下,采用Infiniband互联网络比采用GigE网络有30.2%-38.6%的性能提升。在Infiniband计算网络环境中,处理器负荷很高,接近99%,而在GigE网络计算环境中,处理器负荷下降到60&-70%,因此,我们可以推断,如果增加计算节点数,在Infiniband网络环境中得到的性能提升会更高。
“为大气科学、固体力学、流体力学、有限元等进行并行计算和深度计算的需要而建立的HPC系统。对研究方向所涉及的大规模高复杂性系统模型验证算法、大规模数据处理与服务等问题的研究提供了有效的支撑平台,性能超过语气,而成本投入比小型机集群节省60%。”―使用者非常满意。