当前位置:首页 > 中文版 > 技术中心 > 成功案例 > 内文

用户指南

解决方案

HPC在华南理工大学的成功应用


案例中文标题(可带副标题):
宝德HPC在华南理工大学的成功应用
解决方案供应商名称:(全称)
深圳宝德科技股份有限公司
解决方案供应商网站域名:
最终用户公司名称:(全称)
华南理工大学
最终用户网站域名:
http://www.scut.edu.cn/
本成功案例类型:
(如:电子商务、电子教育等)
教学科研的大型科学问题如蛋白质对比等进行并行计算和深度计算
 
业务挑战
最终用户简介:
最终用户公司的简要描述,包括所处行业。
华南理工大学是直属教育部的全国重点大学,坐落在南方名城广州。 经过五十多年的建设和发展,华南理工大学成为立足华南,面向全国,以工为主,理工结合,管、经、政、法、文、艺协调发展的综合性大学。 

校内设有中国教育和科研计算机网华南网络中心、广东省教育和科研计算机网络中心学校治学严谨,形成了团结、勤奋、求实、创新的优良校风,在华南理工引入高性能计算,有助于推进新的科研项目,提供数据论据。
最终用户面临的问题:
详细描述在信息时代,来自内部或外部的压力与困扰,并突出客户公司所面临的业务问题及挑战。以及在行业竞争中面临的机遇
华南理工大学高性能计算系统是将为教学科研的大型科学问题等进行并行计算和深度计算而需要建立的,属于计算密集型高性能计算项目。对LINKPACK值LINKPACK效率等要求达到最好。对研究方向所涉及的大规模高复杂性系统模型验证算法、大规模数据处理与服务等问题的研究提供有效的支撑平台,对在整个实验室运转过程中的各种高性能与大容量应用要求和服务提供支撑平台。
从整体的角度考虑,我们推荐宝德HPC系统。优势是科研项目研发要求计算周期短、整体TCO成本降低、有很好的系统扩展能力,小型机不能很好的满足发展需要。
 
最终用户决定启动电子商务(或网络系统)的原因及所要达到的目的(目标)

切实实现高性能并行计算应用分析

高性能并行计算的应用软件位于高性能计算生态系统的最上层,针对不同的行业有专业的产品,针对各个领域的科学与工程计算应用,直接为用户创造价值。

这些软件原来大多运行在大型主机上,是面向多个处理器、多进程、多任务的单节点软件,进程之间的通信通过大型主机操作系统的消息机制进行,消息机制的启动通过函数进行调用。

本系统中,应用软件面向教学和科研应用领域的多个方面基于多节点IA架构系统,进程或任务之间的通信,基于多节点集群的中间件提供的并行通信库MPI,物理层是基于标准互联以太网系统。并行库的启动,通过特定的程序语句进行调用。

高性能应用软件总体概括分类:

多媒体运算

主要使用整型和双精度运算。包括图形图像处理和三维图像生成的高性能计算系统,强调计算节点的多媒体计算功能。计算科学院的大气科学和流体力学应用中需要的许多模拟仿真计算都属于这类计算。
 
科学计算
主要使用浮点运算功能,这也是目前高性能计算系统的最主要应用领域。比如:高分子运动分析、石油勘测分析等。计算科学院的大气科学、固体力学、分子力学、流体力学、有限元分析等的主体计算都属于这类计算,这类计算需要系统具有强大的浮点运算能力。本项目的计算属于此类应用。
数据库应用
主要使用逻辑计算和I/O操作。包括数据库集群系统和网格数据库系统的应用。强调计算节点有很强的I/O处理能力,同时,整个高性能计算系统具有足够的外接存储空间。本系统结合此类应用,奠定未来网格计算的基础。
为积极地帮助最终客户解决面临的难题,英特尔以及解决方案供应商参与其中的热情及努力。
 INTEL和宝德技术人员针对华南理工的项目特点,投入极高的专注和热情,在华南理工项目前期进行了详细的测试分析,提出系统优化和移植的策略,帮助客户将微分方程数值计算并行模拟器勘测系统移植到IA平台上。
Intel还提供了系列的优化工具、编译工具、集群工具等众多高性能计算组件,为IA架构、标准互联的高性能计算系统应用提供高效率的保证。成为本次HPC项目成功实施的关键。 
  
电子商务解决方案:
解决方案的描述
阐述基于英特尔架构的平台为最终用户的系统建设带来怎样的收益
在Intel的支持下,宝德科技、华南理工大学以及Intel三方以宝德IA 64位双路安腾2为计算节点的宝德Power Cluster8000I高性能计算机系统,采用免费OSCAR中间件实现节点管理、任务分发和集群监控,使用Infiniband MPI的优化通信库模块来实现节点之间的进程通信,近乎达到大型机中多进程间消息传输机制的效率,再加上一套完整的Intel优化编译工具和函数库等软件来优化数科院的应用,使系统的性能得到充分的发挥,成为高校高性能计算系统推广的表率之一。
需要包含下列信息:
·   项目背景
·   解决方案供应商是如何以及何时开始与最终用户合作的?
·   解决方案供应商在项目准备过程中是如何与最终用户合作的?
·    选择解决方案的过程是怎样的?
·    描述项目实施及开发阶段的情况
 
近年来,高教体系的专项科研项目依托国家863计划,气象建模、模拟撞车试验、人类基因组图谱绘制以及模拟核爆炸等各种与人类生命息息相关的重要领域都要用到 HPC 。高性能计算(HPC)本身通常用于处理世界上最复杂和艰巨的计算难题,并往往能够彻底解决这些问题。突飞猛进的性能、急剧下降的成本以及势如潮涌的需求等众多因素,促使 HPC 迅速走出科研实验室,步入主流商业领域。
2005-3月,由于2004年以来,宝德科技已经和北京大学、国家气象局、南京师范大学、华南工业大学等等多家科研单位进行了HPC的项目合作,在高校的科研计划中关注到华南理工大学需要类似的计算压力设备,从而开始针对性的洽谈和合作;
立足宝德前期的成功合作案例和经验,在INTEL的大力支持下,宝德通过长达2个月的校方应用方向和需求分析,运用INTEL解决方案中心的测试条件,同时兼顾后期校方的更大规模网格计算的扩展需要,针对性的推出了POWER 8000 HPC应用方案;
从CPU/内存/硬盘/容灾/网络拓扑/系统带宽/管理平台/电源系统/机房管理等多个方面,宝德HPC解决方案充分结合客户的实际需要,华南理工大学高性能计算计算集群系统是一个是基于网络、面向科研等的大型高性能并行计算系统,该系统的基础是主控节点、计算节点等硬件基础平台的建设和互联系统的建设。宝德科技为华南理工大学高性能集群系统可提供标准的Intel服务器平台系统,先进的高性能服务器集群系统,具有实时多任务并行操作的高性能、高可用性、高稳定性、可靠性、可扩展性等优势。英特尔服务器采用标准的Intel IA架构机架式设计,及根据系统环境的各种物理机械、电磁兼容性设计及冗余设计等,都严格按照国家规范进行。

宝德与Intel联合成立的Intel Solution Center(ISC)设有正规的测试实验室,从产品、系统的研发开始就严把质量关,在网络环境下对各种新产品、新的解决方案系统进行各种满负荷的系统级模拟测试,保证为市场不断提供高稳定、高可用的服务器平台系统。
业务方面:
解决方案供应商请从业务及技术角度说明解决方案所给最终用户带来的收益:
业务方面:收入的增长、销售、生产率提高、成本的减少,产品质量、运行性能、客户满意度、员工满意度等;
 
宝德IA 64位双路安腾2为计算节点的宝德Power Cluster8000I高性能计算机系统,采用免费OSCAR中间件实现节点管理、任务分发和集群监控,使用Infiniband MPI的优化通信库模块来实现节点之间的进程通信,近乎达到大型机中多进程间消息传输机制的效率,再加上一套完整的Intel优化编译工具和函数库等软件来优化数科院的应用,使系统的性能得到充分的发挥,成为高校高性能计算系统推广的表率之一。
采用基于Itanium2处理器的计算平台和Infiniband互联网络,在多个测试实例中,用Intel编译器编译应用程序和MPI库函数比用GNU编译器获得53%-60%的性能提升;
在相同测试条件下,采用Infiniband互联网络比采用GigE网络有30.2%-38.6%的性能提升。在Infiniband计算网络环境中,处理器负荷很高,接近99%,而在GigE网络计算环境中,处理器负荷下降到60&-70%,因此,我们可以推断,如果增加计算节点数,在Infiniband网络环境中得到的性能提升会更高。
“为大气科学、固体力学、流体力学、有限元等进行并行计算和深度计算的需要而建立的HPC系统。对研究方向所涉及的大规模高复杂性系统模型验证算法、大规模数据处理与服务等问题的研究提供了有效的支撑平台,性能超过语气,而成本投入比小型机集群节省60%。”―――――使用者非常满意。
技术方面:
基于标准英特尔架构(IA)的稳定性、可扩展性、可靠性、可用性、灵活性、价格适中度等,从中来揭示,选择英特尔平台和服务的缘由;
 
宝德高性能计算集群系统分层次设计,按照Intel的高性能计算生态系统部署,自上而下,按照:HPC并行应用程序→中间件集群管理和通信库以及各类软件优化工具→操作系统→计算节点和主控节点的硬件平台→系统环境的部署设计:包括散热、电源、空间布局等规范化的设计。
Intel高性能计算生态系统是Intel在业界多年研究和分析的结晶,科学的层次化部署,将复杂的大型并行计算平滑移植到性价比良好的IA架构的平台上,并保证相当的效率,不但为大型并行计算问题开拓出了新的解决方案,也为未来的网格计算做好了相当的理论设计基础。
本系统采用纯英特尔服务器机架式设计,继承了Intel服务器平台七大技术,保证高性能计算系统平台的高可靠、高可用和可维护性:
指示灯引导诊断(Light-Guided Diagnostics):提高可维护性和故障的迅速恢复。
电源和散热空间(Power and Thermal Headroom):进行电源和散热工程设计预算,以实现最高性能。
主动气流控制(Active Airflow Control):提供机箱散热和风扇控制,保证服务器冷却和安静。
硬盘稳定技术(Drive Stabilization Technology):提高硬盘的可靠性、使用寿命和性能
驱动器电源隔离(Drive Power Isolation):为热插拔硬盘提供关键紧急保护
多路径引导(Multi-Path Boot):保证系统即使在出现许多基础错误时也能正常启动。
验证压力测试套件(Validation Stress Test Suite):有助于确保最新高性能服务器的数据完整性
并根据系统环境的各种物理机械、电磁兼容性设计及冗余设计等,严格按照国家规范进行。宝德与Intel联合成立的Intel Solution Center(ISC)以及宝德工厂都设有正规的测试实验室,相辅相成,从产品、系统的研发开始就严把质量关,在网络环境下对各种新产品、新的解决方案系统进行各种满负荷的系统级模拟测试,保证为华南理工大学提供高稳定、高可用的服务器平台系统。
商业价值:
向其他客户推荐从中得出的经验与收获,以及带来的商业价值。并使面临同样问题的客户相信英特尔能够通过开放式体系结构(标准)以及与业界众多技术领先者的广泛合作关系来实现最佳的电子商务解决方案
扩展能力适应未来
宝德科技的高性能计算集群系统由于采用了业内领先的技术,所以对未来的扩展能力极强,用户完全可以放心将来的集群扩展问题。宝德与Intel在这方面积累了相当多的经验,因此可为用户提供专家级的服务和专业的建议,为用户节省每一笔扩展费用。
易于部署易于管理
宝德高性能计算集群系统采用专业的集群管理软件,实现了集群部署的自动化,快速化,同时使整个集群系统更易于管理员管理,形成了一套单一映像的集群软件架构。
开放通用计算平台
宝德高性能计算集群系统的软件和硬件以及基础架构都力求规范、标准、开放、通用,以方便用户使用和在其平台上开发自己的应用。因此,该平台可最大限度的提高应用的效率和移植性,适合于石油勘探、数值气象预报、流体力学分析、CFD、基因科学、多媒体、金融数据挖掘分析等多种领域多种应用的部署。
对选择基于英特尔架构服务器的评述:
 
优秀的解决方案加之优秀的HPC组件,宝德为华南理工开辟了高性能计算的先河,同时后续我们还会再建不同的集群系统,为每个科研部都建一套,打造高校高性能计算榜样。
 
华南理工:吴洋之
解决方案供应商对选择基于英特尔架构服务器的
本次采用INTEL架构服务器搭建的HPC环境,充分体现了领先一代的Intel IA平台从研发到制造工艺,Intel积累了近二十年的技术结晶,厚积薄发,为高性能计算研究领域提供最好的计算平台。
―――张云   深圳宝德科技有限公司总经理
最终客户对供应商出色工作的评述:
 
优秀!相信后续的合作会更加顺利!
李宝琛    华南理工大学网络中心副主任

推荐系统配置
 
以及该系统所选用的
系统配置:
硬件平台
 
 
 
 
硬件环境:
 
服务器机型
处理器
内置两颗1.6GHz英特尔Itanium2 64位处理器
内存
2GB ECC DDR RAM
硬盘
Ultra 320 SCSI硬盘,硬盘容量73GB
网卡
Intel主板集成的双千兆以太网卡Intel Pro/1000 MT
其他
 
软件平台
软件环境:
操作系统:RedHat Linux AS 3.0(支持64位应用)
数据库:
应用软件系统:MPICH(RedHat Linux自带的模块)
其他:GNU C/C++编译器、Intel C/C++编译器、Total View调试工具、Intel Vtune调试工具、Intel®Cluster Tools集群工具(生成、分析和优化集群应用),
Trace Collector
Trace Analyzer
此案例中的最终用户,涉及到的相关厂商和解决方案供应商
 
INTEL
ROCKS
 
系统拓扑结构图
 
拓扑图:
 

 丛中获得的经验与收获:
详细阐述最终用户公司所获得的经验与收获
 
宝德高性能计算集群系统的软件和硬件以及基础架构都保证了规范、标准、开放、通用,可以方便使用和在其平台上开发自己的应用。最大限度的提高了应用的效率和移植性,适合于客户在流体力学分析、CFD、基因科学等多种领域多种应用的部署。
 
具体描述这些经验收获对其他面临同样问题的最终用户的建议,以供参考
 
      HPC系统从各个关键部件如节点、网络拓扑、中间件、管理平台的选用最终决定了HPC系统本身的稳定和可靠,以及最关键的效能。宝德集团和INTEL在服务器高端应用行业的紧密协作,立足于稳定和性能卓越的服务器平台、管理工具,整合的HPC系统在多方面符合实际需要。
 
对解决方案的由衷赞美,对项目取得成功的评述:
  “利用现代小型服务器,取代UNIX主机,降低总拥有成本,实现高性能并行运算,宝德为华工做的非常成功!谢谢!!”
          李云之    华南理工大学副校长