电子科技大学生命学院

高性能HPC+AI方案

核心需求
此次项目中,电子科技大学生命学院某团队对神经电生理、磁共振成像和理论分析,融合神经生物学、认知心理学和信息科学的理论与技术,开展脑功能与重大脑疾病的神经信息基础研究,发展脑机交互技术、神经系统疾病诊疗技术以及受脑功能启发的脑样信息处理技术,提供自研AI算法等应用的需求,同时还要满足研究团队各个课题小组共计50+人员对超算中心不同应用环境的要求。对网络、数据,设备使用等安全也有一定要求。日常运维需要简单便捷也是核心需求之一。



四川强民科技有限公司针对电子科技大学生命学院某团队的需求,提出了联想HPC高性能集群+高性能深度学习的解决方案;通用机架式服务器节点和GPU混合计算节点组成的计算混合集群架构。计算集群面向高性能计算设计,具有可伸缩、高度可管理、高可靠、高可用、系统软硬件运行状态监控等混合平台应用等,HPC系统采用了Intel最新一代Cascade Lake架构处理器以及Nvidia Tesla  V100用于Data C enter GPU计算卡。总计:264个物理计算核心、1.5TB物理内存和14teraFLOPS的SINGLE-PRECISION、DEEP LEARNING 224 teraFLOPS能力;后续还可扩展到最大60TB物理内存和140teraFLOPS的SINGLE-PRECISION、DEEP LEARNING 2240 teraFLOPS能力

方案特点
 


整套系统搭载联想智能超算平台(以下简称LiCO)是联想数据中心集团(DCG)开发的,针对高性能计算(HPC)和人工智能(AI)的一站式解决方案,在一套集群中通过统一的资源调度,可以同时支持HPC作业和AI作业的运行。LiCO集成了集群需要的集群调度软件、监控软件、计算库、分布式文系统等,使用LiCO可以快速的部署好一个HPC和AI集群。日常运维简单便捷
提供了统一的web访问接口,集群管理员可以使用LiCO方便的管理集群,HPC用户可以使用LiCO方便的提交和管理HPC作业,AI用户可以使用LiCO进行AI模型的训练。完美解决了研究团队各个课题小组人员共计50+对超算中心不同使用环境的要求,使用和管理也简单易用。


针对安全防护

整套方案安全部分采用深信服下一代防火墙产品,能够在事前对内部的服务器进行自动识别,并且还能自动识别服务器上开 放端口和存在的漏洞,弱密码等风险,同时还能判断识别出的资产是否有对应的安全防护策 略以及是否生效。
该产品兼容传统防火墙的所有功能特性,包括交换/路由、访问控制,A-A/A-S 双机热备、软硬件 Bypass、系统管理、日志报表、会话管理、抗 DDoS 攻击、应用代理、DHCP/DNS等等。该产品在事中防御层面融合了多种安全技术,提供了L2-7层完整的安全防御体系,确保安全防护不存在短板,同时还能通过安全联动功能加强防御体系的时效性和有效性,括模块间的联动封锁,同云端安全联动,策略的智能联动等。此外,,通过国家漏洞信息库,谷歌恶意链接库等多来源威胁情报的输入,安全事件爆发之前就提前做好防御的准备。


方案实施