电子科技大学信息工程学院

高性能HPC+AI方案

核心需求
此次项目中,电子科技大学信息与通信工程学院某团队对无线新体制通信、认知电子对抗、AI技术在通信中的应用、非合作信号处理等领域为研究课题,既需要传统的高性能计算能力,还需要兼备AI技术才通信中的应用的需求,同时还要满足研究团队各个课题小组共计70+人员对超算中心不同应用环境的要求。对网络、数据,设备使用等安全也有一定要求。日常运维需要简单便捷也是核心需求之一。
解决方案
四川强民科技有限公司针对电子科技大学信息与通信工程学院某团队的需求,提出了联想HPC高性能集群+高性能深度学习的解决方案;即CPU+GPU异构设计方案,HPC系统采用了Intel最新一代Cascade Lake架构处理器以及Nvidia Tesla  V100S用于Data C enter GPU计算卡。总计:440个物理计算核心、2TB物理内存和140 teraFLOPS的SINGLE-PRECISION、DEEP LEARNING 1120 teraFLOPS能力;后续还可扩展到最大90TB物理内存和280teraFLOPS的SINGLE-PRECISION、DEEP LEARNING 2240 teraFLOPS能力。(扩展设备硬件型号按照目前型号的情况下,也兼容下代更高性能硬件产品,计算能力拓展性也更高和灵活)






方案特点
整套系统搭载联想智能超算平台(以下简称LiCO)是联想数据中心集团(DCG)开发的,针对高性能计算(HPC)和人工智能(AI)的一站式解决方案,在一套集群中通过统一的资源调度,可以同时支持HPC作业和AI作业的运行。LiCO集成了集群需要的集群调度软件、监控软件、计算库、分布式文系统等,使用LiCO可以快速的部署好一个HPC和AI集群。日常运维简单便捷
提供了统一的web访问接口,集群管理员可以使用LiCO方便的管理集群,HPC用户可以使用LiCO方便的提交和管理HPC作业,AI用户可以使用LiCO进行AI模型的训练。完美解决了研究团队各个课题小组人员共计70+对超算中心不同使用环境的要求,使用和管理也简单易用。

  


针对安全防护


整套方案安全部分采用深信服下一代防火墙产品,能够在事前对内部的服务器进行自动识别,并且还能自动识别服务器上开 放端口和存在的漏洞,弱密码等风险,同时还能判断识别出的资产是否有对应的安全防护策 略以及是否生效。
该产品兼容传统防火墙的所有功能特性,包括交换/路由、访问控制,A-A/A-S 双机热备、软硬件 Bypass、系统管理、日志报表、会话管理、抗 DDoS 攻击、应用代理、DHCP/DNS等等。该产品在事中防御层面融合了多种安全技术,提供了L2-7层完整的安全防御体系,确保安全防护不存在短板,同时还能通过安全联动功能加强防御体系的时效性和有效性,括模块间的联动封锁,同云端安全联动,策略的智能联动等。此外,,通过国家漏洞信息库,谷歌恶意链接库等多来源威胁情报的输入,安全事件爆发之前就提前做好防御的准备

方案实施