宝德AI助力珠海复旦创新研究院HPC&AI集群

宝德AI助力珠海复旦创新研究院HPC&AI集群
2021年07月21日 18:58 精彩生活视点

研究院作为科学研究的主阵地,正扛起推进高精尖技术研发和应用的大旗,而构建科研工作所需的超强算力和加速科研成果转化,高性能计算和人工智能平台不可或缺。正因为如此,各高校和研究院均把HPC&AI集群搭建提上日程。

珠海复旦创新研究院

“大湾区”的科研摇篮

珠海复旦创新研究院(后简称“研究院”),是广东省珠海市人民政府与复旦大学共建的新型研发机构,依托复旦大学的学科、人才、技术、校友资源优势,主要从事创新成果转移转化和高端人才引进培养,研究领域包括芯片设计、生物医药、新材料、海洋科技、物联网智慧城市,聚焦建设具有国际影响力的工程技术研发平台、企业孵化平台与技术人才培养平台,并根据珠海发展需求逐步拓展合作领域,为珠海建设“粤港澳大湾区”创新高地提供技术支撑。

当下,随着研究院不断发展壮大、各职能部门日益完善加上各学科研究领域难度加深,对高性能计算和人工智能平台的迫切需求愈发突出。宝德团队在了解到研究院有HPC&AI集群需求后,第一时间协调产品经理与院方沟通交流,详细地分析和挖掘院方需求,并拉通技术层,提供超强算力、安全稳定兼具高性价比的解决方案。

最终,凭借在方案、实施、服务、价格等方面的诸多优势,PK掉一众强劲的竞争对手,取得该项目的合作机会。

助科研腾飞,

宝德是如何实现的?

在此次合作中,宝德提供了涵盖宝德双路云服务器PR2710P宝德GPU训练服务器PR4904P宝德PL2402XG万兆以太网交换机,以及宝德人工智能管理平台PLStack的整体解决方案,集群架构基于更先进、更合理、更易于拓展和管理的原则搭建,充分满足了研究院不断增长的算力需求,提高了科研计算的整体效率,并且大大降低后期运维和管理方面的成本。

尤其值得关注的是,在此次项目中被使用到的“黑科技”——宝德人工智能管理平台PLStack,它提供了基于 Docker + K8s技术实现整合现有 GPU 设备资源,拥有更好的对 GPU 资源的分配、管理、调度和监控的能力;支持主流深度学习框架(Tensorflow、PyTorch、Caffe 等),方便快速部署训练环境,并且支持多人在线实验;同时,PLStack平台能够通过更直观的 UI 界面对资源进行管理,为可能使用计算资源的用户以及管理人员提供易用的界面。

从以上图片也可看出,宝德人工智能管理平台PLStack,主要负责集群中的硬件监控及调度,提高 GPU 资源的利用率,极大方便管理员对HPC综合性能比传统架构足足提高 50 倍!

目前研究院HPC算力资源十分充足,满足院方多部门、多用户的使用需求;以太网资源分配合理化,能够针对课题组的研究方向和内容配比合理的资源;提升科研工作效率,便捷的开发环境,解决开发环境部署复杂问题;打造高性能平台,分布式训练框架下极大提升模型训练速度

能够为珠海复旦创新研究院HPC&AI集群出力献策,宝德倍感荣幸。未来,宝德将继续深耕计算领域,希望在更深层次上推动我国教科研行业高性能计算集群的建设与应用,让更多教科研工作在宝德HPC&AI集群的协助下高歌猛进。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部