国产算力赛道战火升级,瀚博锋芒已露

国产算力赛道战火升级,瀚博锋芒已露
2022年09月04日 12:28 半导体行业观察

未来的像素世界需要强大的算力,但如果像素世界只能看而不能产生,那不是我们的完整拼图,我们的目标就是把算力相关技术完美结合在一起!”钱军在2022世界人工智能大会接受《半导体行业观察》采访时强调。

钱军是总部位于上海的高端芯片公司瀚博半导体的创始人兼CEO。9月3日,瀚博半导体在2022世界人工智能大会举办AI大芯片产业落地论坛,并发布全系列新品和预览全新GPU。

科技在本质上有所偏好,使得它朝往某种特定方向。2021年我国算力核心产业规模达到1.5万亿元,成为全球第二大“算力大国”。今天,“某种特定方向”似乎逐渐开始明朗——算力时代的到来已经势不可挡。

面对未来可预见的强劲的算力需求,不仅仅大算力芯片,综合算力平台赛道也愈发火热,包括瀚博半导体在内,越来越多的本土厂商厚积薄发,展露锋芒。

“软硬兼施”,追求算力密度

“为了应对挑战,我们必须持续研发更高算力的芯片,同时,不断提高算力密度和能效比。”这是钱军在2022世界人工智能大会期间谈到的瀚博的核心任务。

瀚博半导体创始人兼CEO钱军

在今年大会上,瀚博半导体重磅推出一系列新品,值得注意的是,这些新品都是基于瀚博自主研制的统一计算架构——Vastai Unified Compute Architecture(VUCA)

VUCA架构是瀚博半导体在WAIC会议上正式推出的一款统一计算架构,整合了多款高性能计算引擎,拥有高效统一的存储管理、一致性接口和低链接延迟、完整的虚拟化功能、统一的底层软件设计、模块化的上层计算算子库和功能模块。

早在1988年,乔布斯就曾断言计算架构决定了计算的最终性能,据钱军介绍,瀚博半导体的VUCA架构让计算密集型的AI、视频、渲染任务性能得到最大化硬件加速,同时端到端缩小延时,一体化助力云端实时图形渲染、AI增强处理、视频编解码等需求。由于是软硬件联合优化,VUCA架构不仅大大提升了系统能效,还能降低客户总体的拥有成本。

基于这款架构,瀚博半导体推出了数据中心推理卡载天VA10、首款边缘AI推理加速卡载天VE1和瀚博软件平台VastStream扩展版3款新品。

其中,数据中心推理卡载天VA10搭载瀚博自研的超低延时超高吞吐AI引擎,Int8峰值算力高达400TOPS,刷新业界纪录。虽然载天VA10功耗仅为150瓦,但其整体最高推理性能却达到同功耗主流GPU的2倍以上,且延时低至后者的6%。在低延时场景(低于4毫秒的YoloV3检测算法场景)下,载天VA10的推理性能更达到同功耗市场主流GPU的3倍以上,适合直播视频增强、智慧交通管理、实时语义理解等多种需要高实时性的云端AI应用部署场景。

此外,首款边缘AI推理加速卡载天VE1也是此次瀚博半导体产品发布的创新之一。众所周知,当前边缘计算发展势头强劲,Gartner预计到2025年将有超过75%的数据在边缘侧进行处理,IDC预测到2024年全球边缘计算支出将突破2500亿美元。而在智能边缘计算快速发展的过程中,芯片则发挥着关键作用。

瀚博半导体的载天VE1兼具超低时延与超高吞吐率,吞吐率达到主流GPU的2倍,最高吞吐率下,延时不到主流GPU的5%。此外,载天VE1功耗低、且算力大,在 40-65瓦功耗下,INT8峰值算力达100 TOPS。据钱军介绍,瀚博半导体在边缘大算力应用场景下开发了人车结构化分析与工业质检场景两个DEMO,可以发现,基于超高吞吐率和超低时延的优势,载天VE1不仅适用于道路实时动态信息交互、工业的缺陷检测等低延时要求场景,还适用于智慧交通、全息路口、工业质检等边缘大算力场景。

据钱军透露,目前上述两款产品都已经在客户方面得到应用,这也是对瀚博半导体实力的肯定。钱军表示,由于数据中心需要24小时高密度运算,因此其导入十分严格,对于服务器芯片来说,互联网、数据中心是很大的护城河,如果能够迈进互联网,那就是对产品最大的认可。

基于软件生态的重要性,瀚博半导体还发布了统一软件平台VastStream扩展版。据介绍,全新软件组件,提供系统管理等三大管理工具,方便客户部署,同时其基础软件栈功能更加丰富,特性包括统一接口、灵活调度、通用AI计算、多路高效视频转码+AI增强、易编程快迁移、工具链完备等。

为更好地迎接算力挑战,瀚博半导体已经形成了一条涵盖了芯片、推理加速卡、一体机的加速计算产品线和软件整合解决方案。

AMD背景加身,建设生态为使命

当前,凭借着强大的计算能力,GPU已经成为游戏、AI、自动驾驶等多个领域的“宠儿”。在此次会议上,瀚博半导体也展示了国产7nm云端GPU芯片SG100。

据了解,瀚博半导体的这款GPU具备业界领先的图形渲染性能,拥有世界领先的超高吞吐、超高质量、低延时的编码能力,集渲染、AI、视频于一体,为云游戏、云手机、云桌面、云计算等元宇宙关键性应用场景提供深度优化。同时,SG100还提供世界一流的SR-IOV虚拟化支持,端到端整体提升用户视觉体验。

SG100的推出让瀚博正式进入了GPU市场,同时也让其加速计算产品线变得更加完善。而瀚博半导体能在成立三年多后取得如今的成就,这与其经验丰富的技术团队,以及运筹帷幄的布局有着密不可分的联系。

瀚博半导体于2018年成立,核心团队源自于 AMD,两位创始人皆曾出任AMD高管,其中创始人兼CEO钱军拥有 25 年以上高端芯片设计经验,曾带领AMD中国团队设计量产了业界第一颗7纳米图形处理器和第一颗 7 纳米 GPGPU 架构的 AI 芯片。而创始人兼CTO张磊拥有20年以上多媒体视频 IP、系统以及芯片构架设计经验,精通视频、人工智能、深度学习、SoC、GPU 和系统架构等领域。除此之外,瀚博半导体的核心研发团队也都拥有 18 年以上高端芯片设计和量产的经验。

除了深厚的技术背景,深谋远虑的规划也是成就如今瀚博的重要原因之一。钱军透露在创立初期,GPU渲染核心研发一直在瀚博的计划之中,其实在瀚博推出的第一款芯片中就已经存在了一块性能较低的GPU。瀚博半导体在去年推出了AI推理芯片SV100系列,在瀚博看来这是最明智的选择,一方面,通过DSA 架构的 AI 芯片与其他企业形成差异化竞争,另一方面,通过AI+视频让研发团队在视频领域的经验和对大芯片的驾驭能力得到充分发挥,并拥有了很多落地的应用。

多年技术的沉淀下,瀚博厚积薄发,不断取得新突破。当然,瀚博半导体在积极研制业界领先AI芯片的同时,也一直在积极部署产业落地,助推数字经济发展。

对瀚博半导体来说,打造生态是战略版图中的头等大事。瀚博半导体在接受媒体采访时表示,面对国际巨头强大的应用和生态,国产芯片在同样的应用场景中,如何实现硬件和软件的完美匹配,如何发挥自身优势才是重点。另外还有一点就是,国产芯片厂商想要制胜,就一定要降低用户的迁移成本,这其中就涉及到软件生态、客户生态等方方面面,想要打开生态,就需要找准突破口,瀚博通过AI推理芯片为支点打造算力平台,但如何把软件做得更好则是一个循序渐进的过程。

当前瀚博半导体也在积极扩大合作伙伴朋友圈,先后与福建大数据集团、国宁瑞能、高新兴、超聚变等行业领先企业,在智慧城市、智慧政务、智慧交通、智慧园区、智慧能源等各类多元场景,开展深入合作,提供国产AI算力解决方案。 

此外,会议上,瀚博半导体还与上海交通大学人工智能研究院签约,开展校企合作,通过产学研用联盟的方式,让更多优秀的人才、资源参与进来,推动技术进步、人才培养、科研成果转化,建立智能芯片生态。

蓄势待发,打造算力新引擎

成立于2018年的瀚博半导体如今即将迎来第四个年头,备受资本宠爱的它在这三年多时间里已经完成了3轮,总投资额已高达二十多亿元的融资,而瀚博半导体也从未让大家失望,凭借着深厚的技术沉淀,围绕着人工智能和视觉领域,成功推出近十款产品,一次又一次实现跨越式发展

据瀚博半导体透露,未来,瀚博致力于做全球领先的综合算力平台,基于统一计算架构,让算力引擎更加多样和丰富,同时也会引入存储和连接技术,让算力引擎更好的协同和连接,助力数字中国腾飞。

具体来看

主要聚焦以下三大方向:

1在人工智能芯片领域和云边端算力加速方面,瀚博一方面继续巩固在云端AI+视频算力加速业务的市场领先地位,持续投入相关芯片以及产品的迭代研发,进一步完善产品布局;另一方面,持续投入边缘端产品开发,扩大市场。当前,人工智能作为引领未来的新兴战略性技术,已经成为驱动新一轮科技革命和产业变革的重要力量。在新基建、数字经济等持续利好政策对产业智能化升级的促进下,预计2025年我国人工智能核心产业市场规模将达到4,000亿元人民币。毫无疑问,巨大市场规模下是无限的发展潜力,而瀚博半导体势必将抓住机遇,不断突破。

2在GPU领域,瀚博半导体将会为客户提供高TCO的全面算力解决方案,满足客户需求。GPU对于未来数字经济时代的重要性,相信无需笔者过多介绍,SG100是瀚博半导体GPU的起点,但显然不会是终点,相信未来瀚博将基于GPU和AI芯片带来更多的产品组合。

3聚焦客户需求,寻找产业链合作机会,持续扩大产业生态。当前,瀚博半导体国内生态建设已经在路上,但瀚博的目标远不止于此,未来,瀚博将不断联合全球顶级的技术、人才、机构和高校建立合作,加速在各地、各类场景的产业化落地步伐。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部