自ChatGPT爆火后,GPU成为超级计算和全球巨头大模型训练战中的焦点。英伟达更是凭借其GPU在大模型计算中的出色发挥赚得盆满钵满。
本财年第三季度,英伟达在其数据中心硬件收入已达145亿美元,几乎是去年同期的两倍。据Omdia预计,2023年第四季度英伟达H100和A100 GPU销量将超过50万台。
近几年,GPU市场持续火爆,但半导体产业整体却仍处于低迷状态,裁员不断,“寒气”倒逼。
11月15日,英国GPU芯片设计公司Imagination宣布,将在全球范围内裁员20%,涉及每一个业务部门。但有媒体援引知情人士话称,Imagination中国区将成为裁员的重灾区,比例估计在40%左右。
11月初,摩尔线程宣布在人员绩效方面,将进行一次常规性岗位优化,以达成更优的人岗匹配和岗薪匹配效能,更加聚焦GPU核心研发。
据《2023中国半导体投资深度分析与展望》显示,目前GPU市场国产化率仍不足10%。与此同时,英伟达GPU已成为各大AI公司开发大模型的首选利器,其算力需求激增直接导致英伟达GPU“一卡难求”。
那么,到底什么是GPU?国产GPU初创企业面对差距,又应当如何破局呢?
什么是GPU
GPU(Graphics Processing Unit,图形处理器)又被称作显示核心、视觉处理器、显示芯片,是一种专为并行处理而设计的微型处理器,非常擅长处理大量简单任务,包括图形和视频渲染。
GPU根据接入系统方式,分为集成型GPU(Integrated GPU,iGPU)和离散型GPU(Discrete GPU ,dGPU)两种,前者就是我们日常所说的集成显卡/核芯显卡,后者就是我们日常所说的独立显卡。
发展至今,GPU不仅为个人电脑、服务器和移动设备进行图形处理工作,还主要应用在工作站、游戏机、嵌入式设备、数据中心等各种需要渲染图形或高性能计算的场景。
GPU高效并发计算力
GPU的工作通俗理解是为完成3D图形的生成,将图形映射到相应的像素点上,对每个像素进行计算确定最终颜色并完成输出。
其工作原理与CPU 类似,都是通过执行指令来完成计算任务。不同的是,CPU 是通过串行执行指令的方式来完成计算任务,而GPU是通过并行执行指令的方式来完成计算任务。GPU 的并行计算方式可同时执行多个任务,大大提高计算效率和速度。
GPU的工作原理流程如下:
1. GPU包含多个核心,每个核心都可以独立执行命令。
2. 每个核心具有自己的存储器,用于存储指令和数据。
3. GPU会接收来自CPU的指令,并把它们分发到多个核心中进行处理。
4. GPU会把处理后的数据传输回CPU,以便CPU可以使用它。
5. GPU的性能取决于其内部的核心数量、时钟频率以及RAM容量。
总结来说,GPU和CPU都有各自的优势和适用场景,通常是相互协作。如在机器学习中,CPU通常用于数据的预处理和模型的训练过程,而GPU则用于模型的计算推理过程。
全球GPU市场格局
据Verified Market Research数据统计,2022年全球GPU市场规模达到448.3亿美元,预测2027年有望达到1853.1亿美元,年平均增速高达32.82%。
据 IDC 数据显示,预测2023 年中国GPU市场规模将达到43.2亿美元(约合人民币 298 亿元),未来5年整体市场年复合增长率(CAGR)27.1%。
在眼下的算力时代,GPU通用计算技术发展在浮点运算、并行计算等部分计算方面,可提供数十倍乃至于上百倍于CPU 的性能。
随着云计算、人工智能等高性能异构计算的发展,GPU并行计算的优势被进一步发掘,成为高性能计算领域的“宠儿”。从2020年开始,GPU便成为国内芯片领域“最吸金”赛道之一,融资总额已超过200亿元。
目前,GPU赛道仍呈现寡头高度垄断的格局。英伟达、AMD、英特尔几乎垄断整个GPU行业,占据市场份额高达63%。在中国市场中,三大巨头也是分走了大部分“蛋糕”。
英伟达是全球GPU领域的绝对龙头,A100采用台积电7nm工艺制程,支持FP16、FP32和FP64浮点运算,为人工智能、数据分析和HPC数据中心等提供算力;
AMD可同时提供独立GPU和集成GPU,其集成GPU主要运用在Ryzen APU、嵌入式、半定制平台中,独立GPU分为Radeon和Instinct系列,主要用于游戏、专业视觉、服务器等应用;
Intel能够帮助公司在集成GPU领域实现寡头垄断,在2022年8月24日正式发布了全新数据中心GPUFlex系列。
相比之下,国产GPU还处于起步阶段。目前国产GPU的性能还没有能与A100、H100、A800或H800相媲美的产品。但随着国内自研GPU领军企业景嘉微、壁仞科技等逐渐崭露头角,各厂家已发展出了一系列的产品线,国产替代浪潮来临,国内独立GPU厂商的广阔市场空间已被打开。
融资持续火热的GPU赛道
GPU创企陆续交出产品
从2020年开始,GPU便成为国内芯片领域“最吸金”的赛道之一,融资总额已超过200亿元。据统计,仅2020—2021年,通用GPU领域就有近20起融资事件发生。
2023年11月15日,摩尔线程完成新一轮数亿元B+轮融资。
12月6日,壁仞科技近期获得了广州政府支持的投资机构约20亿元人民币(约2.8亿美元)的投资。
近段时间,国产GPU厂商除了陆续获得大笔超百亿融资以外,也在相继推出GPU领域的最新产品。
具体厂商如下:
为此,电巢将于12月21日推出“GPU算力与高性能计算的融合与挑战线上研讨会”,届时将邀请行业专家、企业,共同探讨国内GPU产业发展。
吴宪云:西安电子科技大学通信工程学院副教授,图像传输与处理研究所副主任。主要方向为高性能并行计算、高光谱图像处理、高效率视频压缩、WRF并行优化等。
李博镝:国家超级计算西安中心高级工程师。其超算中心应用前景广泛,从先进制造、芯片设计等科技前沿到人工智能、图像语音识别等关键领域都有广泛的算力需求。
梁宇淇:高性能计算及AI算法专家极速光锥、TOPLINK CHAT、MOMSAY AI创始人,是一家以从事科技推广和应用服务业为主的企业。
现如今,伴随着国内GPU赛道上一个又一个交出新产品,国产GPU正迅速走过“从无到有”,进入下一个“迭代时刻”。
如景嘉微,成功研发JM54 系列、JM72 系列、JM92 系列三代 GPU 产品;摩尔线程,基于MUSA架构打造了两颗全功能GPU芯片“苏堤”和“春晓”;沐曦,最新产品MXC500成功点亮,产品直接对标英伟达 A100,采用通用 GPU 架构,兼容 CUDA等。
具体GPU产业链详情可领取《2023GPU产业链分析报告》,领取方式可看文末。
总的来说,芯片不断的算力提升,还是依赖于整个摩尔定律的提高。因为每代芯片都会更换台积电最新一代的工艺,那么越到后面就应考虑是否会有一些更先进的封装,比如像Chiplet,或者像异质集成,或者像光电一体的计算,或者再往后更加远的一些新的计算。
目前,相比于前些年火热的AI芯片,GPU无疑在技术上有更高的门槛,虽然获得了庞大的资金涌入,但跟英伟达等国际芯片巨头还有一些差距。
另外,GPU芯片从最初设计到制造、流片、量产,周期通常不会低于18-24个月,需要经年累月的迭代和优化。同时还需要看下游的应用,是不是一个很大的国产替代的机会,包括是不是一个很大的增量空间。GPU毫无疑问属于这样一个范畴,整个市场空间非常大,可能是个千亿人民币以上的市场。国产替代空间值得期待。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有