“息壤”再升级,中国智算的再跨越

“息壤”再升级,中国智算的再跨越
2024年12月27日 17:19 华商韬略官方微博

AI智算的大国担当。

文 | 华商韬略 熊剑辉

一场中国化AI变革,悄然到来。

【“息壤”,不布下“智算天网”】

当ChatGPT问世、大模型崛起,AI对算力的渴求开始变得永无止境。

如今,训练ChatGPT所需的英伟达GPU,可能飙升至3万张;ALL IN AI的扎克伯格,更是手握60多万张英伟达GPU……

在这场没有硝烟的战争中,谁拥有最强的算力,谁就能主导未来。

但在中国,情况有点不一样。

因为最大的挑战不是算力不足,而是算力异构。

据工信部等六部门联合发布的《算力基础设施高质量发展行动计划》,2025年,中国算力总规模将超300EFlops。

算力如此庞大,但算力结构,却并不尽如人意。

因为据《智算产业发展研究报告(2024年)》显示,2023年,中国算力总规模为230EFLOPS,其中“智能算力”仅70EFLOPS,占比30%。

即便中国在全球智算的“军备竞赛”倾尽全力,但预计到2025年,智能算力也仅能占到35%,“通用算力+超级算力”为主体的多元化算力格局,不会有大变。

一方面,智能计算需求暴增,智能算力不足;一方面,通用算力、超级算力占据主导。

这种情况下,如何构建多元算力网,让“通用算力+超级算力”参与到智算领域,才是最符合实际且迫在眉睫的大事。

但要把如此杂驳的算力融为一体,又高速智能地分配出去,谈何容易?

一是算力的底层芯片纷繁芜杂,从x86、ARM的CPU,到国内外的GPU、NPU、RISC-V,应有尽有。

二是超大的智算集群、超算节点、云计算中心,分属天南地北,难以直联互通。

三是其分属不同的企业、机构、部门,天然具备阻隔。

所以,这不但是一场巨大的技术挑战,更是超越技术的现实挑战。

而在跨服务商、跨架构、跨地域实施算力调度这三大顶级难题上,天翼云自主研发的一体化智算平台“息壤”做到了。

首先,“息壤”的算力极其强大。

其自有算力,就高达21EFLOPS;同时,海纳百川般接入50家算力合作伙伴,各类智能算力合计高达27EFLOPS。

这犹如一座规模宏大的“算力三峡”,具备聚溪成江、吞吐山河的“超能力”。

其次,“息壤”实现了对算力的一体化调度。

通过对算力网关核心技术的突破,再庞杂的算力,“息壤”也能化繁为简,统一、高效、云化接入;又通过算数协同、多级算力互联调度,实现了算数网的一体化调度,做到数随算走,算随数动,算力调度范围变得更加广阔。

第三,“息壤”实现了算力的全场景服务。

面向公共算力场景,百业千行都能获得天翼云充沛的算力滋润。

面向城市场景,天翼云已为深圳、北京、上海、苏州等多个城市构建城市算力网。

面向科研场景,天翼云能整合校内外的分散算力和超算平台,满足教学科研多样化的算力需求。

这意味着,天翼云“息壤”布下了一张“智算天网”,是算力调度不折不扣的大国重器。

而今,“息壤”更迎来全方位升级。

2024年12月3日,在2024数字科技生态大会上,天翼云正式宣布“息壤”一体化智算平台,在算网调度、智算服务、智算生态三方面全方位升级。

“息壤”已从算力互联调度平台,升级为集算网调度、计算加速、模型训推于一体的智算服务平台,并通过规模化商用,为各行各业的智能化转型提供支持。

实际上,纵横天下调配算力,远非“息壤”智算“超能力”的全部。

【进化,智润百业千行】

“今天有哪些行程安排?”

“今天的行程是这样的。”

话音刚落,一张行程表就出现在汽车中控屏幕上。

“帮我预定明天去上海的机票。”

“已安排。”

“接通远程会议。”

“好的,会议纪要将自动生成”。

……

一边开着车,一边用汽车语音助手,就订了票、开了会、安排了工作行程……

这不是科幻大片,而是A公司语音大模型打造的智能座舱,落地成为了现实。

车内是一个极端嘈杂的环境,多人语音、方言交杂,加上风声、车声,都会对语音交互产生很大影响;而人机交互也谈不上规范,有人会打断、有人会重复,有人还会说起来没完。

所以,要做出可用的智驾ChatGPT,相当不容易。

但运用“息壤”,A公司大规模调度出GPU、NPU、CPU等多种异构算力,高强度训练1个月,成功完成十亿级大模型阶段训练和效果评估。

结果,60多家汽车品牌蜂拥前来合作,效果相当满意。

现实中,不同行业的AI大模型,其参数规模正经历指数级攀升,从百亿、千亿飙升至万亿甚至更大。这种永无止境的进化,对算力平台提出了越来越高的要求。

而“息壤”,其名源自《山海经》,意为能自我生长、膨胀的土壤。

也就是说,它具备一种无限生长、持续进化的超能力。

现实确实如此。

在上海、北京,天翼云打造出两大“万卡池”,成为全国最早建成并投产运行的国产化、全液冷、单集群万卡公共智算中心。

而依托自主研发的“息壤”一体化智算服务平台,又实现了万卡资源纳管、万卡规模并行训练。

强大的技术创新,不止于此。

通过自研的算力加速、AI训练框架和断点续训能力,“息壤”使模型训练恢复时间,从小时级降低到分钟级,效率大幅提升。

这什么概念?

在超大规模计算领域,唯一可以确定的事,就是一定会发生故障。

根据公开数据,Meta在Llama3.1-405B大模型原生训练过程中,耗时54天,累计发生故障419次,平均3小时就要出错一次。

哪怕Meta这种顶尖科技企业,面对如此频繁的故障和中断,同样无可奈何。

但“息壤”,偏偏要挑战不可能。

在北京万卡池,天翼云对700亿参数的Llama2-70B大模型展开训练。

结果,得益于“息壤”强大的断点续训技术,故障被秒级检测,分钟级定位、处置、训练恢复,性能达到业界前沿水平。

这意味着,“息壤”不仅是超大规模算力的“调度大师”,还是可提供一站式高性能服务的“计算大师”。

凭借足以打通各类AI“任督二脉”的“专业能力”,“息壤”得以智润千行百业。

比如,针对某三甲医院临床研究所的医疗大模型,天翼云通过快速精调,实现了医疗大模型的临床辅助决策。

借助全栈适配工具链,天翼云助力某客户推出交通行业大模型,适配时间大幅缩短、训练性能大幅提升,30多个AI应用实现快速上云。

而为助力某时尚电商平台打造高性价比、高稳定性的AI生图工具——唯象妙境,天翼云在算力供给、存储、传输上提供全方位支持。

如今,这一强大AI生图工具,服务于全球近百万电商从业者,成为引领电商增长的新范式。

基于强大的国云智算底座,天翼云已服务于政务、工业、电商、医疗、教育等众多行业客户。算力在天翼云加持下,变得像水、电、气一样可随用随取。

但天翼云深知,仅靠自身一家,依然远远不够。

【生态,万类AI竞自由】

2023年,一个15岁的山东初中生在世界上最大的开源社区GitHub,启动了一个名叫Chat Nio的小项目。他的想法很简单,只为让自己的小伙伴免费体验ChatGPT的GPT4服务。

结果,这个开源项目迅速火爆。

2024年11月,有人出资百万,将其收购。

小小年纪就能获得七位数的第一桶金,这是开放社区赋予的魔力,也是强大生态带来的魅力。

AI产业的繁荣和发展,同样离不开生态沃土的“滋养”。

2024年8月28日,恰逢2024中国国际大数据产业博览会召开,天翼云的“魔乐(Modelers)开发者社区”正式上线。

这是天翼云智算生态建设的一小步,或将成为中国AI产业发展的一大步。

某种程度上,你可以将“魔乐”视为一个“智算雨林生态”

雨林,是地球上生物多样性最丰富的生态系统之一。它的生长、壮大,除了离不开阳光、土壤,更需要汇聚庞大多样的生物聚落。

如果说,算力资源是土壤,智算技术是阳光,那么天翼云的“息壤”已然足够丰富强大。

但独木不成林,“智算雨林”中,既需要植物这样的“生产者”来聚合能量,创造产品;又需要昆虫、鸟类、哺乳动物等“消费者”,将产品商业化,形成生态闭环。

哪怕是“生产者”,也既要有高大的乔木,又要有低矮的灌木、贴地的草本植物,由此实现AI产品的极大丰富性。

实际上,当下中国的AI产业,正面临资源应用匮乏、工具链使用门槛高、商业落地艰难等诸多挑战。

这样的现实,靠“大力”出不了“奇迹”,需要培育生态、创建社区,通过为开发者提供全方位支持的环境,才能促进AI技术的进步、繁荣与创新。

而“魔乐”,就是一个既聚合了优质AI资源、AI创新,又能够加速商业应用落地的“智算雨林”,也是一个开发者乐园。

在这里,英雄不问出处。

不论开发者是个人、公司还是高校,只要你能推出平台认可、受欢迎的AI应用,社区不但会给算力、给工具、给平台、给服务,甚至助力开发者实现商业变现。

比如,“魔乐”就联合多家伙伴,推出“国产算力模型应用创新计划”,助力国产原生AI模型的孵化。

同时,天翼云启动“天翼云息壤杯”高校AI大赛,希望将国内外AI领域知名院校、头部实验室/课题组引入“魔乐”。

这既能为国家和社会培养AI人才,又促进了国产算力的技术成熟和生态繁荣。

同时,这也预示着未来具有革命性的AI应用,将在国产算力、架构的加持下诞生。

这才是天翼云构建“智算雨林生态”的真正用心。

目前,“魔乐”上已发布5800个模型和145个应用。未来,这个数字必将持续增长,“魔乐”也将成为中国AI产业发展的生态重镇。

在业界,天翼云的行业地位有目共睹。

最近,赛迪顾问发布《2024H1中国智算云服务市场研究报告》显示:

天翼云位居2024H1中国智算云服务市场领导者象限,并荣膺2024H1中国算力互联调度市场第一名,彰显其在智算领域的核心竞争力和领导者地位。

此外,在中国信通院联合沙利文(Frost & Sullivan)发布的《智算云生态影响力矩阵》中,天翼云在技术能力、市场能力和战略布局三大维度全面领先,获评全量领导者,领跑智算云市场。

领导者地位的获得,靠的是天翼云对自主创新的执着。

从云操作系统、底层基础软硬件技术,到上层高阶云能力……天翼云坚持关键核心技术上自主攻关、自主创新,实现了“全栈自主可控”。

“息壤”的升级,更是自主创新的重大成果。

在繁荣中国智算产业的道路上,作为云服务国家队,天翼云不仅是大国算力的主力担当,也是智算服务、泽被百业千行的产业担当;更通过“智算雨林生态”建设,成为AI生态培育、人才培养的责任担当。

显然,一个智能无处不在的时代,正在向我们走来。而天翼云作为中国AI产业发展的重要参与者、推动者、甚至引领者,正为此开拓新领域、注入新动能、贡献新力量。

——END——

欢迎关注【华商韬略】,识风云人物,读韬略传奇。

版权所有,禁止私自转载

部分图片来源于网络

如涉及侵权,请联系删除

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部