在森林深处,有一棵千年老柯树。传说,孩子们只要在它的树洞中沉入梦境,就能达成任何愿望……这是大江健三郎在其著作《两百年的孩子》中描述的奇幻景象,并以此致敬他之前的作品《给新新人类》。
关于“新新人类”,最早的说法源自一则开喜乌龙茶的广告创意,而大江健三郎讲述的故事显然更具隐喻意味——那棵古树代表了千年文明的知识积累,孩子则是每个时代都可能催生的“新新人类”,只不过“树洞”在不同时期表现形式千差万别。
那么,大模型时代的“树洞”在哪里呢?“新新人类”又会以怎样的面貌呈现?在华为全联接大会2023期间,基于华为FusionCube A3000训/推超融合一体机,华为联合紫东太初、智谱AI、讯飞医疗、宇树科技等伙伴发布智能数字人、智能编程助手、智能医疗助手、智能巡检机器人,打造“AI新新人类”,加速场景化大模型商用落地。
显而易见,当大模型的开发和应用面临瓶颈,基于知识库的新型存储产品就是那个打破僵局、孕育神奇的“树洞”,由此诞生的“AI新新人类”将成为新时代的弄潮儿。颇为有趣的是,旧人类、新人类与“AI新新人类”的故事才刚刚开始。
大模型时代堪称新生物种的“寒武纪”
从5亿3000万年前起,大约在2000多万年时间内,门类众多的无脊椎动物化石突然出现,但在早期更为古老的地层中,却至今没有找到其祖先化石——这就是著名的“寒武纪生命大爆发”。
肇始于今年初的AIGC风潮,让人工智能进入大模型时代,前所未见的新生物种有望频繁涌现。但大模型在开发和运作过程中面临诸多挑战,在一定程度上阻碍了应用落地的进程。
首先,数据准备时间长,数据来源分散且归集慢,预处理百TB数据需10天左右;其次,多模态大模型以海量文本、图片为训练集,当前海量小文件的加载速度不足100MB/s;再次,大模型参数频繁调优,训练平台不稳定,平均约2天出现一次训练中断,故障恢复耗时超过1天;最后,大模型实施门槛高,系统搭建繁杂,资源调度难,GPU资源利用率通常不到40%。
就像“寒武纪生命大爆发”需要地球的温度、湿度、含氧量等都达到适宜新物种诞生的水平,大模型时代同样要改变基础的环境要素,才能加快场景化落地的步伐。打造大模型时代的AI存储新品,正是直面痛点的应时之举。
今年7月,华为重磅推出FusionCube A3000 训/推超融合一体机,集高性能存储节点、训推节点、网络设备、AI平台软件于一体,客户可以一站式部署,开箱即用,大幅降低AI大模型的前期使用、部署门槛与成本投入。
目前,华为基于存储新品已与多家伙伴开展合作并有切实的成果展示——“AI新新人类”的批量生成为场景化大模型商用树立了新的标杆,更多的AI机器人及全新的物种将在知识库存储的驱动下健康成长。
AI新新人类迈向加速进化期
华为公司副总裁、数据存储产品线总裁周跃峰博士表示,千年文明造就千行万业,在历史的积淀中形成大量知识库。AI大模型时代,只有赋予大模型知识库,机器人大脑才能“思考”,进化出系列场景下的AI新新人类。
如果说数据决定AI的高度,那么知识库则是AI新新人类成长的阶梯。华为存储从数据出发,将行业专有知识库与大模型能力充分结合,同合作伙伴一起推动AI新新人类不断进化。
在AI新新人类的大家族中,智能数字人也许是“最靓的仔”。紫东太初基于训/推超融合一体机、紫东太初大模型和智能数字人知识库,推出存储智能小海、政务前台、办税助理等智能数字人。其中,存储智能小海是华为数据存储产品线的第一名数字员工,将为华为销售人员和商业市场伙伴提供售前技术咨询,具备智能问答、意图查询、内容生成等功能。
相关统计显示,国内数字人领域发展迅猛,到2026年整体市场规模将达102.4亿元。不过,新兴的数字人赛道也有成长的烦恼。例如:面向行业多模型落地,传统的交付方式为多个硬件拼装"七国八制",存在设备多交付难、数据容易泄露、定制方式复杂以及运行容易中断等问题。
针对上述难题,双方联合打造的训/推超融合一体机内置华为硬件、容器平台和紫东太初全链路工具链,实现一柜软硬件全集成。从设备组装、部署到训推、运维,紫东太初和华为提供全流程的工具和软件,最终达成智能数字人上线时间缩短到2天、开发周期缩短到7天。
在AI新新人类最容易切入的“工种”中,编程应该是典型代表。智谱AI基于华为FusionCube A3000训/推超融合一体机、智谱CodeGeeX 编程大模型以及企业业务代码知识库,打造智能编程助手,实现智能问答、代码生成与补全、测试用例生成、代码优化、自动添加注释、代码翻译等功能,可通过语义分析和查询技术检测代码中的漏洞和缺陷,让程序员尽享编程乐趣。
从场景适宜度的角度看,医疗行业也是AI新新人类施展身手的大舞台。华为与讯飞医疗共同打造智能医疗助手,其基于华为FusionCube A3000训/推超融合一体机、讯飞星火大模型和医疗知识库,实现语音病历、会诊助手、智能查房、智能随访等功能,让每个患者都有一个AI健康助手,每个医生都有一个AI诊疗助理。
除了锦上添花,AI新新人类还能在充满风险和不确定性的场景雪中送炭。华为联合宇树科技,基于华为FusionCube A3000训/推超融合一体机、宇树巡检机器人和智能巡检知识库,打造电力场站智慧巡检员,实现智能导航、态势研判、语音识别、资产盘点、智能报表等功能,让巡检更智能、高效、安全。
知识库存储为AI新新人类保驾护航
不难看出,AI新新人类的涌现呈现出井喷特征,场景化大模型商用落地的进程明显提速,预计会有更多的智能机器人脱颖而出,赋能千行万业的智能化转型。
当然,阻碍AI大模型“高产”的诸多因素并未完全消除,AI知识库存储还有很长的路要走。面对新征途上的挑战,华为推出OceanStor A800高性能AI知识库存储,着力解决大模型训练和推理过程中的数据处理效率瓶颈,加速大模型应用上线。
据了解,OceanStor A800具备超高性能、超快恢复、超强推理三大关键能力:其一,基于创新数控分离架构,大幅提升小文件处理性能,存储单框IOPS达到2400万;其二,采用创新盘控协同技术及NFS+并行客户端,实现500GB/s超高带宽,TB级Checkpoint大文件读写仅需十几秒;其三,存储内生高速向量知识库,提升大模型行业知识深度、精度和时效性,并通过智能向量检索引擎达成25万+QPS、毫秒级推理响应。
站在更长远的视角来看,AI知识库存储的持续进化将进一步优化大模型时代的“气候环境”,AI新新人类英才辈出、迭代升级的未来图景值得期待。下一个AI新新人类会在哪里出现?看看你我的身边,它们可能随时现身。


财经自媒体联盟

4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有