SuperCLUE测评发布,商汤“日日新5.0”中文综合成绩超越GPT-4 Turbo,国泰君安给予“增持”股票评级

SuperCLUE测评发布,商汤“日日新5.0”中文综合成绩超越GPT-4 Turbo,国泰君安给予“增持”股票评级
2024年05月22日 20:40 北京商报

5月21日,国内中文模型评测机构SuperCLUE发布商汤“日日新5.0”(SenseChat V5)中文基准测评结果。结果显示,在SuperCLUE综合基准上,SenseChat V5以总分80.03分的优异成绩刷新国内最好成绩,并且在中文综合成绩上超过GPT-4-Turbo-0125。这是国内大模型首次在SuperCLUE中文基准测试中超越GPT-4 Turbo实现登顶。

中国AI投资热度飙升,商汤股价与用户注册量双双实现"日日新"式增长

自4月23日商汤科技发布全新升级的商汤日日新5.0(即,SenseChat V5)以来,市场持续给予良好反响,近一个月的时间,商汤股价累计上涨超170%,商汤大模型产品的注册用户数量也迅速攀升。

观察商汤的发展路径可以看到,为顺应技术及需求演进趋势,商汤目前已将业务重心全面调整至主要提供生成式AI模型训练、微调及推理服务的生成式AI领域,并不断深入应用到各行各业,特别是金融、医疗、汽车等核心领域,全线跑通“模型即服务”的商业模式。在此背景下,商汤生成式AI营收迎来爆发式增长,成为公司新的业绩增长核心。据2023年财报数据显示,商汤生成式AI业务实现营收11.8亿元,同比增长200%,营收占比提升至35%。

AI 2.0时代的来临,源于从感知智能到生成式内容转变的大模型发展,标志着新时代的开启。当下,作为国内领先的人工智能软件公司,商汤已经在AI 2.0时代抢占发展先机,同时在人才积累、基础设施构建以及技术成果落地应用等层面,都具备先发优势,是市场难以忽视的硬科技资产标的。5月12日,国泰君安证券发布研报,给予商汤“增持”的股票评级。

商汤日日新5.0文科能力全球排名第一,应用落地多元发展

此次SuperCLUE发布商汤日日新5.0(即,SenseChat V5)中文基准测评结果显示,SenseChat V5在理科任务上取得了国内最好成绩,文科任务上也以82.20分取得国内外最高分。此外,在本次测评中,SenseChat V5在各项能力上表现较为均衡,尤其在长文本、生成创作、角色扮演、安全能力、工具使用上处于全球领先位置,适用于智能体、内容创作、长程对话等应用场景。

从数据结果来看,SenseChat V5已经终结 GPT-4Turbo 评测霸榜的历史。

据了解,4月23日,商汤科技全新推出了覆盖“云、端、边”的全栈大模型产品矩阵,其中不仅包含专为终端设备设计的“商汤端侧大模型”,还推出适合金融、代码编写、医疗服务和政府政务等多个行业的边缘产品“商汤企业级大模型一体机”。

具体来看,在金融领域,一体机借助智能客服与投研服务,显著提升了决策水平和客户满意度;在医疗行业中,它利用医疗数据分析助力诊断,追踪历史数据的变化趋势,从而增强了医疗服务的精确性和时效性;在政务服务方面,通过构建智能问答系统,有效地整合了便民服务信息,并加快了反馈速度;对于代码开发工作,一体机利用其出色的代码生成功能,大幅提高了研发效率。

值得一提的是,凭借先进的大模型技术,商汤与多个行业的领军企业建立了紧密的合作关系,共同推动生成式AI向产业化应用的全面跃进,为社会的数字化转型注入了新的活力。比如,金山办公的WPS AI融入了商汤的大模型技术,从而实现了办公软件的智能化革新;在商汤大模型技术的支持下,小米公司的小爱同学服务显著提升了用户体验;海通证券携手商汤,共同打造金融AI应用,推动了行业的数字化转型;阅文集团则利用商汤的拟人大模型技术,成功创建了名为“筑梦岛”的AI原生虚拟社交生态平台。

中国大模型进入“强应用”阶段,商汤科技领跑AI产业化赛道

当前,尺度定律仍在主导着AI的技术迭代。在这一浪潮下,商汤不断突破能力边界,开启约每3个月为节奏的快速迭代步伐。

2023年4月,商汤首次推出 “日日新大模型1.0”版本,不仅是国内首个拥有千亿级参数的大语言模型,还融合了文生图、3D内容生成等多样化的生成式AI模型,迅速成为了当时国内最为全面的大模型之一;随后的8月份,商汤继续发力,发布了“日日新2.0”版本,在国内首次实现了性能上超越GPT-3.5-Turbo。同年12月,“日日新3.0”版本进一步提升了基模型的能力,并开创了支持不同模态工具调用的先河。同时,文生图模型“秒画”也获得了重大升级,参数量级跃升至百亿,不仅在语义理解和图像质感上有了显著提升,还在推理速度上实现了十倍的加速效果,进一步巩固了商汤在国内的领先地位。

进入2024年,商汤在AI领域的迭代更为迅速。2月份推出的“日日新4.0”在性能上大幅跃升,在代码编写、数据分析和医疗问答等多个应用场景中,展现出了与GPT-4相匹敌的能力。4月份发布日日新5.0,全面对标GPT 4-Turbo,展现出公司在AI技术上的持续创新和领先实力。

图源:国泰君安证券研报《生成式 AI 厚积薄发,AI 龙头再出发--商汤(0020.HK)首次覆盖》

如此强劲的发展势头背后,是商汤强大的算力支持。5月12日,国泰君安证券发布的研报中写到,商汤大装置是国内领先的大模型训练及推理算力基础设施,早在2020年公司就前瞻性的开始投入AI算力设施建设,在2022年开业的上海临港AIDC已经成为目前国内智算中心建设的“样板房”,可以支持万亿参数大模型的训练需求。截至2024年3月份,公司总运营算力已经达到12,000P,上线GPU数量达到45,000张。

另据国泰君安分析,商汤科技从算力基础设施到大模型落地能力的前瞻性布局还体现在,一方面,商汤科技联合上海人工智能实验室推出DeepLink 人工智能开放计算体系,搭建对硬件芯片与深度学习软件框架进行适配的桥梁,共建开放的软硬件适配生态,从而实现对国产算力软硬件更好的兼容性。

另一方面,商汤还前瞻性的开发了7B及1.8B参数规格的终端小模型,随着AIPC、AI手机等AI智能终端的需求逐渐释放,公司端侧小模型的市场需求有望迎来超预期增长。

中国开发的人工智能大模型正在从“上新品”逐渐进入“强应用”阶段,影响正迅速辐射至各行各业。商汤发布的“云、端、边”全栈大模型产品矩阵,不仅彰显了其技术实力,更引领了产业发展的新方向。

此前,中国银河发布研报对商汤给予重点投资推荐,中金公司的最新研报也给予商汤 “跑赢行业”的股票评级。综合来看,这似乎也预示着中国AI行业投资的新周期正式开启。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部