科大讯飞发布首个基于纯国产算力的深度推理大模型

科大讯飞发布首个基于纯国产算力的深度推理大模型
2025年01月15日 22:16 经济观察报

经济观察网 记者 沈怡然1月15日,科大讯飞(002230.SZ)推出了国内首个基于全国产算力平台训练的深度推理大模型X1。这既是科大讯飞在大模型能力上的突破,也是国产算力能力的突破。

AI的演进方向就是模拟人脑的认知和思维过程,使机器能够更自然、更高效地处理信息和解决问题。深度推理模型是实现这一目标的重要工具之一。

在发布会上,科大讯飞一位工作人员让X1解一道数学题,X1模型能够将复杂问题拆解为多个步骤进行思考推理,并向用户详细展示思考过程。同时,X1模型如果在某一解题方法上遇到问题会重新规划另一路径。

深度推理能力也是ChatGPT演进的一个重要方向,GPT更新至3.5版本已经展现出相关能力,至4.0版本首次将输入模态从单一文本扩展到图文双模态,显著增强了解决复杂任务的能力。

不过,科大讯飞的X1模型并非业内首个,此前智谱AI、商汤科技、月之暗面都将基础大模型完成了类似的升级。X1模型的特殊之处在于,它是首个在全国产算力上开发的大模型。

所谓全国产算力,主要是指基于国产GPU搭建的数据中心所提供的算力。目前,英伟达(NVDA.US)占据全球GPU市场的90%份额,国内大型数据中心所用的GPU几乎依赖进口。

科大讯飞表示,国产算力确实在单卡性能和生态上都与国际领先水平有差距,与华为的合作也经历了一番磨合与挑战。在开发讯飞星火X1模型的过程中,他们开辟了一条全新的技术路径,包括在训练和推理过程中实现强交互和跨任务数据传输,促进了不同任务间的知识共享和高效协同,同时,他们克服了国产硬件在带宽性能上的限制,确保数据传输的高效性和准确性。

这次合作为国产算力提供了实践机会,有助于实现国产算力从硬件到软件的自主可控。合作也提升了国产大模型在政企服务中的信誉,随着国家政策的引导,基于国产算力的大模型正成为政府采购的首选。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部