国产算力下的 AI “学霸”!讯飞星火深度推理模型 X1 发布,中文数学能力国内第一

国产算力下的 AI “学霸”!讯飞星火深度推理模型 X1 发布,中文数学能力国内第一
2025年01月15日 16:55 CSDN

整理 | 郑丽媛

出品 | CSDN(ID:CSDNnews)

如果科技界也有春晚,那科大讯飞今天的发布会无疑是其精心准备的第一个“王炸”节目——在短短不到 40 分钟的时间里,科大讯飞一连放出三大重磅消息:

● 发布了当前全国产算力平台上唯一的深度推理大模型「讯飞星火 X1」;

● 宣布讯飞星火 4.0 Turbo 的底座能力再次升级,首发混域知识搜索技术;

● 推出了业界首个具备端到端语音到语音同传能力的大模型「星火语音同传大模型」。

那么接下来,就让我们一起来看看:这场发布会,又将哪些原本遥不可及的 AI 设想变成了现实?

讯飞星火 X1,AI 界的“学霸担当”

首先登场的讯飞星火 X1,如开头所说,它是当前全国产算力平台上唯一的深度推理大模型。

事实上,国产算力目前在单卡、集群生态上和国际领先水平还有一定距离。在这种情况下,想要训练出和像 OpenAI 这种国际领先的模型来“扳手腕”的深度推理模型,需解决不少训练难点:

(1)训练推理涉及多个模型且需要强交互;

(2)跨任务传输数据及模型权重;

(3)训推任务类型由在线实时响应变为离线高吞吐。

为此,科大讯飞联手华为,共同攻克了全国产算力下推理模型训练的重重难关,成功推出了「讯飞星火 X1」——这款具有里程碑意义的大模型。

不同于其他快速给出答案的通用模型,讯飞星火 X1 具备三个典型特点:化繁为简,将复杂问题分步拆解简化;进行自我探索和反思验证;基于答案正确与否的优质反馈信息进行强化训练。基于以上特点,讯飞星火 X1 可以模拟人类的“慢思考”,通过分步拆解复杂问题、自我探索验证以及反馈强化训练,为用户提供更加贴近人类思维的解题思路。

在发布会的演示中,无论是高考难题还是奥数竞赛,讯飞星火 X1 都能一一破解,不仅答案精准,解题思路和步骤更是条理清晰,几乎把人类的“慢思考”模式完美复刻。据悉,讯飞星火 X1 在近期参加的小初高(含竞赛)、大学(含竞赛)、AIME、MATH 500 等多项“考试”中成绩十分亮眼,多项指标都拿到了国内第一。

当然,讯飞星火 X1 也不只是活跃于各项大模型竞赛中,它目前已经在教育、医疗等真实场景中实现了应用落地。

● 在教育领域,讯飞星火 X1 化身学生和家长的智能教师助手,助力全国百个试点区域的老师们打造上万个优秀案例,能帮助老师们进行一题多解、教学知识关联,还能拓展学生的高阶思维;

● 在医疗领域,讯飞星火 X1 也大放异彩。它的模型策略已经取得了初步验证成效,专科辅助诊断和复杂病历内涵质控的准确率都高达 90%,简直是医生们的“得力助手”,让诊断更加准确、高效。

此外科大讯飞还透露,将在今年上半年正式发布基于讯飞星火X1的医疗大模型升级版,确保其深层次诊断推理效果和质控能力业界领先。

对标 GPT-4o,讯飞星火 4.0 Turbo 全面升级

除了「讯飞星火 X1」,此次发布会上讯飞星火 4.0 Turbo 的底座能力也迎来了全面升级。

回顾 2024 年,讯飞星火在大模型中标数量和中标金额上取得“双第一”,在能源、金融、汽车、运营商等行业与客户共同打磨了近百个智能体应用,行业能力全面提升。而这次升级,讯飞星火 4.0 Turbo 的七大核心能力全面提升,对标 OpenAI 最新版的 GPT-4o,专治行业、企业的各种痛点。

以数学能力为例,有了讯飞星火 X1 的高质量合成数据加持,讯飞星火 4.0 Turbo 的数学能力提升了 10.5%。由此能够在在数学教学、金融分析以及科研推演等领域更好地帮助用户。

除了强大的数学能力,讯飞星火 4.0 Turbo 的图文识别能力也大有长进,通用文档版面分析、文字识别的准确率相对提升了 40%,复杂表格结构、潦草手写文字等方面的准确率相对提升了 60%,大幅提升了高价值数据的获取能力。

讯飞星火 4.0 Turbo 还带来了长文本处理能力的大幅提升,而全新的句子级溯源功能,则让用户在搜索信息时更加放心,使得知识回复的错误率降低了 40%,显著缓解了问答搜索服务中因大模型幻觉而需要反复溯源确认的应用落地难题。

更值得一提的是,讯飞星火还推出了行业首发的混域知识搜索技术。具体来说,该技术能对实现对个人知识、企业知识、业务系统数据、精品行业数据以及互联网信息的综合搜索,解决了用户在不同知识领域之间综合查询的需求,一次提问即可获得全面的答案。

正是这种全方位的能力提升,使得讯飞星火成为了真正“最懂行业的大模型”。

仅 5 秒时延,星火语音同传大模型达到人类专家译员水平

最后,科大讯飞还在智能翻译领域实现了重大突破:发布了国内首个具备端到端语音同传能力的大模型——星火语音同传大模型:无论是日常对话、商务交流,还是行业翻译等国际交流场景,它都能轻松应对,最快实现仅 5 秒的同传时延,基本达到了人类专家译员的水平。

实际上,正如上海外国语大学高翻学院院长张爱玲所说,当前大多数的机器翻译交传技术,很难实现端到端语音同传。大体上来说,同传的评价维度主要围绕以下四个方面:

● 内容完整度:源语发言通常逻辑复杂、层层嵌套,而同传则要求锁定帽子信息,实现完整忠实地传递。

● 信息准确度:无需多言,这就是同传的灵魂核心。

● 语言质量:要求遵循规范,用词精准,同时表达习惯需与目标语言契合。

● 沟通效果:其中,同传时延是影响沟通效果和听众感受的最重要指标之一,因此要求跟上源语发言者节奏,确保信息传递的及时性和连贯性。

针对以上维度,星火语音同传大模型通模仿人类同传译员的思维链路训练,实时意群理解、上下文精准选词、碎片化信息重组样样精通,在处理复杂句式和语境时也毫无压力,能够迅速准确地传达原意。

科大讯飞表示:“技术测试结果显示,即便将讯飞的语音同传技术和国外最优竞品的交传技术对比,讯飞语音同传在内容完整度、信息准确度以及语言质量上都处于领先水平

那么以上,就是此次科大讯飞发布会的重点内容,也让我们看到了国产 AI 在深度推理、行业应用、智能翻译等多个领域的强大实力和无限潜力。

相信未来,国产 AI 的舞台必将更加精彩,让我们拭目以待!

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部