科大讯飞首个长文本、长图文、长语音的大模型发布

科大讯飞首个长文本、长图文、长语音的大模型发布
2024年04月28日 08:40 陕西消费网

4月26日,科大讯飞发布了讯飞星火大模型V3.5的春季更新。针对用户高效准确获取知识的需求,科大讯飞首次推出长文本、长图文、长语音大模型,能快速学习各类信息来源的海量文本、图文资料和会议录音,并在各行业场景中提供专业和准确的回答。

此外,科大讯飞还升级了星火语音大模型,推出了多情感超拟人合成功能,具有情绪表达能力,并新增了一句话声音复刻功能,为科技注入更多温情。同时,科大讯飞还发布了星火智能体平台,以助力企业解决大模型应用的最后落地难题。

讯飞星火凭技术进步解决实际需求,获用户认可。据七麦数据,讯飞星火APP安卓端下载量超9600万次,居国内工具类通用大模型APP榜首。其首发长文本、长图文、长语音大模型,高效助力知识获取。用户高峰使用时段为工作日9:30和15:30,主要解决工作相关刚需。科大讯飞分析发现用户面临多源信息获取难题,因此推出首个支持长文本、长图文、长语音的大模型,满足用户真实场景需求。

首发长文本、长图文、长语音大模型,助力知识高效获取

本次讯飞星火长文本功能全新升级后,具备长文档信息抽取、长文档知识问答、长文档归纳总结、长文档文本生成等能力,总体已经达到GPT-4 Turbo 4月最新长文本版本的97%水平,而在银行、保险、汽车、电力等多个垂直领域的知识问答任务上,讯飞星火长文本总体水平已经超过GPT-4 Turbo。

长文本功能的落地需要解决信息高效处理的问题:面对上百万甚至上千万文字,长文本大模型消耗的运算资源非常大。

刘庆峰指出,科大讯飞基于星火V3.5的长文本理解能力,通过模型剪枝和蒸馏,推出了130亿参数的大模型,在效果损失仅3%的情况下,显著提升了文档解析、知识问答和文字生成的效率。测试显示,星火在多种文本长度上都达到了业界最优性能。此外,科大讯飞还推出了星火图文识别大模型,基于在图文识别、公式识别领域的多年技术积累。

相比传统小模型逐行文字识别的限制,星火图文识别大模型具有三大优势:一是能够直接处理非常复杂的版面分析,目前已经覆盖31个典型场景,比如书刊、学术论文、专利、报纸、海报、PPT等,同时能自动识别标注出18类不同的版面要素,比如页眉、页脚、标题、段落、表格、公式、印章、手写等;二是融合篇章上下文语义进行文字识别,识别更精准;三是面向教育、金融、医疗、科研等专业领域深度优化,能自动实现更多领域的专业符号识别。

根据国际公开的权威英文测试集来看,讯飞星火的图文识别效果超过微软和谷歌。从典型应用场景来看,在科研、金融以及企业产品技术文档等识别效果都处于业界领先地位。

此外,面对广泛的音视频信息高效获取需求,科大讯飞也推出长语音功能,将国际领先的语音识别和翻译技术结合起来,可以实现会议录音、学习视频等的一键研读,实现音视频场景的高效知识获取。

发布合同助手、升级AI学习机,以技术进步解决真实刚需

讯飞星火长文本、长图文、长语音能力的升级,进一步推动大模型在各个场景的落地。刘庆峰重点介绍了讯飞星火在招投标、合同、教育等场景下的应用。

在招投标场景,此前凭借讯飞星火领先的文本理解、逻辑推理和数学能力,科大讯飞和国家能源物资公司在企业采购场景合作了智能无人评审系统,已经在国资委网站上被作为典型案例推荐。据介绍,在国家能源集团已评审5.7万余单,评审准确率达97%。这一次,叠加本次升级的长文本和长图文能力,可以让评标更便捷、更高效、更准确。

日常生活中,我们在买卖商品、装修房屋或者是购买汽车保险时经常会遇到各种各样的合同,看不懂存在风险怎么办?科大讯飞推出星火合同助手,它可以对我们的合同进行风险审核、合同比对,摘要总结以及合同生成,迅速识别潜在风险漏洞,成为你口袋里的“法务助手”。

在教育领域,科大讯飞升级了讯飞AI学习机,提升了作文和理科批改的精准性,实现了智能辅导的高效性和针对性。结合多模态能力,增强了百科问答功能,为孩子提供了有趣且互动的学习体验,同时增强了他们的提问意愿和能力。

智慧黑板也升级了长文本和长语音能力,提高了实录转写效率和篇章梳理能力。星火教师助手融入了长文本能力,丰富了备课资源,提高了备课效率。

星火科研助手已在多个机构高校得到应用,其多模态能力增强了论文问答、综述生成、实验解读等效果,丰富了学术资料,为高校和科研院所的科研工作提供了有力支持。

能“情感共鸣”,还能“一句话声音复刻”

万物互联时代下需要更真实的AI语音交互。年初讯飞星火V3.5发布会上,科大讯飞推出了超拟人对话功能,AI的声音更自然更真实,拟人度达到了83%,受到用户的广泛欢迎。无论是语音可懂度、流畅度还是表现力,效果均超过OpenAI、微软。

此次科大讯飞发布多情感超拟人合成,进一步提升了情绪表达的可感知度,对高兴、抱歉、安慰、撒娇、困惑等情绪表达的可感知度达到85%以上,AI语音更加生动、真实。

昊铂HT 2024 款车型行业率先搭载科大讯飞超拟人合成技术,已在4月25日正式全球上市。

科大讯飞推出“一句话声音复刻”功能,仅需一句话即可定制AI助手声音,如模仿小朋友声音为爷爷奶奶读书,或出差时模仿家长声音为孩子讲故事,使世界更温暖。刘庆峰表示,科大讯飞在个性化语音合成领域领先,现已实现一句话声音复刻。用户可在讯飞星火APP上体验此功能。

发布星火智能体平台,为企业注入新质生产力

自今年1月30日发布以来,讯飞星火V3.5作为首个全国产算力训练的大模型,受到了各行业伙伴和开发者的广泛欢迎。据刘庆峰介绍,大模型云边端的整体解决方案正在赋能汽车、家电、运营商等越来越多的行业;在过去不到3个月的时间里,讯飞新增了55万实名认证的开发者,其中一半以上来自企业。

对企业来说,如何高效地获取和学习知识同样是痛点,科大讯飞给出的答案是智能体,并面向企业场景推出全新的智能体平台。

企业构建智能体的环节主要涉及任务理解、外部信源打通、内部各个IT系统打通以及私域知识深入融合等环节,最终根据每个任务的执行结果输出答案,这样一个完整的过程才能够最终完成智能体的构建。

刘庆峰指出,讯飞星火智能体平台精准理解用户输入并规划任务,通过大模型实现。平台还构建外部信息对接,通过互认证机制打通独立系统,完成操作,并融入私域知识,实现精准专业问答。

同时,支持拖拽创建多智能体协作,敏捷应用落地。科大讯飞将于6月27日发布V4.0,进一步解放生产力、释放想象力。今年全国两会上,“人工智能+”行动被首次写入《政府工作报告》,大模型推动知识管理革命,成为实现新比较优势的重要工具。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部