AI“百团大战”,讯飞星火认知大模型为何脱颖而出?

AI“百团大战”,讯飞星火认知大模型为何脱颖而出?
2023年08月16日 07:49 毛启盈

中国大模型“百团大战”之后,用户出现审美疲劳。

尤其是大模型“网红”chatGPT性能大幅下降,聊天响应速度变慢、内容变得冗长、重复且无逻辑,以及聊天主题变得单一且无趣,遭到用户吐槽。

国内大模型疯狂内卷,已让一些缺乏技术积累和研发投入的企业心不从心,开始掉队。资本运作之后,并没有出现接地气的应用场景,逐渐开始失声。

然而,8月15日,讯飞星火大模型2.0如约而至。经过现场实景演示,代码能力和多模态交互能力超乎现象。科大讯飞董事长刘庆峰表示讯飞星火大模型V2.0基于Python和C++进行代码写作能力已高度逼近ChatGPT,并将于今年10月24日全面超越ChatGPT,明年上半年将正式对标GPT4。

作为中国唯一准确给出大模型发展计划时间表,并且引领技术方向的科技企业,科大讯飞的信心来源于何处?

01

讯飞星火认知大模型

为何能脱颖而出?

讯飞星火大模型能够对标和超越ChatGPT,与那些炒作ChatGPT概念寻求“破圈”不一样,科大讯飞从一开始就让大模型结合业务案例,让大模型摸的着,看得见。任何创业者、企业主以及个人都可以参与进来。

第一、成熟产品计划和商业化生态。

8月15日,推出的星火2.0大模型,与上半年发布的星火1.0、1.5版大模型相比, 大模型代码能力和多模态交互能力将实现重大升级。在文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力方面更强大,在教育、办公、汽车、数字员工四大行业应用更为成熟。

科大讯飞展示了星火2.0可以实现代码生成、代码补齐、代码纠错、代码解释、单元测试生成等开发能力。基于此,科大讯飞公布了基于星火2.0的智能编程助手:iFlyCode 1.0,拥有星火大模型的所有代码生成相关能力,并可以无缝集成至开发环境。

刘庆峰表示,讯飞星火大模型获得广大用户和开发者的好评,100多天以来,讯飞开放平台新增开发者70万+,下助手用户创建7800+。

星火大模型赋能C端硬件,打造了全新的体验。讯飞智能办本,学习机以及录音笔等终端在今年6.18获得京东和天猫双平台7类销售冠军。

多年来,科大一直独占人工智能与语音行业鳌头,在智能教育硬件和教育信息化方面筑起了较高的“护城河”。此前,科大讯飞启动了“1+N 认知智能大模型技术及应用”专项攻关,其中“1”指的是通用认知智能大模型平台,“N”指的是将认知智能大模型技术应用在教育、医疗、人机交互、办公、翻译等多个行业领域。譬如,讯飞星火大模型+教育、+医疗、+金融、+汽车,打开了市场想象力。

譬如,讯飞星火大模型2.0多模态交互能力提升,可以实现图像描述、理解、推理、创作、文图生成以及虚拟人合成等多模态功能。多模态能力不仅能够赋能教育和医疗,而且可以应用到工业、汽车自动驾驶以及机器人等行业应用,这是实现通用大模型的必由之路。

在星火2.0发布会上,科大讯飞宣布联合华为推出讯飞星火一体机。“我们不仅在算法上有了充分的信心,在算力上也迈出了重要一步。”科大讯飞董事长刘庆峰在发布会上表示,讯飞星火一体机将使得所有企业更方便、更自主、更安全可控的私有化部署大模型能力,在完全国产自主创新的平台上,进行私有化部署,保护自己的数据安全。

此前,科大讯飞携手华为共创AI存力底座,点燃AI大模型星星之火。华为数据存储产品线总裁周跃峰表示,在大模型时代,数据质量决定了AI智能高度,作为数据的载体,数据存储是AI大模型的关键基础设施。面向AI时代,华为携手科大讯飞,共筑更智能的数字世界。

科大讯飞与华为,双方依托联合创新,在数据存储服务可靠性、算力和存力协同体系研究、数据全生命周期管理等技术方向上寻求突破。通过AI存力在AI大模型时代的创新实践,为产业提供高价值的可借鉴经验。

第二、AI方面雄厚的技术沉淀和持续性研发投入。

和造芯10亿起步差不多,大模型也是一个非常烧钱的工具。

大模型的训练和调试成本投入非常高,对于一个一清二白没有基础的公司来说,恐怕难以为继,但科大讯飞背后有雄厚的研发支撑。

2022年科大讯飞总研发投入33.6亿元,同比提升14.28%。发人员数量占公司总人数的比例为约60%。如此巨大的投入,也足以看到科大讯飞打造“航母”大模型的决心。2022年,公司在人工智能关键核心技术领域累计摘取16项国际人工智能大赛的冠军,其中在认知智能领域获得13项冠军。

刘庆峰表示,因为星火大模型每一个关键的技术模块都是完全自主研发的,科大讯飞对每一个阶段的技术都是可控的,软硬件平台都是国产自主可控的。

第三、中国大模型已在技术和应用开发上全面领先。

最近新华社研究院发布国产大模型报告(以下简称《报告》)显示,讯飞星火第一,智商最高、工具提效能力最强,以总分1013分位列本次国产主流大模型测评榜首位,在四大评测维度中的智商指数和工具提效指数两个维度获得第一,《报告》认为讯飞星火“在工作提效方面优势明显”。

讯飞大模型6月9日突破开放式问答,并在数学能力和多轮对话能力上迭代升级;8月15日在代码能力上实现重大突破,并在多模态交互能力上升级;10月24日对标ChatGPT,实现中文超越、英文相当的水平。

到今年10月24日之后,将全面超越ChatGPT,让中国在大模型的开发能力以及场景,实现了全面的领先。科大讯飞在AI方面已埋头苦干了24年,刘庆此前提出五年奋斗目标:达到十亿用户、实现千亿收入、带动万亿产业生态,这才是科大讯飞AI in大模型的真正价值。

02

群模乱舞,如何健康发展?

随着越来越多的大模型企业以及AI应用浮出水面,“群模乱舞”下,国内大模型行业如何健康可持续发展?成为越来越多人关注并且思考的问题。

截至目前,国内已推出超100款大模型产品,其中,仅定位通用大模型和“通用+行业”的企业,便多达26家。此外,“基础+行业类大模型”已有7家;其他金融、医疗、生物、交通、数据分析等行业大模型达67家。

目前,大模型主要有三种模式:

1、为了大模型而大模型,没有任何技术沉淀和业务基础的创业公司。

ChatGPT就是这样一个没有技术积累和文化沉淀的公司,只不过有包括谷歌这样的巨头用融资来支撑,因此,泡面越来越大。而全球更多创业公司却没有那么幸运。譬如,经历了轰轰轰烈融资后,而被美团“收拾残局”的光年公司。

2、有互联网基因,也没有大模型方面的技术沉淀,临时组建团队或者收购一些公司,打上了大模型的标签,一方面提升股价,另一方面,对业务有助推作用,但是看不到真实的变现能力。

A股中有诸多这样的AI概念股,风口过去一地鸡毛。就像当年遍地开花的互联网+,而到了互联网时代,那些互联网+也仅仅是将物品从线下渠道搬到线上,没有发生任何变化。

3、这类公司拥有AI的行业深耕,也拥强大的技术团队。

譬如,科大讯飞、华为这样的通信行业。进军大模型的目的很简单,就是结合已有的业务,赋能前杠百业,才,而不是为了大模型而大模型。

03

大模型未来:

从娱乐到场景实用

深度赋能时代已经到来

ChatGPT从美国降生,然后席卷全球。

自作聪明的人类,第一个想到的是,让机器人为我服务,于是不断向大模型提出各种人类能想到的问题,试图将其“考”倒,从而有一种获得感。回答人类提出的各种枯燥问题,参加形形色色的考试,就差让机器代替人类生孩子了。

娱乐是科技进步动力之一,但绝对不是互联网游戏这种精神鸦片。

事实上,人类如此刁难和测试一个机器,不仅仅是好奇心,更重要的是让机器人为社会创造财富,这才是大模型最重要的价值。

因此,凡是不能商业化的大模型,都是劳民伤财,没有生命力。小到一个公司,大到一个国家。只有能让国家强大起来的高科技才拥有长久的生命力。放眼世界,只有中国才有可能成为美国之外“智慧涌现”的第二极,中国一定要有自己通用人工智能国家队,这对国家无论是民生保障还是产业链安全都至关重要。

5G以及万物互联带来时代到了,大模型迎来了5-10年风口期。科技部新一代人工智能发展研究中心发布《中国人工智能大模型地图研究报告》显示,目前,中国和美国研发的大模型数量占全球总数的80%以上。其中,中国10亿参数规模以上的大模型已发布79个。除了10亿级参数规模以上的大模型外,还有许多更小、更轻量级的模型也在不断涌现,为各个领域带来了更多的应用可能性。

我们知道,通用大模型一直是美国领先地位,中国公司如何打破美国在算力方面“卡脖子”问题,讯飞大模型在安全可控方面走出了实质性性的一步。正如刘庆峰所说,我们在自主创新方面已站稳了第一步。

值得指出的是,中国大模型要在新时代处于领先地位,并不能只靠一家企业或者某个团体来完成,而是全社会与时俱进,积极拥抱AI时代,积极参与,才能跟上时代潮流。

责编|墨菡编辑|青山

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部