注册

新浪财经APP

国产AI大模型之战：得技术者胜，得市场者强

国产AI大模型之战：得技术者胜，得市场者强

2023年05月12日 20:22 智谷趋势

语音播报缩小字体放大字体微博微信 0

智谷趋势（ID：zgtrend） | 王延鹤

01

今年一季度，AI无疑是最大的热潮。

从去年11月30日，ChatGPT正式上线开始，不论国内国外的公司，都像找到了奔向“新世界”的船票，要么在研发AI，要么在业务+AI结合的路上。

彭博做了个图，展示标普500上市公司的财报里，提到AI的次数上升了77%。

微软的AI云一路大胜，英伟达的芯片供不应求，谷歌、亚马逊、Meta都将投资AI当成第一大事。

别问，问就是这次一定，这把all in。

中国A股市场更夸张，ChatGPT概念、AI板块，上百家公司变身大牛股。

AI成了最确定的确定性。

企业是否坚定拥抱AI，也成为市场一个重要参考指标。

过去50天，中国的科技公司、高校、研究机构已发布了30多款AI大模型产品。

谋局落子，各有千秋，平均每天至少有一个AI大新闻。不管是骡子是马，都先出来遛遛，把融资和市值都拉一把。

超60家厂商宣布研发大模型，像字节跳动、小米的大模型就还在路上。

5月6日，“AI国家队”科大讯飞，发布了讯飞星火认知大模型。

和30多个同行比起来，讯飞算是姗姗来迟，但搞的事情反而最大。

之前的AI大模型，发布现场都是放PPT，和提前录制好的Demo为主。大部分人还得乖乖在waitlist排队，等一个内测资格，才能实际上手操作。

讯飞星火胆子很大，现场直接上真机实测，目前全国仅此一例，务实且有建设性。

不仅如此，星火一步到位，直接大规模开放测试。所有人都能上手体验，实际操作加深认知。

虽说发布会现场的演示也出现了一些小瑕疵，但瑕不掩瑜，承认差距，直视不足，一边跑步一边迭代。古书有云：观敌之变动，后之发，先之至，此用兵之要术。

这样自信又务实的企业，都是有真本事做底气的。否则ChatGPT珠玉在前，一不小心画饼不成，反而不妥。

再者，用少数案例来证实大模型的好坏都是不实事求是的，科大讯飞做语音AI起家，24年来一直是国内AI行业“学霸”一般的存在，在认知智能上浸润极深。

2011年，首个“语音及语言信息处理国家工程实验室”经国家发改委批复成立，由中国科大与科大讯飞股份有限公司联合共建。2017年，讯飞又获批承建了“认知智能国家重点实验室”，被业内戏称为“AI国家队”。

“1999年，中文语音市场全部被国际巨头控制，中国人被掐住了咽喉；我们创办科大讯飞，提出要让中国语音技术做到全世界最好，要在多语种技术上做到全世界第一。”

如今，24年过去，初心不改，信念终成现实。科大讯飞董事长刘庆峰在发布会上表示，在10月底的升级后，星火将整体赶超ChatGPT。

02

实力是拼出来的，不是喊出来的。

大模型能力成色有几分，往往大家上手一试，就有直观体验。

但现在几十个大模型，都号称要和ChatGPT掰手腕。有人说自己只差2个月，有的人说想追上至少等明年。

要知道，OpenAI可不会原地踏步。虽然马斯克搞了万人联名，建议暂停大模型研发6个月，但各大科技公司的投入不减反增。

AI大模型是智能时代最底座的技术。

这不仅是几家巨头争市场，更是争未来的生存权、发展权。中国做大模型务必要以科学的体系来统筹，企业需用正面积极的态度做竞争，市场上部分抹黑、造谣的声音格局太小。拧成一股绳，不愁生产搞不上去。

那么问题来了：国产大模型和ChatGPT的差距，到底还有多远？如何科学地去评估？

科大讯飞和认知智能全国重点实验室牵头，设计了统一、系统性的评判体系，覆盖7种能力，481个细分指标。

这7个维度的能力，包括：语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。

刘庆峰更是表示，“在文本生成和数学能力（一定程度代表通用认知大模型的智慧水平）上，星火认知大模型已经国内显著领先，且相比ChatGPT也具有一定优势；在语言理解和知识问答方面也达到接近ChatGPT水平，处于国内领先水平。”

智谷之前就注册了讯飞星火，我们也从多个维度，体验了一把星火的能力。

我们首先考验了星火对当下时事的分析能力：

虽然星火没实时接入最新数据，但对淄博烧烤、特斯拉降价的分析角度很全面，可以为大家提供一个研究的大方向。

随后我们尝试用笑话和梗，看能否迷惑星火：

故事创作，我们让它续写《流浪地球3》的大纲。

星火针对不同平台特点加入emoji、话题标签，使文案更加风格化。

一般数学题根本难不住星火，不但给出正确答案，也给了完整的解题步骤。

也可以在几秒钟里，用Python写出计算鸡兔同笼问题的程序。

总体而言，星火在中文文本、数学能力上与ChatGPT 3.5媲美，不过距离GPT-4还有所差距，这个无需否认，出生就对标成熟的ChatGPT也为时过早。就目前国内大模型市场来看，星火实力名列前茅，响应速度也很快，诞生之初即是国内尖子生已经不容易。

并且，科大讯飞公布了时间表，在6月9日、8月15日、10月24日还会进行三次升级。在不断交替迭代中，一步步实现进化，进步空间还有很大。

1024，是2的10次方，也是计算机二进制的基本计量单位，具有特殊的意义。

1024之后赶超ChatGPT，值得我们期待一把。大家也可以自行体验一下，官网链接：https://xinghuo.xfyun.cn/

03

现在OpenAI一骑在前，给所有追赶者，留下了大致的追赶路线。

算法、算力、数据，这是AI版三驾马车。

GPT-3规模是1750亿浮点参数，GPT-4规模没公布，但大家估算在5000亿-1万亿参数。

同样是未知数的，是微软到底为OpenAI提供了多少算力，这个数字也会是以亿美金为计量单位。

众多追赶者，都在追求“大就是好”，企图用更大参数规模，莽出一个智慧涌现。

而OpenAI的CEO，Sam Altman却站出来说：AI大模型已经发展到头了。

这不是凡尔赛，是OpenAI发现：更大规模，并不等于更强模型能力。

未来的模型发展方向，可能会是参数更小，或者多个子模型协同，从算法上去优化的空间更大。

科大讯飞既致敬OpenAI，又要赶超，走的就是这条更长远的路，也是一条自己的路。

·算法为王

“至少在讯飞，最关键的一定是算法”，科大讯飞研究院院长刘聪表示。

24年的积累，讯飞在Transformer深度神经网络算法拥有丰富经验，在语音识别、图文识别、机器翻译等任务都达到国际领先水平；

针对大模型模糊记忆技术短板，他们提出了知识与大模型融合统一的理解框架X-Reasoner；

截至2022年，讯飞累计斩获了常识阅读理解挑战赛OpenBookQA等13项世界冠军；

目前，讯飞开源了6个大类、超过40个通用领域的系列中文预训练语言模型，相关模型库月均调用量超1000万。

星火虽未公布具体参数规模，但讯飞透露了模型规模、算力都比GPT小，这种情况下，能做到模型能力不比它差，就有赶超的机会。

·数据破壁

国产大模型都遇到的另一个难题是，中文互联网世界的高质量数据，和英文数据有差距。

科大讯飞的解法，一是从全世界抓数据，中文英文都做；

二是通过更快落地AI产品，从行业积累高质量数据；

三是主动推进共建共享，助推政府和各界打通数据流，这也是今年来数字中国规划、组建数据局的核心任务。

科大讯飞的优势，是在教育、医疗等行业垂直领域的数据积累，护城河很深。在多年认知智能系统研发推广中，积累了超过50TB的行业预料，和每天超10亿人次用户交互的活跃应用，这不可小觑。

·算力自主

更多人的担忧，是在算力和芯片层面。

英伟达的A100/H100两款高性能芯片，是现在研发AI的刚需，但都被美国断供。中国厂商如果不是之前有囤货的，现在很难再摸到了。

即便是特供中国的“阉割版”A800/H800，目前也是供不应求、千金难买。之前流传出一份会议纪要，透露国内几个大型互联网企业，都在上万张地下单。

“只要谁在中国做的最好，代表中国在关键战略领域能提供支持，谁就一定会被美国打压。即便今天不在名单，他只要做好了，明天也会在。”刘庆峰也很感慨。

讯飞很早就上了美国的清单，所以科大讯飞的准备工作做在很前面。

一是自建了业界一流的AI数据中心，在工程技术方面实现了百亿参数大模型推理效率的近千倍加速；

二是与华为、中科曙光、寒武纪这些国产硬件企业深度合作。

1999年，18个中科大的学生挤在出租屋里，创造了语音AI的源头技术。24年过去，信念都在成为现实，好比星星之火、可以燎原。

讯飞从源头到整个生态都要自主创新，把AI能力建在自主可控的平台上，进一步也推动了中国人工智能产业生态发展。

04

光有技术还不够，还得有人愿意为你付钱。

很多人可能忘了，大模型已不是第一次AI热潮了。

AlphaGo火到没朋友那几年，正是上一轮人工智能热潮。有统计数据，中国约70%的AI公司都成立于2014-2018年。

但热潮退去，新增公司迅速下降，为什么？

因为大家发现，AI这玩意是真烧钱啊，对资本、人才、技术的门槛都很高，而且这玩意商业落地也是真心困难。

试问，那些公司还活着多少？哪些成功商业化了？哪些赚到钱了？

答案很尴尬。哪怕当初最优秀的四小龙，商业路径也走得不顺遂，亏损年年增加。

一群裸泳者都想上岸，看谁的水分挤完后，干货最足。

OpenAI的成功离不开微软上百亿美金、海量算力的浇灌。

然后，微软的Azure云、新必应这些业务，就靠领先的AI技术抢夺市场，开始挣钱。

而OpenAI还在亏损和烧钱，Sam Altman觉得，未来几年还需筹集1000亿美金。

那是1000亿美金啊，真的是烧出个未来了。

所以，AI大模型最终注定是少数大公司的游戏。

不光因为他们钱、数据多，还因为他们有能直接变现的应用场景、业务、生态。

等这一轮泡沫挤破，还能剩多少玩家，拼的也不仅是技术，还是产品落地、商业模式了。

科大讯飞考虑得很清楚，星火的“1+N架构”就是专门为此设计。

1代表通用认知智能大模型，是技术，是星星之火；

N代表大模型在教育、医疗、办公、汽车、人机交互等领域的落地，是应用生态，也是星火燎原之势。

教育是一个很大的市场。星火的发展离不开生态伙伴的支持，也离不开友商间的良性竞争。除科大讯飞这个龙头外，网易有道的子曰大模型，学而思的MathGPT，都在争取从教育垂直场景，落地AI产品。

科大讯飞的优势是在智慧教育领域，无人可及的生态构建。

拥有国内最大的智慧硬件业务，比如面向C端消费者的AI学习机、个性化学生手册等产品。未来的学生，可能会与一位无所不知、24小时陪伴、定制化的AI老师共同进步。润物细无声，其对学生的影响和学校老师、父母家庭同样重要。

同时，讯飞又有和高考、学校、教育行业合作的B端业务，还牵手政府和各地市县，打造G端业务的区域因材施教解决方案，智慧教育平台。

在医疗领域，讯飞有国内唯一通过国家执业医师资格考试的AI，已累计为医生提供超5.8亿次AI辅诊，日均诊断70万人次。

在办公领域，讯飞办公本、录音笔搭载大模型后，可以将一段录音轻松转化为会议纪要、新闻稿件、宣传文案，这都将是打工人的效率神器。

在汽车领域，讯飞打造了“大模型+智能座舱”，实现车内拟人化、跨场景的人车自由交流，其智能语音技术已经进入数千个车型，为4610万车主服务。

未来讯飞也会联合行业伙伴，将大模型能力开放给开发者，一同推动产业变革。

05

今年是AI大模型元年，也是科技大年。

可以预见，随着人工智能深入各行业，带去爆炸式的效率提升，还会有更多创新涌现。

在医药研发、芯片设计、AIGC等领域，AI已带去数量级的效率提升。

今年也是科技政策频出的大年。

中国在发动新型举国体制，要用一套新的产学研政机制，激发原始创新、攻克“卡脖子”难题、实现科技自立自强。

而几次会议里，AI的站位越来越高。

4月28日政治局会议，“要重视通用人工智能发展，营造创新生态，重视防范风险”，首次提到通用人工智能。

5月5日中央财经委第一次会议，首次提出了以人口高质量发展支撑中国式现代化，加快建设现代化产业体系。先进产业体系里，“把握人工智能等新科技革命浪潮”成为关键。

AI在新一轮科技革命中，是起引领作用的战略性技术。

更快普及AI应用，落地商业场景，才会加速这场生产力革命，并为各行业和社会创造正向价值。

企业在这场创新中的主体地位，日益深重。

讯飞星火直接大规模开放，就是在降低AI大模型的应用门槛。目前，讯飞开放平台已经开放了560项AI能力，聚集超过500万生态合作伙伴，首批就有来自36个行业的3000余家企业开发者接入星火大模型。

而随着AI进入千行百业，来自一线场景的宝贵数据和真实反馈，也会帮助讯飞星火更快迭代。

当下的中国，正站在创新大爆发的起始点。

有拿来即用的AI大模型和定制工具，有足够多的技术应用场景和市场需求，有完善的数字新基建，有高校与产业界的人才培养互动……越来越多企业、开发者、学者都参与进科技革命中。

恰如星火燎原，生生不息。

0条评论|0人参与网友评论

分享到微博

最热评论

最新评论

更多精彩评论>>

头条号入驻

智谷趋势智谷趋势是中国第一个对影响经济的高层政治行为进行系统观测与预测的机构，由来自杰出媒体、一流网络和著名

财经自媒体联盟更多自媒体作者

今日推荐优秀作者看点月榜

新浪财经头条意见反馈留言板

4000520066 欢迎批评指正

关于头条 | 如何入驻 | 发稿平台 | 奖励机制版权声明 | 用户协议 | 帮助中心

Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司版权所有

新浪首页语音播报返回顶部