美国算力管制,挡不住中国大模型

美国算力管制,挡不住中国大模型
2025年01月16日 12:36 时光倒流二十年

来源:正解局

中美又在AI领域隔空交手了。

1月13日,美国历史上第一个人工智能出口管制规则出台,对先进计算芯片以及闭源AI模型实施新的管控措施,向中国等国家出口高端AI芯片和闭源AI大模型几乎被全面禁止。

而72个小时之内,中国这边也迅速给出了回应。作为央国企大模型产品的首选,科大讯飞全网直播,高调发布了星火语音同传大模型,和全面升级了底座能力的讯飞星火4.0 Turbo,以及当前唯一一个,在全国产算力平台上训练的深度推理模型—讯飞星火X1。

星火X1的发布,是一个历史性的时刻,它证明了在长久的角逐之后,中国AI大模型的发展,终于初步摆脱了美国的限制。

在过去几年里,大模型一直是中美竞争的焦点。从2022年的1007规则,到2023年的1017规则,再到2024年的1202规则。美国为了阻碍中国AI大模型的发展,以一年一次的速度,不断升级芯片出口管制。这对美国而言,是相当惊人的行政效率。

然而与此同时,中国的大模型技术却同样日新月异,从2022年诸多公司紧随chatgpt入局;到2023年百模大战,文生文、文生图等应用产品井喷;再到2024年,讯飞星火等第一阵营产品赶超世界一流水平。数据显示,2023年8月至2024年10月,中国大模型指数从100点基数增长至260.16点,增长了1.60倍,月均复合增长率达7.07%。

为什么美国已经尽其所能,中国的大模型依然高速狂飙?这是一个复杂的问题,其主要原因之一,就是中国自有算力平台的成熟。这次的星火成功,就是象征。

中国大模型快速进步的动力之一,就是既有自主算力,又有愿意吃螃蟹的大模型厂商。

许多人不知道,美国在AI领域垄断的不仅是算力,还有软件生态。为什么全球绝大多数AI厂商,都必须购买英伟达的GPU产品?除了其硬件设计与性能外,还因为英伟达开发的CUDA,是当下最成熟和完善的并行计算平台和编程模型。这才是高通、AMD、英特尔等同样实力强大的芯片厂商,都望洋兴叹,难以从AI市场分一杯羹的核心原因,因为CUDA生态,基本只能使用英伟达的硬件。

所以,华为昇腾等国产算力打出一片天不容易。但是利用国产算力,训练大模型,同样是个艰难的过程。

早在2023年,华为就通过整合云、存储、算力等先进技术,构筑新型算力基础设施。但是因为成本和易用性问题,应者寥寥。只有坚持全国产化的科大讯飞,联合华为推出国内首个万卡规模大模型算力平台“飞星一号”,并在之后一年多里,成功攻克了数据构建、框架调优、模型验证等一系列难题,将讯飞星火大模型持续迭代至V4.0,全面对标GPT-4 Turbo。终于证明,基于国产算力打造自主可控通用大模型底座,是完全可行的。

而这次发布的深度推理训练模型讯飞星火X1,则是国产算力集群对标国外的又一关键里程碑。

与通用大模型相比,X1的解题过程更接近人类的“慢思考”方式。在发布会上,讯飞星火X1解答高考题、AIME竞赛题以及高中奥赛题,不仅准确给出了这些题目的答案,更重要的是,它还对解题思路和步骤进行了详细拆解。像人类一样,懂得将问题化繁为简,复杂问题简单化;同时能自我探索和反思验证;最后还依据答案正确与否进行强化训练。

很容易想象,星火X1在教育领域有着极高的应用价值,已经有一线教研员和教师用它来解答高中数学创新题,并因此大获好评。而教育之外,科大讯飞也联合多家顶尖医院,利用星火X1打造了多款针对特定疾病的大模型,显著提升了人工智能辅诊效果。可以说,星火X1的发布,证明中国大模型的探索,正在进入一个新的历史阶段。

除了技术和生态的进步,中国大模型还有一个杀手锏,那就是数据。

大模型的竞争,数据为王。

众所周知,大模型的能力不是虚空产生的,而是必须利用数据集来训练,可以说,算法和算力决定了大模型的下限,而数据集质量决定了上限。所以大模型的本质,就是过去积累数据的一种有效利用。

得数据者得天下,而这恰好是美国的短板。其虽然算力更充沛,大模型技术也相对先进,但是由于美国的产业处于衰退周期,因此数据存量和电力一样,无法凭空创造出来。

因此在过去几年,中国需要大量专业数据的行业大模型百花齐放,渗透千行百业。最近的案例,就是这次科大讯飞针对难度最高的同传翻译,正式发布的国内首个具备端到端语音同传能力的大模型——星火语音同传大模型。

在这次发布会上,科大讯飞展示了星火语音同传大模型技术的应用效果。其不仅翻译效果更准确流畅,而且首次响应时间缩短到5秒之内,在多种场景下实现了交流的无延迟。甚至其能跟熟练的资深同传翻译一样,根据“顺句驱动”原则,自动对碎片化信息进行重组,确保整个翻译过程更加流畅。

为什么星火大模型的性能如此强大?

其原因非常朴实无华:作为长期以来的翻译界扛把子,早在2018年,科大讯飞的翻译机,就成功通过了全国翻译专业资格考试,并连续多年在国际口语机器翻译比赛中夺冠。完全可以说一句,没人比我更懂翻译。而星火大模型的性能,只是科大讯飞在翻译领域技术的延伸与升华。

根据科大讯飞透露,在2025年,针对语音到语音同传场景的讯飞翻译机,就将推出商务套装,配置耳机、音箱、麦克风等产品中,满足用户的使用需求。能够预见,全球交流无障碍的时代即将到来。

可以说,当前中国在大模型领域的竞争中,已经占据了一部分优势,不仅性能迎头赶上,而且在实用性上更胜一筹。

与美国相比,中国的大模型竞争,要残酷得多。

与美国资本市场依然将大模型视为孵化中的蓝海,拥有几乎无限的耐心相比,中国的大模型领域早已进入红海的绞杀战,各个产品从拼算力到烧营销再到比应用,败者一无所有,而胜者的奖励是进入下一轮。数据显示,2023年,中国上线的大模型数以百计,而在残酷的竞争下,到2024年底,依然保持着更新与活力的产品十不足一。

这对想要讲故事拼概念的企业不是好消息。但也让以实用说话的大模型迅速迭代,脱颖而出。时代周刊曾感叹,目前中国的一些AI大模型,已经通过软件和算法的优化,把芯片性能发挥到了极致,在表现能力上反超了有尖端芯片的美国大模型。

实际上,科大讯飞等在大模型竞争中占优的企业,其共同特征就是从没有抱过侥幸心理,“大模型发展,应用才是硬道理”。

在本次发布会中,我们可以看到,讯飞的大模型产品,所有性能的“应用场景”都一目了然。星火X1除了赋能教师教学,也能使科大讯飞AI学习机学习推荐和诊断将变得更加精准,助力孩子学习更省时、爸妈辅导更省心。

而作为央国企首选的大模型,讯飞星火4.0 Turbo底座能力也迎来了全面升级,除了七大核心能力全面提升,全面对标OpenAI最新版的GPT-4o之外,更重要的是在行业理解能力上实现了显著提升,成为了更懂行业的大模型。

升级后的星火,不仅复杂表格和潦草笔记难不倒,还开发了基于智能体的全新长文本框架,对长文本注意力机制进行了优化,并首发了混域知识搜索技术。这项技术能够实现对个人知识、企业知识、业务系统数据、精品行业数据以及互联网信息的综合搜索,用户只需一次提问,即可获得综合搜索后的结果,大大提升信息搜索效率。

当前,科大讯飞的大模型产品,因为极强的实用性,正在超越央国企大模型首选的定位,成为市面上最受欢迎的产品之一。根据《中国大模型中标项目监测报告》显示,2024年,中国1107个中标项目披露的金额达到64.67亿元,相比去年增长7.2倍。而其中讯飞拿下了其中91个,中标金额达到8.47亿元位居首位,超过第二名一倍以上。而在C端,科大讯飞的大模型产品,用户已经超过2亿。

科大讯飞,正是中国大模型发展的缩影,面对技术封锁迎难而上,同时深入千行百业,变得更有生命力。

这样的产品,是不会被封锁和管制所打倒的。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部