这家国产大模型,又现大动作

这家国产大模型,又现大动作
2024年07月06日 17:26 正和岛标准

作 者:微澜

来 源:正和岛(ID:zhenghedao)

一、所有的行业都值得被AI重做一遍

“当下,所有的行业都值得被AI重做一遍。”

随着AI技术的快速发展,不断渗透到各行各业当中,这句话正在成为人们的共识。事实上,回顾过去的互联网时代、移动互联网时代以及数智化时代,每一次新兴技术出现时,“所有的行业都值得被xx重做一遍”这种类似的话总是会被反复提及,这背后其实有两点原因:

第一,AI(新兴技术的应用)能够带来生产力和生产效率方面的质的飞跃,对过去的传统行业实现肉眼可见的降维打击。

正如达里欧在《原则2》中写道:“衰落的伏笔总是埋在黄金时代,鼎盛的主体会在倾泻的颓势中逐渐式微。”

微软、惠普等个人计算机企业的大量兴起导致IBM的衰退;

苹果、华为等智能手机厂商造就了诺基亚为代表的传统手机的消亡;

包括在数智化时代,诸多企业通过对供应链上下游的优化管理实现了降本增效,从而与同行拉开差距。

这样的故事,在每一次新技术到来后都反复上演。

第二,AI(新兴技术的应用)将开创全新的应用模式与产业机遇。

需要注意的是,AI(新兴技术的应用)可不仅仅是只能实现效率层面的提升。

拿蒸汽机来说,蒸汽机除了推动蒸汽轮船、蒸汽火车的出现,带来运力的大幅度提升,紧接着带来的是,世界的政治、经济以及文化版图都发生了巨大的改变;更别说之后福特流水线的诞生,带来了制造业理念的颠覆性变革。

而正如蒸汽机技术应用于大量领域和产业,“所有行业值得被AI重做一遍”这样一句话也已经在照进现实了。

当然,尽管说所有行业值得被AI重做一遍,我们又该如何用AI对其它行业进行重做呢?

首先可以重新认识AI,人工智能有4个阶段,具体可以分为:

第一阶段,性能调优。通过优化算法和技术来提高人工智能的性能;第二阶段,降本增效。将已经相对成熟的人工智能技术应用到合适的场景当中为企业和个人降本增效;第三阶段,简单服务。即一次就能为你解决问题的服务。比如,会计、法律服务、设计师甚至是心理咨询师,他们提供的都是单次服务,这种服务很容易被AI学会和标准化。第四阶段,复杂服务。复杂服务指的是能够持续伴随你、了解你并且为你提供长期个性化建议的服务。

目前来看,大部分AI或者说对人工智能的应用,还处在从性能调优,朝着降本增效及简单服务进化的阶段,在营销、自动驾驶,及具身机器人等诸多领域AI应用其实已经显现,我们也能看到许多相关的案例。

比如就在7月5日,2024世界人工智能大会(WAIC2024)中国电信星辰人工智能生态论坛上,中电信人工智能科技有限公司和中国电信人工智能研究院(TeleAI)联合发布了一款名为星辰大模型·软件工厂的多模态大模型产品。

星辰大模型·软件工厂发布

作为全球首个针对编程(软件开发)领域的大模型软件,星辰大模型·软件工厂一经发布就引起了诸多反响和行业的热议。

有人说:“星辰大模型·软件工厂的出现可以让一人‘成军’。”

还有人评价到:“从软件开发从业者的角度来看,星辰大模型·软件工厂的出现无疑将带来从月到天,从天到时的软件开发范式新变革。”

那么,星辰大模型·软件工厂又是如何通过生成式AI(多模态大模型)给软件开发领域带来这种显而易见的改变呢?

二、星辰大模型·软件工厂:让AI开发更“AI”

在回答上面这个问题前,我们可以先简单了解下软件开发的演变趋势:软件开发的起源最早可以追溯到20世纪40年代,当时的计算机程序是直接使用二进制代码,这种编程方式低效且难以理解。到了20世纪50~70年代,高级编程语言的诞生和结构化编程概念的形成,让程序变得更加清晰、模块化,极大提高了软件开发效率。20世纪80、90年代,伴随着个人PC时代的普及,集成开发环境(IDE)和各种编程语言的编译器等软件开发环境和工具得到了极大的发展,我们听过的C++、Java和Python等语言也正是这一阶段开始流行的。到了21世纪初,随着互联网普及开来,软件开发的发展趋势呈现出敏捷开发的特点——强调快速迭代和跨功能团队的合作。这阶段我们大多数人就比较熟悉了,随着云计算技术的快速发展,软件开发也变得更加灵活和可扩展,微服务架构(通过将应用程序分解为一组小型、独立的服务,提高了系统的可维护性和可扩展性)的软件设计方式和低代码/无代码开发平台进一步提高了开发效率和降低了软件开发的门槛。

1. 早期时代:

2. 个人PC时代:

3. 互联网时代:

4. 大数据时代:

时至今日,在生成式AI技术日臻成熟的背景下,于结构化的编程语言而言,生成式AI在很多方面处理起来都更加简单和高效,软件开发难度和上手门槛越来越低,效率越来越高以及成本越来越低成为了一种必然趋势。

不过必须要承认的是,当下AI开发依旧存在一些痛点:

1. 流程复杂:

从端到端的应用开发包括需求分析、设计、编码等多个复杂环节。自动化整个流程需要涵盖广泛的知识和处理复杂的决策逻辑,这对于目前的人工智能系统来说是一个挑战;2. 沟通协作成本高:软件开发从来就不只是技术活动,还包括沟通协作、问题解决等人类因素,而这些恰恰是目前的AI技术难以覆盖到的;3. 需求定制化:每一个开发项目都有独特性,包括特定的业务逻辑、技术栈、开发规范和客户需求等,也因此要创建一个能够广泛适应这些个性化需求的端到端自动化工具是很困难的。

而这也正是星辰大模型·软件工厂被推出的原因。

作为一套全新的开发工具,星辰大模型·软件工厂是中国电信人工智能研究院以需求设计编写为核心,通过使用语言模型生成程序代码的基础底座型平台。

此外,中国电信人工智能研究院还为企业提供了从项目创建到应用、自动写代码、上线、更新以及后续迭代等全流程自动化应用生成等全流程工具,从而让需求分析和业务人员可以快速搭建自身的业务应用。

可能这么一大段描述,大家很难具体感知到星辰大模型·软件工厂的独特之处,这里我可以举个例子。

一般来说,一个软件开发项目的过程可以分为以下几个阶段:

需求分析——产品设计——产品研发——测试部署——产品迭代(新增需求)——交付。

传统软件研发过程

产品研发环节来说,按照传统的软件开发流程,一般是由10~15人开发人员分成不同的小组,夜以继日地开发、讨论,想要进入下一个环节,可能需要半个月~1个月的时间;

而到了测试部署环节,测试人员需要开展单元测试、集成测试等,撰写测试报告,并再次回到研发阶段进行开发讨论,修改bug,整个过程可能又需要十几天乃至数十天。

这还没完,产品还面临迭代、增加需求等问题,这个环节同样需要花费大量的精力和时间,最终等到客户全部需求都落实,才算真正完成交付,并且整个过程还可能因为各种意外拉长开发时间战线甚至是项目推迟。

而如果借助星辰大模型·软件工厂进行软件开发,无疑是把上述的所有环节在实操难度、时间维度、协作融洽度等多方面都简单化了。

同样的一个项目,传统的产品研发需要15个开发员工、20天时间,借助星辰大模型·软件工厂的生成式AI大模型,则只需要2名员工1天时间就能搞定;

再拿测试部署环节来说,星辰大模型·软件工厂具备一键部署的功能,可以在完成测试的同时直接修改bug,传统的测试部署需要数天,星辰大模型·软件工厂可能数分钟就完成了;同样,在产品迭代环节,星辰大模型·软件工厂也只需要修改PRD特定部分,就可以迅速完成部署。

可以说,在很多我们平常容易忽视的领域,AI已经在持续地改造大部分传统业务流程,将我们的工作效率带到前所未有的高度。

而这对于众多中小企业老板和我们大多数人来说,是一次巨大的挑战,但也是当下AI时代又一次拉开差距的机会。

改变正在发生,我们不能视而不见。

三、星辰大模型·软件工厂“横空出世”的背后,为什么是中国电信?

在今年3月份的《哈佛商业评论》中一篇文章《人们究竟如何使用生成式AI》提了一个有趣的问题:

在全球十多亿脑力劳动者当中,只有大约15%在使用生成式AI工具,那么,剩下的85%为什么不使用?

回答是有些人认为现阶段没有起到太大作用,有些人则因为它们经常给出错误的答案,还有些人认为用户体验不够好。

但其实,AI从来不是新鲜事物。

自1956年达特茅斯会议上首次提出“人工智能”这一术语后,距今已有近70年的历史。

从20世纪八九十年代的符号推理、机器学习;再到千禧年初重获关注的深度学习,以及如今热门的生成式AI,人工智能从最初的概念探索演变到现代技术的突破。

尤其在近十年,以卷积神经网络(CNN)为核心的计算机视觉技术,和以大模型为代表的自然语言方向,让AI跨入认知智能主导的时代,并加速改变传统产业的工作模式。

截至目前,生成式AI大模型的技术能力已经满足甚至超过了很多重复性工作的要求。但却依旧只有约15%的脑力劳动者在使用,很显然,问题其实出在了产品端。

所以也就不难理解星辰大模型·软件工厂这一产品上市的意义了。

当下很多人对于所谓生成式AI或者大模型产品过于追求所谓的某一方面的极致,要显得自己的产品有多么的高科技,就像讨论新质生产力这个概念,很多人会觉得这个概念过于“高大上”、遥不可及,但归根结底,无论是前者,还是后者最终是要回归到用户本身,“下沉”到用户中去,真正地解决用户的痛点,降低用户的上手门槛,为用户带来降本增效。

并且,你如果真要提一些硬实力或者高科技什么的,星辰大模型·软件工厂在这方面也是一点不虚同行的。

为什么这么说?

因为星辰大模型·软件工厂背后,站着的是一整个星辰大模型家族和中国电信。

很多人可能不知道,早在去年五月中旬,经过数十版模型训练与优化,中国电信就已经完成了百亿参数星辰AI大模型版本的训练;而后,去年11月份,又进行了迭代,完成了千亿参数版本的星辰AI大模型,中国电信也凭此成为了央企中首位完成大模型研发和开源的选手。

截至今天,从最基础的星辰语义大模型到星辰语音识别大模型和星辰多模态大模型,中国电信旗下的大模型始终保持着快速迭代,目前已经完成语义、语音、视觉等多模态大模型布局。

并且值得一提的是,这些大模型产品均处于行业领先。拿星辰语音识别大模型来说,此前其已经获得了多个国际权威赛事冠军。

比如在权威国际语音顶会Interspeech 2024离散语音单元建模挑战赛的ASR赛道中,星辰语音识别大模型团队领先于约翰霍普金斯大学、卡内基梅隆大学、英伟达等国内外知名高校与企业,一举拿下赛道冠军。

另外在方言识别上,星辰语音识别大模型也训练了数十种方言能力,这意味着你以后去全国各地旅游,如果当地的一些人用方言跟你交流,你也不用担心听不懂,手机里搭载了星辰语音识别大模型就足矣。

事实上,在海内外众多的大模型玩家中,中国电信无疑是特别的一位。

在当下这一阶段,像中国电信这样的运营商具备了诸多优势:

首先,数据。对大模型来说,数据无疑是重中之重的,尤其是在当下,中文互联网数据由于信息壁垒、数据孤岛、大量无用信息冗余等特点存在获取困难、质量不佳等问题。

而除去大量来自书籍、网络辞典以及大量公开的文献文章等通用数据,电信凭借自身过往的业务也沉淀积累了大量的行业数据。

而这使得星辰AI大模型的中文训练数据超25TB,中文总token量更是超8万亿。

而在经过了Knesey-Ney技术过滤、Minihash+Jaccard排重,以及几百人专业标注团队的人工标注,这批数据也为星辰AI大模型算法训练打下坚实基础。

第二,算力。不论是国内大模型的迅速崛起,还是各行各业智能化转型的加速,其实都离不开强大的算力作为支撑。在这方面,中国电信有着丰富的网络和算力资源,在大模型建设上能够更容易发挥规模的优势。

比如支撑起整个星辰大模型家族的是星河AI平台,它是全球首款以云网融合为核心架构,搭载“全网、区域、边、端”四级算力,拥有31个省级算力集群的人工智能产品和能力平台,可以实现AI能力一键下发、快速部署、全场景应用。

简单来说,就是来自集团的2大核心算力集群(包含近万台GPU)与31个省级算力集群(同样近万台GPU)进行云边端协同,实现算力资源全国统筹调度管理,可以说完全不用担心中国电信会遇到算力不足的情况。

第三,强大的科研团队。值得一提的是,在2024世界人工智能大会(WAIC2024)中国电信星辰人工智能生态论坛上,除了发布星辰大模型·软件工厂,中国电信人工智能研究院(TeleAI)在论坛上也正式揭牌,AI领域Fellow大满贯科学家李学龙担任院长。

中国电信人工智能研究院(TeleAI)揭牌仪式

此外,中国电信已经组建了一支近800人的研发团队,由李学龙教授亲自牵头,不断开展基础、前沿研究。作为央企在AI领域的主力军,TeleAI正在成为人工智能领域的国家战略科技力量。

第四,中国电信有庞大的客户群体,以及丰富的2C、2H、2B的信息服务业务。这意味着中国电信能够更快地推动人工智能大模型在各个领域的落地,形成新的经济增长点。

目前,中国电信已打造出基础模型+行业模型+应用模型的布局,除了自研本身,还采取了生态合作的方式,联合头部生态构建了涵盖教育、政务、应急等32个行业大模型,覆盖全行业500多个应用场景。

新技术的繁荣,注定是源自于应用和场景的繁荣。

两年前的今天,我们还很难想象AI具体能带来什么。

但时至今日,我们看到AI不仅可以创作文字、图片、视频,还逐渐应用到了办公、编程、无人驾驶以及具身机器人等各个行业,并且始终保持着一往无前的姿态,颠覆着我们的想象和未来。

四、结语:一切才刚刚开始

“强大人工智能的崛起可能是人类遇到的最好的事情,也可能是最坏的事情,但我们还不知道答案。”

物理学家霍金在生前讲过这样一句话。

这句话放在现在依旧是那么的合适。可以说,人类和AI呈现一组统一与对立的矛盾关系:

人类创造AI、控制AI、受益于AI,但又始终警惕AI、恐惧AI。

在《终结者》系列、《黑客帝国》系列以及《银翼杀手》系列等无数的科幻作品中,我们始终能看到这种矛盾复杂的感情。

是否有一天,人类终将会被AI取代?

这可能是当下很多人都会在脑海里冒出来的一个问题。

好比地球是一本期刊,从远古到农业革命到工业再到信息革命,人的影响因子在这个过程中是一个不断被放大的过程,逐渐演进的科学技术是一个杠杆,人类永远站在不断延长的那一侧,撬动着整个地球。

而到了AI时代,当人工智能一脚把人类从杠杆的一侧踢开,自己站上去时,地球这本期刊,人的影响因子还会不断放大吗?

当然,现阶段来看,这个问题还显得有点遥远,甚至是杞人忧天了。

事实上,一切才刚刚开始,而我们所能做的就是,不要温和地走进那个良夜,而是学会拥抱AI,拥抱星辰大海。

让自己始终留在牌桌之上,而不是被时代的列车抛下。| 沈望望

排版

编辑| 微澜轮值主编| 夏昆

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部