一年半走访 100 家企业,阿里云寻找 AI 落地的答案

一年半走访 100 家企业,阿里云寻找 AI 落地的答案
2024年06月21日 14:34 晚点LatePost

“中国发展 AI 的优势是,我们离行业最近。”

今年 3 月,一个名为 “ MBTI 小行家” 的账号开始在微博上活跃,微博用户只要 @ 它,它就会根据用户的过往微博判断其 MBTI 人格类型,并解答疑惑。上线两周后,MBTI 小行家的微博粉丝就接近百万。

这位新晋网红并非真人,而是一个 AI 评论机器人,它是微博以通用大模型为基础架构,结合微博的数据训练和微调出来的模型。

微博 COO、新浪移动 CEO 王巍告诉我们,以 “ MBTI 小行家” 为代表的一批 AI 账号上线后,已让微博的互动率提升了约 10%,这是衡量互联网社区产品的重要指标之一。

从去年到今年,市场焦点是大型科技公司和大模型独角兽的技术、产品与价格竞争。微博等公司的实践是大模型热潮的另一面:一批公司已在尝试用大模型改造和优化已有业务流程,或寻找新的商业机会。

在教育领域,新东方用大模型智能定制学习计划、实时回复学生问题,学员满意度提升了 3%。营销推广服务商易点天下基于大模型和自己积累的广告营销数据研发了 AI 数字人,还使用生成式 AI 技术把视频制作时间从 12 小时缩短到了 5 分钟。中国一汽的大模型 GPT-BI 应用能在 5 秒内快速生成财务、质保等环节的多变量报表,该模型准确率达 92.5%。

类似的场景正在中国不同行业出现,这些变化被记录在《云上的中国 3:剧变中的 AI 时代》里。这本由财经作者吴晓波和阿里云联合策划撰写的书已在 6 月 12 日正式出版。

2020 年、2022 年间出版的《云上的中国 1》和《云上的中国 2》记录了中国企业如何使用云计算和大数据等技术从工业化转型向数字化。去年 8 月起,阿里云和吴晓波又陆续走访了约 100 家提供 AI 技术或使用 AI 应用和服务的企业,试图在这些公司的尝试中找到可能的 AI 落地答案。

第一批用起大模型的公司

“应用场景是我们这次最大的优势。” 吴晓波认为,中国人口多、市场大,过去多年的生产效率大幅提升,中国是世界工厂也是消费大国,有大量生产和消费场景,这都是 AI 可以改造和优化的对象。

在《云上的中国 3》拍摄走访的企业中,目前有两类应用 AI 的主流方式:一是把 AI 放到已有业务里,提升产品和服务效率或降低成本,这是一批成熟企业的选择。

“今年是专业大模型的元年。” 吴晓波观察到,这里的专业大模型与通用大模型对应,指面向不同行业、不同业务方向的大模型。

新浪微博从今年初开始在社区里添加大模型聊天机器人。王巍说,作为社交媒体平台,微博想用大模型实现 3 个效果:增加互动、帮助生成平台内容、提升平台影响力。上文提到的 “MBTI 小行家” 就是用大模型增加互动的尝试。

大模型目前仍有 “幻觉” 问题,即它会输出一些看似合理但不真实、不准确的内容。但这在微博的评论和互动场景中反而是个特色。微博特意保留了模型的一些幻觉,让它不时语出惊人。

微博也是电视剧、综艺等文娱产品的宣发重地,去年其广告营销服务收入占总收入的 87%,微博也正尝试用 AI 大模型生成影视角色账号等衍生内容。如去年的热播剧《长月烬明》中的男主角澹台烬和女主角黎苏苏的微博角色账号其实都是学过剧本的 AI 机器人,他们能代入剧中角色的人设与网友互动。

王巍说,微博未来还会邀请做 AIGC 的创业公司入驻,他设想的互动场景包括:用户在某文生图账号下写一句话,这个账号就可以自动以这句话为提示词生成图片,发到评论区。这是现在小红书等平台上不少真人博主吸引关注的方式,AI 可以让这件事自动化,增加社区活跃度。

智联招聘则把大模型用于提升 HR 客户的招聘效率和内部管理培训效率。智联招聘 CTO 王昊称,智联招聘从去年开始在通义千问大模型基础上完善 “招聘助手” 功能,还推出了 AI 发职位助手、AI 筛简历工具和 AI 处理投递助手等一批产品 ,这帮助智联的 HR 客户把发布职位的时间缩减了 90%、匹配效率提升 100%、处理投递的效率则提升了 300%。

为解决团队里数千名销售的培训问题,智联招聘还训练了大模型培训助手。这个专业模型学习了智联招聘的销售标准流程和话术,一线销售人员遇到问题可以直接求助于模型支持的聊天机器人,获得解决方案和话术建议。王昊称,这套嵌入了 AI 大模型的新流程已帮助智联招聘把销售人员的培训周期从两周缩短到了数天。

2023 年第三季度,技术咨询机构 Gartner 调查了 1400 名企业领导者,其中 45% 表示,他们的公司正在尝试使用生成式 AI 技术,10% 称已上线相关的解决方案;而在半年前,仅有 4 % 的组织已将 AI 实际投入使用。

还有一些公司用大模型和 AI 寻找新落地场景,建立新业务流程。

被记录在《云上的中国 3》里的童语故事是一个 AI 原生创业公司。去年 7 月,当时刚成立 3 个月的童语故事上线了 AIGC 儿童绘本产品,目前已有超 200 万用户。

当想给孩子制作个性化绘本的家长和一些幼教机构的老师在童语故事小程序里输入大致的故事方向和风格后,AI 即可生成完整故事,再根据故事生成有图像和声音的定制儿童绘本。

《云上的中国 3》纪录片中展现用户使用童语故事产品制作个性化儿童绘本。

在这套内容制作流程中,童语使用了多种模型,包括大语言模型通义千问、AI 绘画创作模型通义万相等。

“我们在等待国内出现像 Sora 一样可用的视频生成模型。” 童语故事创始人张华期待视频生成技术给定制化绘本带来更好的体验。

接下来,童语故事会上线 App 版本,并对部分功能收费。同时,童语故事也将为教育机构、出版社等企业客户提供定制化动画服务。

吴晓波告诉我们,他目前最看好的方式是在相对成熟的商业流程和业务中加上 AI:“大模型应用和产品就好像电钻,原来的应用则是锤子,大模型可以提升几倍的效率;而原本就会用锤子,且已经找到了钉子即应用场景的公司,能最快发挥电钻的价值。”

更快、更便宜使用大模型的方法

世界著名科技杂志《连线》的创始主编凯文·凯利(Kevin Kelly)曾在去年出版的《5000 天后的世界》中预测:未来将会是一切都连接着 AI 的世界。

下一代智能设备会进入生活;生成式 AI 能快速、高效地产出创意内容;智能化的咨询能给个人和企业提供更精准、便捷的体验,AI 也在支持人类更高效进行科学研究,比如更准确的预测天气,和预测蛋白质结构,帮助提升药物研发成功率。

这些涵盖生活、生产和科研探索的新技术和应用都需要 AI 算力基础设施支持,在一众希望抓住这个机会的中国科技公司里,阿里云是投入最激进的一家。

去年 11 月,刚刚担任阿里云 CEO 不到 2 个月的吴泳铭在季度财报分析师电话会上提出了阿里云新战略:“AI 驱动,公共云优先。” 这成为此后两百多天里阿里云的指向标:快速的模型迭代、大手笔的对外投资,升级基础设施、降低基础云服务和大模型 API 价格,阿里云的这些动作都加速了行业对 AI 的尝试和应用。

吴晓波在《云上的中国 3》中采访了阿里云计算平台事业部负责人汪军华,他提到模型和应用出来后,上亿用户每天都会用,应用和推理的成本会比训练高一到两个数量级,提升大模型的训练效率以及云计算的效率是各大 AI 企业和云计算提供方要面对的问题。

目前阿里云的 AI 大模型布局从上到下分为大模型本身,和使用模型的工具和基础 AI 算力,阿里云正试图用这些不同层次的技术和产品帮企业更高效地用上 AI 和大模型。

在模型层,阿里云自 2019 年就开始尝试训练大规模预训练语言模型,发布过语言大模型 Plug 和多模态大模型 M6。2022 年 9 月,阿里云正式发布阿里通义大模型系列,现已包含大语言模型、图片生成模型、视觉理解模型、音频理解模型和代码大模型等多个模型。

通义大模型也是最早开源的中国大模型之一。就在上周五(6 月 7 日),通义千问第二代开源模型 Qwen2 发布,包括 5 个尺寸的模型,最大的是 720 亿参数模型 Qwen2-72B。

在由开源社区 Hugging Face 组织的测评榜单 Open LLM Leaderboard 中, Qwen2-72B 目前排名全球第一,在自然语言理解、知识、代码、数学及多语言等多项能力上超过了同参数规模的 Llama3 和 Mistral8 等海外模型。

从一开始就决定不做大模型的微博,在调研后选择接入通义模型。微博 COO、新浪移动 CEO 王巍说:“我们自己测试了所有的大模型,通义不仅性能好,而且最有诚意,在去年 12 月就开源了第一版 720 亿参数的模型。”

开源高性能模型的同时,阿里云也把闭源模型的价格降到了同规模模型中的行业最低——今年 5 月,对标 GPT-4 的 Qwen-Long API 输入价格降至了 0.5 元 / 百万 Tokens。

腾讯、百度、字节也都纷纷降价或推出免费优惠,降价力度较大或免费的模型多为参数量更小的轻量模型。豆包最高性能模型 pro(128k)价格目前仍有 50 元 / 百万 Tokens。

在算力和模型工具层,阿里云自 2019 年以来一直是中国云计算市场最大的 IaaS (基础设施即服务)服务商。新的 AI 机会中,阿里云也在提供各种基础服务和工具。

阿里云的 PAI- 灵骏、飞天云平台等工具能帮助企业提高使用 AI 的效率。PAI- 灵骏能提供无服务器技术和高性能网络,调配阿里云在全国各个数据中心的算力;飞天云平台则能通过一系列设计避免故障导致的训练中断和重新计算,从而减少算力浪费。

一个案例是,吉利汽车 1000 个智驾模型的训练时长已从 3 个月缩短到云上的 8 小时,支持他们训练提速 200 倍、整体研发效能提升 20% 的,是在湖州的吉利星睿智算中心。吉利汽车研究院技术规划中心兼数据智能开发中心主任陈勇认为,组织和产品竞争力的提升,是技术价值的体现。

吉利汽车基于阿里云的工具,更高效地训练汽车行业模型。

去年,在飞天云平台基础上,复旦大学、阿里云和中国电信共同打造了为解决复杂科学问题而建立的科研智能计算平台 CFFF(Computing for the Future at Fudan)。复旦基于 CFFF 训练出了拥有 45 亿参数的伏羲气象大模型,可在 3 秒内预测全球未来 15 日的天气。

《云上的中国 3》中,复旦伏羲气象大模型的预测结果。

2023 年 10 月发布的百炼平台能帮中小企业和非 AI 企业更方便地定制自己的专属模型。

成立于 1996 年、提供电力终端用户计费和客户服务的朗新科技,通过百炼平台提供的定制化训练、微调、部署、测评等工具,结合电力行业专业语料,开发了自己的 “电力账单解读智能助手”,使人工处理工单量下降了 70%。

吴晓波在《云上的中国 3》走访期间曾提出一个问题:” 中国的百模大战,出口在哪里?“魔搭社区是他看到的可能答案。2022 年底,大模型热潮尚未到来时,阿里发起的模型社区魔搭(ModelScope)就已经上线,并上架了阿里自研的 300 个模型。

魔搭去年又陆续吸引了智谱 AI、澜舟科技、深势科技等其它 AI 公司上架其开源模型。该社区现在已有 4500 多款 AI 模型,聚集了 500 万开发者。

魔搭社区技术负责人陈颖达认为中国需要一个自己的开源模型社区:“我们相信模型的使用范式会发生变化,未来要让没有任何代码基础的用户也可以把示例代码跑通。”

今年初以来,阿里也成为了中国 AI 和大模型领域最主要投资方:先是投资大模型公司月之暗面 8 亿美元,此后又投了另一家大模型独角兽 MiniMax 数亿美元。国内大模型独角兽中,零一万物、百川智能、智谱 AI 也曾被阿里投资。

对 AI 的激进投入已部分表现在阿里云的业绩中:据阿里 2024 财年第四季度(2024 年 1 至 3 月),阿里云 AI 相关收入同比增长超 100%。

增长变稀缺,更多企业向技术要效率

云计算的进化和此次 AI 变革相辅相成。阿里云 CTO 周靖人去年曾告诉我们:“最初我们想把几百台(GPU)服务器连起来做训练都很难。云优化一点,大模型才能发展一点,模型发展到一定程度又遇到挑战,又需要云去升级。”

中国数家云厂商此前近十年里对数字化的推动也对 AI 在各行各业的快速渗透提供了一定基础。吴晓波在《云上的中国 3》中观察到,他走访的部分入通义大模型或阿里云 AI 基础设施客户,过去也曾是阿里云的存储、计算等基础云服务的客户。如给中老年用户做 AI 智能鼠标的拉酷创始人龚华超,创业之初,他公司的域名是在阿里云注册的,员工统一使阿里云邮箱, 算力也部署在阿里云上。

在《云上的中国》第一部和第二部中,记录了中国云厂商推动各行业上云的波折过程。

《云上的中国 3 》纪录片提到,各行业企业之前就在用产业互联网改造自己的业务,2023 年之后的明显变化是 AI 逆势崛起。

攀钢投资 300 多亿元建造了年产 450 万吨的大型钢厂西昌钢钒,在 2018 年,阿里云找到攀钢想要为这座大型钢厂提供数字化的全套解决方案。但攀钢觉得 1000 万的合作费太贵,于是阿里云先免费试点。阿里云的一位毕业于麻省理工的博士带着十余人在西昌钢钒所在地大凉山驻扎了一年多,他们做出的数字化方案中,仅是炼钢炉的铁水和合金添加和钢板表面检测两个项目就让攀钢省下了数千万元。

在成都到宜宾的成宜高速路段的一个检查站里,阿里云的二十多名员工自 2020 年起驻站了两年,搭建起了成宜高的车路数字孪生系统。

吴晓波发现,阿里云在最初服务这类非互联网和科技客户时,总想一口气提供全套解决方案,但在实施过程中逐渐认清,上云需要 3-5 年的共建。这之后数年,阿里云用一个个案例逐渐覆盖了智能制造、智慧城市和金融科技等垂直领域,了解了不同行业的需求,积累了解决方案,这些行业 knowhow 如今也能帮阿里云推动大模型在具体行业的落地。

他认为,中、美、欧在发展 AI 上各有优势:美国的优势在算法上,微软、Google、META 等大厂,以及 OpenAI、Antropic 等创业公司都在不断突破通用大模型技术;欧洲因工业基础雄厚,SAP、西门子等数字化厂商也积累了大量生成流程数据,这与 AI 结合后能提升工业生产力。

中国的优势则是:“我们离行业最近。” 吴晓波看到电商、金融、医疗和制造业等各种场景都可以结合 AI。在全球经济增速放缓的当下,越来越多的企业向技术要效率,寻找新发展方式。

未来更深入的智能化,还有基于新的 AI 技术发现新需求,乃至建立新商业模式。这可能是下一部走访中国企业智能实践的纪录片会观察的主题了。

题图来源:阿里云

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部