低门槛重构人机交互,百度想要创造AI应用的未来

低门槛重构人机交互,百度想要创造AI应用的未来
2024年04月29日 20:01 VR陀螺

文/VR陀螺 

“大模型本身并不直接创造价值,基于大模型开发出来的AI应用才能满足真实的市场需求。”

“未来自然语言将成为通用的编程语言。你只要会说话就可以成为一个开发者,用自己的创造力去改变世界,而这一天并不遥远。”

2024年4月16日,VR陀螺受邀参加“Create2024百度AI开发者大会”,在会上,百度创始人、董事长兼首席执行官李彦宏直接对大模型的落地方式进行了定性。

面对着台下激动的开发者群体,李彦宏开场并没有直接对大模型高谈阔论,反而是将话题放到了“大模型到底改变了什么”上。 

图源:百度

 大模型与生成式AI:变革开发方式,释放全民创造力 

百度将生成式AI的应用场景最先定位到了编程领域。传统编程依赖于严谨的代码编写,而今,大型模型与生成式人工智能正颠覆这一常态。

在ChatGPT问世后,社会各界普遍预见到AI技术将对所有行业带来深度变革,引发各领域的工作模式重构。一方面,部分岗位可能会面临被AI技术取代的局面;另一方面,许多工作也将经历形态与方式的显著调整,其中就包括编程技术。

不久前,以“世界第一位人工智能软件工程师”为噱头的超级智能计算机程序“Devin”问世。

图源:网络

Devin犹如一位智能化的软件工程项目助理,仅在接收到简洁明了的指令后便能自主完成编程、搭建网站及开发软件等任务,其独特优势体现在具备破解复杂难题的能力,善于从过往错误中汲取经验,并熟练掌握并运用人类工程师日常工作中不可或缺的各种工具,且随着使用时间的增长,Devin还能持续进行自我优化升级。

虽然在风头过后,Devin背后的公司Cognition被质疑演示视频造假,但AI改变程序员行业的势头还是让不少人类工程师彻夜难眠:AI程序员可能是假的,但AI编程助手却已经成为现实。

以百度Comate为例,这款基于文心大型模型的智能代码助手覆盖百种语言与所有IDE平台,不仅能推荐代码、撰写注释、检测缺陷、提出优化策略,甚至能深度解读现有代码并生成全新代码。

短短一年多,Comate已入驻数万家企业,其生成代码占比高达46%。仅在百度自家每日的新增代码中,就有27%出自Comate。

在李彦宏看来,自然语言将成为编程的通用语言,开发者无需精通编程语法,仅凭自然语言交流即可驾驭技术,创新世界。在生成式AI的加持之下,从代码到语言,开发门槛骤降,无编程背景的个体如今也能轻松构建智能应用,成为创新力量。

在现场,百度给出了一组数据。自去年3月16日首发以来,文心一言用户数已经突破了2亿,API每日调用量同样也突破了2亿,服务的客户/企业则已经达到了8.5万家。

再加上Vision Pro等XR设备对沉浸式办公的普及,虚拟空间对办公场景的再塑造以及AI技术对于办公流程的变革使得编程体验做到了快上加快。

图源:百度

当然,大语言模型本身并不直接创造价值,基于大模型开发出来的AI应用才是能够真正的满足市场需求的东西。

过去一年,利用千帆平台开发出来的AI原生应用数目超过了19万,面对大型模型热潮,李彦宏强调其价值在于驱动AI应用创新,并分享了三条基于大模型开发AI原生应用的实战路径:“这是百度根据过去一年的实践,踩了无数的坑,交了高科学费换来。”

一是“MoE架构”:未来大型AI应用将以MoE(大小模型混合)架构为主,依据场景灵活匹配模型规模;

二是“小模型”:低成本、高速响应的小模型,经精细调整与SFT处理,在特定场景表现媲美大型模型。

三是“智能体”:智能体具备理解、规划、交互等能力,能自主完成复杂任务,实现自我迭代进化。

作为开发者大会的重头戏,百度也为开发者们备好了上述三大方向的开箱即用工具,并现场手把手教学。

 拥抱大模型时代:人人都能三步成为开发者 

在对“人人都能成为开发者的阐释”中,百度抛出了一个绝佳的例子:今年年初举办的百度AI原生应用开发挑战赛中,冠军选手在没有手写一行代码的情况下就开发出了一款游乐场排队规划助手应用,最终斩获10万元大奖。

图源:百度

按照百度的说法,对于有编程基础的开发者来说,这样的应用程序可能并不难写,但对于没有编程基础的人来说,基础模型带来的低代码甚至是零代码开发模式就十分重要。

如果你是新加坡旅游局的开发人员,你要如何开发出一个能够解答问题、提供指导方案的国家旅游应用工具?

百度的答案是只要三步。

首先,在文心平台的创建页面,选择“零代码”模式,通过自然语言描述智能体工具名称。

其次,为智能体工具设定其解答旅游咨询、提供预订服务等职能,便于平台自动填充基础配置。

然后,如需专业级智能体,还可以进一步添加官方知识库、实时更新功能,并集成酒店查询、门票购买等实用工具,实现全面服务能力。

在文心智能体平台Agent builder的帮助下,用户便可以在百度APP中与智能体交互,查询最佳旅游时间、获取景点推荐、直接预订门票等,享受无缝智能体验。

图源:百度

AI agent 概念火起来的时间并不算很长。在此前的一次公开演讲中,吴恩达就明确表示,采用代理推理设计模式能够显著提高工作效率,通过代理工作流程,人工智能能够胜任的任务种类将会大幅扩展。

那么,是不是意味着在人人都可以是开发者的时代,程序员们的生存空间就会受到挤压了呢?

一个主流的说法是:虽然生成式AI将逐渐改变各个行业,但软件开发模式的转型还没完成。

且不说以Devin为代表的的AI程序员还未能真正做到在效率上打败人类,就从程序员群体自身出发,作为一项需要终生学习的职业,程序员们在工作中本就需要接触大量的辅助工具,对于技术开发人员,与其说AI取代人类,不如说AI辅助人类更为贴切。

在美国技术研究咨询公司Gartner发布的2024年十大战略技术趋势中,就预测到了2028年,75%的企业软件工程师将使用AI编程助手。

在Software 2.0的概念中,随着深度学习的进步,我们可以构建一个神经网络,学习获得结果所需的指令或规则:软件能够解决更多问题,而这些问题是人类无法建模的。

在这种情况下,程序员将得到深度学习神经网络系统的帮助,角色也随之转变为“数据管理者”或“数据推动者”而不是被AI完全取代。

图源:Copilot X

在百度看来,普通人能够使用AI工具无痛打造出自己的智能助手,而开发者能够借助AI工具不断提高代码生成能力,将AI渗透到产品开发的全生命周期,专业的人更要做专业的事。

而对于开发者来说,“用好大模型的重点之一在于掌握模型增强的方法”,区别于低代码工具Agent Builder、App Builder,百度为编程基础的专业人员推出了专业模型定制工具“Model Builder”,通过数据集构建、模型精调与部署,让大模型更贴合特定应用场景需求。

以教育行业作文批改为例,作文批改有着明确的评分标准,但对于不同年纪的学生,批改标准和得分要求都不一样,这就要求大模型有充足的数据训练。

现场演示案例中,用于训练的原始数据只有180套,质量也不够高,这就要求Model Builder必须能做到数据清洗、数据标注和数据增强,对大模型进行精调。

通过将低质量原始数据从180套扩充至920套高质量数据,并选择基础模型进行训练,Model Builder将精调后的模型部署至平台。

在Agent Builder、App Builder与Model Builder三大工具的加持下,大模型到AI应用的落地方向拓展到了工作、学习等生活的方方面面。

图源:百度

根据百度的统计,文心一言平台自上线以来71%的使用场景集中在了工作领域,包括对于沟通技巧、管理技巧、职业技能、专业能力等的提升上;17%用在生活领域,包括对于衣食住行等方方面面的咨询解惑,还有12%跟学习相关,主要在教育领域的知识问答、培养兴趣等。

大模型使用门槛的降低让每个人都能成为开发者,通过打破技术壁垒,赋予全民创新力量,加速各行各业迈入大模型驱动的智能化新时代,通用人工智能未来已来。

 AI的下一步是具身智能:人机交互体验正在重塑 

在AI应用的热潮之下,对于AI的落地方向还着重强调了AI原生人机交互,软硬件深度融合如何推动AI技术与应用的革新与普及成为AI时代的新选题。

百度智能云事业群总裁沈抖认为:“回顾整个IT的历史发展史,我们发现软件跟硬件的合作是互相促进的,缺一不可。”

在过去的一年,对于AI技术的吐槽中总是不乏一种声音:为什么AI没被用在做家务、做饭、解放人类双手上,而是最先开始跟打工人抢饭碗?

对于很多人来说,AI应该将重心更多放在如何帮助人类解决现实中的难题,而不只是写写画画。这种对于AI落地的现实想象也意味着具身智能将成为引领人工智能的下一波浪潮。

AI原生应用的时代已经解开了序幕,那么最适配AI原生应用的会是什么?

百度的答案是AI家庭机器人。

作为全场开发者大会的压台好戏,小度科技CEO李莹重磅介绍了小度添添AI平板机器人以及为小度量身打造的全球首个AI原生操作系统DuerOS X。

图源:百度

这款基于百度文心大模型构建的操作系统——DuerOS X打破了“人适应系统”的传统模式,实现了端到端连接用户意图与任务,极大地拓宽了操作系统的功能边界。

而早在开发者大会开场,李彦宏就已经通过自然语言交互完成了与小度添添AI平板机器人的互动。

经过一系列对话,小度展现出了精准处理繁杂日程的能力,不仅在智能程度、执行效能和理解用户需求方面有了显著提升,同时由于其生动活泼的言语交流形式,更增添了提供情感陪伴的新功能,被李彦宏评价为“有望成为一款适用于广泛用户群体、实用且富有人性化内涵的AI伴侣。”

图源:百度

李莹认为:“小度AI智能助手是百度文心大模型规模化应用的典型代表,DuerOS X的推出预示着AI原生应用进入全新纪元,有力推动AI原生应用跨入崭新的发展阶段。这款操作系统将为我们解锁前所未有的智能化体验,翻开智能生活的新篇章。”

从现场体验来看,小度添添AI平板机器人中搭载了多个数字人AI应用程序,除了能讲睡前故事的“数字人偶像”之外,还有能指导健身动作要领的数字人健身教练兼健身搭子。

这一功能实际体验类似于百度之前推出的另一款AI产品“智能健身镜”,运动过程可以参照任天堂健身环,只不过对于健身动作的识别不依赖于控制器配件,而全部由平板机器人完成。

在全民健身火热的当下,百度对于AI健身产品/应用的打磨其实已经很接近于VR健身的概念。同样是在虚拟游戏的框架下、在技术手段营造出的有限空间中挥洒汗水,区别只在于沉浸式体验的深与浅。

或许,百度在未来可以将小度AI智能助手融入以希壤为代表的的XR技术场景中,在虚拟空间中复刻小度添添产品带来的智能健身体验,冲击未来十亿量级的VR健身游戏市场。

毕竟,相比于VR健身来说,对于具身智能的探索还需要时间,即使搭载了DuerOS X,小度添添AI平板机器人也还未达到真正的具身智能。

平板机器人的形态更像是此前已经有广泛应用的家庭语音助手的升级版,无法产生更多“识别语音、回答问题”之外的智能行为和环境适应性。小度似乎还是只能待在原地,循着声音来源方向转向用户,并发出一声甜美回应。

设想一下,如果可以参考波士顿动力已经下线的液压机器人Atlas以及 Engineered Arts推出的人形机器人Ameca,当家庭机器人能跑能跳、能哭能笑,具身智能才算是真正渗透到家庭生活中。

图源:网络

总的来说,技术总是在磕磕碰碰中前进的,回顾整场开发者大会,就像本次的主题一样,在对AI的探索中,百度也正在“创造未来”。

百度以大型模型与生成式AI为核心,构建了完善的工具链、操作系统以及创新硬件产品,不仅在技术层面实现了开发方式的变革,更在理念层面倡导并践行“人人皆可开发者”的愿景。

“未来开发应用就像拍个短视频一样简单,人人都是开发者,人人都是创造者。”

在开发者大会现场的掌声之中,李彦宏还宣布第二届“文心杯”创业大赛正式启动。除了项目筛选范围扩大、设置分赛场外,百度还首次设立了“特别大奖”,最终获胜的AI原生应用项目将有机会获得最高5000万元的现金和资源支持。

AI工具普及带来的AI应用的繁荣不仅为大模型落地创造了条件,更深刻地影响了社会对技术创新的认知与参与,标志着一个全民创新、通用智能的新时代已然来临。

在这样的时代背景下,每一个个体都有可能借助强大的开发工具与平台,释放自身创造力,参与到这场前所未有的智能化进程中,共同描绘一个更加智慧、便捷、人性化的未来世界。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部