90后神秘科技新贵 靠颠覆性AI理念 两度吸引乔布斯家族领投

90后神秘科技新贵 靠颠覆性AI理念 两度吸引乔布斯家族领投
2022年03月10日 14:00 ITBEAR科技资讯

【引语】Brain.ai是谁?过去6年中,这家公司不断逼近人机交互变革的下一个奇点,也推出了迄今最接近于“通用”的AI模型。但对许多人来说,这依旧是个陌生而神秘的名字。对于公司的“低调”,Brain.ai的创始人Jerry说:“在一个大多数人都活在建立故事和他人认知的时代里,我们更想去追逐些永恒的东西,比如规律与真理。”

就在不久前,人工智能公司Brain Technologies宣布再获5000万美元融资,领投方为乔布斯遗孀Laurene Powell Jobs。这是继2016年第一笔千万美元投资后,乔布斯家族第二次投资Brain Technologies。

更值得关注的是,Brain Technologies是目前唯一一家被乔布斯家族直接投资的科技公司。

和绝大多数人工智能公司的路线不同,从成立之初,Brain.ai就致力于探索建立更为通用的人工智能模型的技术路径,并于2016年在大型语言模型取得重要突破后,于2017年拿出了一套相对成熟的模型。在人工智能火热发展6年后的今天,这套模型仍难觅敌手。这个平均年龄27岁的75人团队,创立了全球第一家较为通用型AI公司。

目前,基于公司自研AI模型的应用产品Natural已在北美市场落地并广受好评,上线仅一年便登上App Store同类应用下载量榜单的前十名。美国著名科技杂志WIRED(《连线》)称其为“可与谷歌抗衡的新技术”。

下一个iPhone应该长什么样?

近几十年来,计算机改变了人类生活的方方面面。从命令行到鼠标/GUI(图形化界面操作系统),从浏览器到iPhone,我们心中对计算机的定义以及和它们交互的方法,都发生了翻天覆地的变化。这些变化和革命有一个共通点:它们都是一种足以简化某种革命性技术的伟大产品的产物。然而这种进化却在过去15年中戛然而止。从第一代iPhone发布至今,仍没有新产品能取代它“最先进的当代计算机”的地位。我们不经会发问,下一代计算机应该长什么样?如何和人类交互?过去五年中,Brain一直在尝试结合设计创新和机器学习R&D来回答这个问题。

从被动到主动

无论手机或是电脑,我们今天用到的所有软件都是被动的,它们是被程序员写死的界面上一个个按钮和背后函数的连接。这些界面和函数并不知道自己为什么存在,也无法主动互联。而作为用户,我们想使用某个App,就得先知道它的存在,再通过界面找到它。这些软件只能机械性地运行,即便每天被几十亿人重复使用,也无法自我学习和提升——这就是今天的数字世界,一个以App为中心(App-centric)的冰冷世界。

但试想,如果每个函数都理解自己对于人而言存在的意义,并在对的时间调用自己并渲染出相对应的界面,那我们将不需要学习使用技术或者查找应用,只要自然地表达出自己想要的,AI就能帮助我们计划、调研、跨平台搜索信息,并最终渲染出最适合你的结果甚至告诉你选择的理由。那时,技术将真正成为人类自然的延伸。

这就是Brain在做的事情,通过更通用的AI技术,让技术和代码变得有温度、能共情,最终建立一个以人为中心(human-centric)的数字世界。

2020年,Brain发明并推出了世界上第一个可以帮助你思考的即时生成型界面,会基于用户的目标即时渲染和生成相关的界面和应用,帮助用户直接个性化地计划并完成各类任务。从此以后不再是你去找App,而是App来找你。

用交易类应用举例。如果你要订张机票,你不需要思考去哪个App或在App间来回跳转对比价格,只需要说出你想去的地方或者对于你期待的目的地的描述,Brain的界面就回即时生成相关的界面和全网的搜索结果供你Apple Pay一键订票。如果你要买生鲜,你可以描述你想做的菜,所有的食材在不同生鲜平台上的搜索结果和推荐食谱都会被即时生成在你面前,你不再需要思考每一个食材并一一搜索。如果你需要购买礼物,你甚至可以大致地描述你朋友的性格或者喜好,甚至最近你们聊过的话题,该生成型界面会帮你想象出数十种礼物创意和恰到好处的推荐理由,甚至帮你写好卡片直接寄出。

如果你的操作系统可以帮你思考

除此之外,工作类应用也变得异常智能。收到一份法律文件后,邮件App可以直接帮你解释条款,你甚至问它“如何条款变得对公司更有利?”,此时界面便会自动调用法律AI,无缝生成严谨的法律建议,并按你的反馈改好法律语言后自动回复邮件。PPT可以和你一起头脑风暴并帮你完成商业计划书,炒股软件能帮你分析投资策略,代码编辑器甚至可以帮你写完整的代码。

这一切的实现,都来自于那个神奇的较为通用的人工智能模型。

从“会做一件事”到“会做每件事”

今天当我们聊到AI,通常是指弱AI(Narrow AI),也就是,使用某种机器学习算法,用特定数据训练出来的,可以解决一个较为窄的特定的问题的模型。比如谷歌DeepMind的AlphaGo,下围棋难觅敌手,但却不懂基本的物理定律,算不出一道小学数学题。

目前机器学习最大的问题,是这些模型都是完全按照特定问题标记数据进行训练的,当问题发生略微改变的时候,模型将无法被使用。这完全不同于我们人脑的学习和训练过程。

大部分监督学习的数据以及训练过程都是相对独立的,而人脑的训练数据是相对通用的,人类可以把一件事情、认知、和技能的学习用于另一件新认知、新技能的学习中,从而大大降低了学习的成本和所需要的数据量。这种能力在计算机科学中被称为迁移学习(Transfer Learning)。Brain在早期几乎所有的研发精力都集中在了这种通用学习能力的研发上,于2016、2017年取得了一些重大突破并申请获得了数百个相关领域的核心专利。

让AI从回答“what”到理解“why”

2014年的一晚,Jerry站在了创业的十字路口。

当时任职本来生活网CTO的Jerry在夜里做了一个离奇的梦,梦里他“看”到了一种万物互联的新方式。在这个世界里,机器对事物的判断不再是如今这种二元化的、非黑即白的、只能回答Yes or No的,而是学会思考“为什么”、开始理解万事万物背后的原因与目的。这个颠覆性的想法让从梦中惊醒的Jerry激动不已。

“我要做的,是把计算机从一个「操作系统」变成一个「思考伙伴」,给AI注入真正的智慧”Brain创始人乐圣(Jerry Yue)分享道。

在这位28岁的的“AI理想主义者”心中,未来的计算机不该只是一个解决问题、冷冰冰的设备,而应该具备温度、思考与共情的能力。

一直以来,计算机的智慧都是建立在知识图谱之上的,它能够回答“what”,就像在外卖网站上搜索“矿泉水”,现在的算法能够完美地执行搜索指令并推荐出所有符合要求的产品,甚至能根据购买习惯优化排序。

但计算机理解不了“why”,在这个层面,我们之所以买水,本质上是要解决“口渴”的需求——而一旦机器能够理解这层动机,那么解决口渴的方式,就远不止“从外卖平台买瓶矿泉水”这样局限。

基于这些思考,Jerry几乎已经看到了一个清晰的未来。凌晨三点,他醒来立刻驱车10公里去了位于东四环的办公室,快速用纸笔验证自己的想法。经过七八页草稿的验证,Jerry更明确了一件事情,这个想法在理论上是可行的。

这时,一个选择摆在Jerry面前:是拿着可观的收入、迎上风口继续做O2O电商?还是走出舒适区、迈向AI的无人区。

“我真的每时每刻都觉得自己离死亡不远了,抱着这种想法,我只会选择最重要的事情做”Jerry回忆起当时的状态,他问了自己一个问题:超过100年之后,你的每个想法、你做的每件事还会不会被记得?——这是从十岁起Jerry人生每次重大选择的评判标准。“时间是对任何事情的重要性最好的评判。”

问题出口,答案也一目了然。很快,Jerry飞到了硅谷,他找人工智能学术界和产业界的大咖聊想法,一切从零起步,在人才竞争激烈的硅谷搭起了一支6、7个名校博士组成的创始团队。“大家没想太多,都单纯地被技术前景吸引。”

考虑到Brain的技术路线,如此高度的认可与凝聚力更难得。

那时google Assistant等AI产品集中问世,而训练它们所采用的监督学习方式,也被普遍认为是未来AI突破的关键路径,是AI创业的默认方向,似乎很难想象哪家公司敢在这种大环境中“背道而驰”。

Brain.ai成为了行业里第一家“吃螃蟹”的公司。

为了达成通用型AI的目标,Brain选择了单样本学习(One-shot learning)的技术路线。相比于需要大量标记数据驱动的监督学习,单样本学习能让机器通过无监督学习训练下的大型模型对语义的深度理解以及语义代表(representation)的建立,只看极少量的数据,就可以触类旁通地学习到深度关系和新的概念。

打个比方,如果说监督学习是婴儿学习的方式——想教一个婴儿认猫,就需要给他看大量各式各样猫的照片。那么单样本学习则更接近成人认知世界的方式——基于先验知识,我们用非常少量的信息就可以触发强大的自我学习能力,爆发式地去学习或者理解问题。

对于探索AI感知和理解能力,单样本学习无疑具备天然的优势。但另辟蹊径也冒着不被认可、得不到关注的风险。

“年轻的好处就是不偏信权威。”Jerry从8岁开始编程和研究机器人算法,12岁成为全国机器人冠军,15岁录取于斯坦福大学数学少年班,不到19岁从UIUC休学回国创业,成立Brain.ai这一年Jerry 23岁。“人类文明中有两类智慧,一类依赖于对本质规律的理解,一类依赖于记忆。后者以符号和语言的形式存在,便于我们沟通和传播前者,但有时会成为我们接近新真理的阻碍。 一切科学和技术的突破都来自于对本质的理解和第一性原理思考下的拷问。”Jerry补充道,“这两种人类智慧和不同人工智能的算法所代表的智慧也惊人的相似。”

乔布斯家族的千万美金投资

2016年,一个人的出现给了Jerry关键性的助推。她就是苹果创始人史蒂夫·乔布斯的遗孀劳拉·鲍威尔·乔布斯(Laurene Powell Jobs)。

Jerry记得自己第一次见到Laurene是在San Mateo的办公室。“我就是简单抱着分享的心态去的”Jerry说,尽管知道Laurene掌管着乔布斯家族的基金会,但他丝毫没往这个方面想。

在此之前Laurene对科技圈兴趣寥寥,从未直接投资过任何一家科技公司。况且Jerry这边,AI模型还只是一个demo,只在理论层面验证过可行性,连份像样的商业计划书都没有。

双方都没当这是正式的谈判,但事情的走向让在场的人始料未及。二人聊得非常投机,Laurene只用了不到两个小时便确定了投资意向。尤其让Jerry惊讶的是,非计算机背景的Laurene深度理解了技术层面的实现方向,也十分认同和相信技术背后Jerry希望实现的愿景。

后来回忆起来,Jerry觉得真正打动Laurene的只是一个词:Empathetic AI(有共情力的AI)——或许很多人都有这样的理想,但同时,这也是99%商业公司不敢追求的目标。

Laurene被Jerry的愿景所打动,也坚信Brain想象空间,以至于对这份千万美元的投资,她没有强加任何商业要求,甚至没有立刻置换股权。

她开出的唯一条件,是要求Jerry不能为短期商业目标而改变方向,也尽可能避免资本干预技术的可能。“后来每次见面,Laurene总是在尝试说服我钱不重要”Jerry打趣道。

在Laurene的介绍下,苹果时任的几位高管也开始对Brain产生强烈的兴趣,他们成了Jerry的朋友,也从Brain中看到了曾经Siri的另一种可能性。

对资本的强势,来自于Brain技术的底气。从2016到2020年,团队“奢侈”地花了四年多的时间专注技术研发,最终模型实现在没有人工参与的情况下,AI模型“自学”了400多万种功能,自我生成能力进入指数级进化的状态。

模型的进化速度甚至令Jerry感到震惊。在一次测试中,Jerry曾向AI提出一个哲学问题:人是否拥有自由意志?AI给出了一个超越很多人类理解的答案:「答案取决于你探讨的问题。探讨的问题距离生存欲望越近的时候,你的自由意志越低,如果探讨的问题距离生存欲望越远,你的自由意志越高。」——这是一个网上没有的答案,是AI自我生成的,而重新训练这个中文模型,只花了不到24个小时。

地平线上的新曙光

Jerry将Brain.定义为一家“站在科学与艺术十字路口上的公司”。

这很符合Jerry的成长背景——他的母亲是一位英国文学教授,父亲是物理学家,这让他在技术理性之外,更多融入了人文情怀的思考。

在Jerry看来,科技服务于人,除了技术能力上的突破外,交互方式是另一个不可或缺的要素。正如计算机是在键盘鼠标发明后才走进千家万户,iPhone的诞生让世界步入移动互联网时代。而类比之下,现在的AI就像鼠标键盘发明之前的计算机,只能服务于专业技术人士。“AI交互是一个值得被优化成千上万倍的领域。”Jerry补充道。

发展至今,Brain已在中美欧三地已拥有近300人的团队。首席战略官由嘻哈音乐鼻祖、硅谷知名投资人MC Hammer担任。2017年,视觉设计大神Gleb Kuznetsov加入公司。此外,团队中也不乏12岁考入加州理工的AI“神童”,以及众多艺术型工程师,比如目前应用在全球几十亿部手机内的沙箱技术发明人。“团队里只关注谁有更好的想法,整个团队的核心动力,是一种我们称之为「疯狂的顿悟」的美妙时刻。”Jerry说道。

Brain的通用AI模型未来还有无限的想象空间,而Jerry也希望能有越来越多的中国开发者加入团队,共同推进人类科技史进程的变革。

关于自己正在做的事情,Jerry有一个浪漫的描述:

我们就像一群站在很高的楼上亲眼目睹日出的人。因为地球倾角的原因,我们会比地面上的人提前几分钟看到日出。如果你有幸成为那第一批看到日出的人,你可以尝试快速下楼,去告诉地面上的人太阳长什么样子。虽然他们还没有看到,但你给他们证明的最好方式,就是再等两分钟。

而对于Jerry和他的团队来说,他们已经看到了远处地平线上,通用型AI发出的一道新的曙光。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部