10万亿参数模型将涌现、“负责任的AI”从模糊到可执行:2022 年的 10 项人工智能预测

10万亿参数模型将涌现、“负责任的AI”从模糊到可执行:2022 年的 10 项人工智能预测
2022年01月04日 22:51 新芒xAI

作者|里昂     出品 | 新芒X

今天是2022年新的一年的第一个工作日,辞旧迎新,总归让人对接下来的时日充满期许。

有了2021年或好或坏的打样,2022年又将迎来怎样的局面也让人望而敬畏。

将视线拉回至前沿科技,终究会让人激动。

而AI,作为具有代表性的技术能力,继续发光发热大放异彩是必然,但是又将有怎样的趋势? 

我们今天注意到国际知名风险投资机构Radical Ventures的罗伯·托斯,近日又带来了一项关于人工智能的深度预测,通过国际化的视野,并从10个层面,涉及技术发展、商业进展和AI伦理等维度进行了详尽的阐述,现做一分享,希望给你带来启发。

全文高能,以下,Enjoy:

1:语言类 AI 将占据中心位置,与任何其他类别的 AI 相比,更多的初创公司在 NLP 方面获得更多资金。

语言是人类最重要的发明。比起其他任何属性,它更是我们人类智商的决定性标志。

语言渗透到每个行业的每一项商业活动的方方面面。因此,准确自动化语言的能力为价值创造开辟了几乎无限的机会。

在过去的几年里,一项名为Transers的基础性新技术颠覆和加速了自然语言处理(NLP)领域。

该技术由谷歌研究人员在2017 年的一篇论文中首次提出。我们现在才达到这种令人眼花缭乱的强大技术成熟到足以大规模生产和商业化的程度。语言类 AI 以及商业领域的一场革命即将到来。

风险投资家将在 2022 年向 NLP 初创公司投入创纪录的资金。领先的 NLP 初创公司 Hugging Face(最后估值为 4.4 亿美元)和 Cohere(最后估值为 2 亿美元)今年都将成为独角兽。

在未来的几个月和几年里,随着企业家在整个经济中确定大量基于语言的活动,以使用人工智能进行优化、自动化和转型,预计 NLP 创业创新将出现寒武纪式的大爆发。

2:Databricks、DataRobot 和 Scale AI 都将上市

这三家公司属于现代人工智能经济的第一波大赢家。它们各自提供工具和基础设施来帮助其他公司构建人工智能,反映了基础设施先于应用程序的跨技术周期的共同主题。

这三家公司都拥有惊人的高收入增长率,并且都在 2021 年从“首次公开募股前”投资公司筹集了大量资金,这些通常在公司上市前不久进行押注投资的公司包括:Franklin Templeton投资的 Databricks;来自 Altimeter 和 Tiger Global 的 DataRobot;从 Dragoneer、Greenoaks 和 Tiger Global拿到投资的Scale AI 。

公司通常会聘请备受瞩目的首席财务官为即将到来的 IPO 做准备。DataRobot今年 4 月宣布已聘请 Damon Fletcher(前 Tableau 首席财务官)担任该职位。与此同时,Databricks 首席财务官 Dave Conte 曾担任 Splunk 的首席财务官,他于 2012 年将公司做到上市。如果看到 Scale AI 在新年初期聘请了一位备受瞩目的首席财务官,也不足为奇。

3:至少有 3 家气候 AI 初创公司将成为独角兽。

气候技术已迅速成为初创公司世界中最热门的类别之一,今年有创纪录的风险资本涌入该行业。正如之前探讨的那样,在气候和人工智能的交叉点上,创业公司的机会比比皆是。

许多气候 AI 初创公司最近以大笔资金涌入现场(尽管迄今为止商业吸引力有限)。2022年,其中一些参与者将乘着气候技术的热潮,估值将超过 10 亿美元。最有可能的独角兽候选者将是为新碳经济构建工具的公司(例如,企业碳核算、碳抵消基础设施)。

潜在的独角兽:Cervest、ClimateAi、Gro Intelligence、Kettle、KoBold Metals、NCX、Pachama、Patch、Persefoni、Watershed

4:将为视频构建强大的新 AI 工具。

视频已成为我们数字生活的主要媒体。据思科称,到 2022 年,超过 80% 的互联网数据将是视频。每天有 70 亿个视频在 YouTube 上被观看,1 亿个视频被上传到 TikTok。从 Netflix 到 Amazon Prime Video,再到 Disney+,再到 Hulu,再到 HBO Max 等等,互联网流媒体服务的用户群和内容库不断膨胀。

然而与图像和文本等其他数据模式相比,迄今为止,人们对构建基于深度学习的产品和专门用于视频的功能的关注相对较少,这代表了巨大的市场机会。

从视频搜索到视频编辑再到视频生成,预计在 2022 年将出现大量视频 AI 工具。在后一类中,Synthesia本月早些时候的 5000 万美元B轮融资是未来发展的一个(既令人兴奋又令人不安的)迹象。

5将建立一个超过10万亿个参数的NLP模型。

今天的自然语言处理 (NLP) 领域是由越来越大的基于压缩模型的发展所定义的。这场“军备竞赛”将在 2022 年继续进行(尽管DeepMind最近在较小模型的力量方面进行了有趣的研究)。

2019 年,OpenAI 的 GPT-2 成为第一个拥有超过 10 亿个参数的模型(其 15 亿个参数在当时看起来大得令人难以置信)。2020年,GPT-3风靡AI社区,它拥有 1750 亿个参数,让之前的一切相形见绌。但 GPT-3 作为最大的 AI 模型的统治并没有持续多久,2021年,谷歌模型(1.6万亿参数)和北京人工智能研究院(1.75万亿参数)模型打破万亿参数壁垒。

预计今年大型语言模型的规模将继续增长。2022 年最大的模型很有可能来自 OpenAI,规模有望突破10万亿,或并被命名为 GPT-4。

6美国和中国在人工智能领域的合作和投资将几乎停止。

众所周知,美国和中国之间的紧张局势正在加剧,人工智能等尖端技术代表了冲突中一个特别有争议的接触点。到 2022 年,情况会变得严重,甚至更糟。

就在过去几周,美国政府将人工智能初创公司商汤科技、无人机公司大疆和其他几家中国领先的人工智能组织列入投资黑名单,这些都是中国最重要的人工智能公司之一。

美国外国投资委员会 (CFIUS) 正在采取越来越积极的行动,以阻止中国组织投资或获得美国的人工智能技术。由埃里克·施密特 (Eric Schmidt) 担任主席的有影响力的国家人工智能安全委员会 (NSCAI) 进一步煽动了与中国的人工智能军备竞赛,例如鼓励美国政府将美国大学在人工智能方面的研究与中国人隔离开来。

所有这一切的结果是:随着 2022 年的进展,美国和中国的参与者——企业家、投资者、企业、商业领袖、学术研究人员,几乎不可能就人工智能计划开展有意义的合作。

7多个大型云/数据平台将宣布新的合成数据计划。

获取正确的数据是当今构建 AI 产品最重要和最具挑战性的部分。与收集和标记真实世界数据集的现状方法相比,合成数据具有引人注目的优势。

Gartner预测,到 2024 年,合成数据将占 AI 开发使用的所有数据的 60%。Facebook两个月前收购合成数据初创公司 AI.Reverie 就像是煤矿中的金丝雀式的存在。

2022年,多个主要计算平台将启动新的合成数据工作,因为它们认识到这项技术对未来 AI 堆栈的重要性,并寻求吸引更多构建者加入其生态系统。

可能的候选人:亚马逊网络服务、微软 Azure、谷歌云平台、Unity Technologies、Scale AI

8多伦多将成为硅谷和中国以外世界上最重要的人工智能中心。

可以毫不夸张地说,现代人工智能是在多伦多发扬光大的,这要归功于 Geoff Hinton 等深度学习先驱的工作。尽管与其他地区相比,它产生的舆论和声量较少,但多伦多仍然是世界上最重要的人工智能中心之一。

人工智能人才蜂拥而至。根据最近的CBRE报告显示,多伦多-滑铁卢大都市区是整个北美技术人才的第二大市场(仅次于湾区),也是增长最快的第一大市场。

该矢量研究所,共同创办了在多伦多的韩丁,是全球最大的人工智能研究组织世界之一。从谷歌到微软再到 IBM,世界上最大的科技公司近年来都在这座城市建立了重要的据点。

从历史上看,多伦多以一流的人工智能研究中心而著称,但创业生态系统相对欠发达,这正在迅速改变。Ada(聊天机器人平台)、Cohere(NLP)、Deep Genomics(用于药物发现的人工智能)和Waabi(自动驾驶汽车)只是最近几个月获得巨额融资的多伦多人工智能初创公司的几个例子。

预计今年一年将有更多世界一流的人工智能初创公司从多伦多涌现。

9“负责任的人工智能”将开始从一个模糊的包罗万象的术语转变为一套可操作的企业实践。

人工智能技术的改进速度超过了我们负责任、合乎道德和公平地部署它的能力。

由 Timnit Gebru、Joy Buolamwini 和 Cathy O'Neill 等研究人员领导的倡导负责任地使用人工智能的运动日益壮大。这种对更负责任的人工智能的推动跨越了一系列广泛的问题,包括人工智能偏见、数据来源、模型可解释性和模型可审计性。

尽管对这些问题的认识不断提高,但该主题仍然足够抽象,以至于总的来说,人工智能从业者并没有将“负责任的人工智能”实践融入他们的日常工作流程中。

随着负责任的人工智能实践和工具包的产品化和可操作化,2022 年将开始改变。这些产品将来自科技巨头(例如 Microsoft、IBM)和新创公司(例如 Parity、Fiddler Labs)。随着时间的推移,负责任的 AI 实践将从具有前瞻性思维的组织内部的“再好不过”的努力转变为跨行业的标准实践。

监管将提供重要推动力:例如,参见欧盟提议的人工智能法案和纽约市的新法律,强制要求对在招聘决策中使用人工智能的公司进行审计(同类首创)。企业自我调节的努力也将在这里向前推进。就在近日,包括沃尔玛、耐克、通用汽车和 CVS 在内的一组财富 500 强公司宣布成立数据与信任联盟,这是一个跨行业联盟,其既定目标是“检测和打击算法偏见”。

10强化学习将成为越来越重要和影响力越来越大的人工智能范式。

当今人工智能的主要方法是监督学习,它需要收集大量数据,标记它,并将其输入到人工智能模型中,以便人工智能学习关于世界的有用模式。无监督学习,一种类似的方法,但不需要人工生成的标签,近年来也开始受到关注。

但是人工智能还有另一种范式,它已经存在了几十年,但其巨大的现实世界潜力才刚刚开始变得清晰:强化学习。

在强化学习中,AI 没有根据历史真实数据进行训练;它没有给出“答案键”并告诉它要注意什么,就像在监督学习中一样。取而代之的是,它被允许以开放的方式探索其环境,了解世界的发展,仅以它寻求优化的特定目标为指导。

强化学习为 DeepMind具有里程碑意义的AlphaGo 胜利提供了动力。越来越多处于 AI 前沿的研究人员和初创公司使用它来解锁前所未有的 AI 功能,从推荐引擎到机器人技术再到自动驾驶汽车等等。

强化学习可能会提供一条通向更复杂、更灵活的机器智能形式的途径。在几个月前发表的一篇煽动性论文中,DeepMind 甚至假设强化学习本身可以带我们一路走向“通用人工智能”。作为全球最先进的人工智能研究机构,DeepMind 的观点势必值得关注。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部