实现准确无误的生成式 AI 对话搜索,从搜索转向答案引擎,Vectara如何做到?

实现准确无误的生成式 AI 对话搜索,从搜索转向答案引擎,Vectara如何做到?
2023年05月31日 21:50 新芒xAI

只因为将ChatGPT的能力植入到了必应搜索引擎,让新版微软必应2月发布后下载量跃升8倍,让生成式AI的魅力尽显。

如何借助AI的能力,让回答更符合用户的需求、命中度更高,成为以搜索引擎为代表的各个场景的必答题。

我们注意到有这么一家公司,叫Vectara,喊出了旨在实现无差错的生成式 AI 对话搜索。正是在今天,我们注意到他们宣布获得 2850 万美元(约 2 亿元)种子轮融资的消息。

那么这家公司有哪些能力,能实现准确无误的生成式 AI 对话搜索?我们试图做一个详细的探寻。

Vectara作为人工智能对话搜索平台不断发展壮大。这家总部位于加利福尼亚州圣克拉拉的初创公司于 2022 年 10 月悄然崛起,由大数据供应商Cloudera的前首席技术官兼创始人领导。

Vectara 最初将其平台标记为神经搜索即服务技术。这种方法结合了基于 AI 的大型语言模型(LLM)、自然语言处理(NLP)、数据集成管道和矢量技术,以创建可针对搜索进行优化的神经网络。

现在,该公司正在通过生成式 AI 扩展其功能,生成式 AI 提供结果摘要以提供更具对话性的 AI 体验。该公司还增加了所谓的“grounded generation”功能,以帮助降低人工智能幻觉的风险并提高整体搜索准确性。

Vectara的使命是帮助世界通过搜索找到意义。该公司利用人工智能和神经网络技术的最新创新进行自然语言处理,提供无与伦比的搜索相关性。

他们这样写道,不仅仅是为你的数据提供另一个ChatGPT。Vectara是一个开发者优先的API平台,用于轻松构建对话式搜索体验,其特点是一流的检索、总结和 "接地气的生成",几乎消除了幻觉。

在介绍搜索产品时,他们主打用LLM驱动的搜索找到你要找的一切。

Vectara使用尖端的LLM搜索技术,开发了一个搜索即服务平台,在一个综合平台内提供全面、易于使用的搜索管道,是在您的网站或应用程序上提供或增强搜索的理想选择。

如果你想体验,可以去这个网址:https://vectara.com/why-vectara/,提交申请,免费使用。

Vectara 首席执行官兼联合创始人 Amr Awadallah 表示,这一切都是为了摆脱传统,这是一个为您提供结果列表的搜索引擎,而 ChatGPT 让我们大开眼界,即所有消费者想要的就是答案。我们只想要答案,不要给我结果列表。

正因为这些前沿的技术和用户体验的理念,Vectara 完成了 2850 万美元的种子轮融资。种子轮包括 Vectara 先前于 2022 年 10 月宣布的 2000 万美元。这笔资金由 Race Capital 牵头,新的战略顾问委员会包括 Databricks 首席技术官 Matei Zaharia。

生成式 AI 驱动的搜索竞争越来越激烈

当 Vectara 于 2022 年首次出现时,生成式 AI 搜索领域几乎没有竞争对手,但这种情况在 2023 年的短时间内发生了巨大变化。

近几个月来,谷歌在 5 月 15 日的谷歌 I/O 大会上宣布了其生成搜索体验的预览,从而进入了该领域。微软的Bing 与 OpenAI 集成,也提供了生成式 AI 体验。5 月 23 日宣布的更新还扩展了Elasticsearch以集成生成式 AI。

Awadallah 非常清楚竞争日益激烈的环境,并对他的公司的差异化充满信心。Vectara 平台的核心元素是所谓的“检索引擎”,该技术将正确的语义概念与矢量数据库中的条目相匹配。

Vectara 检索引擎的原始基础来自 Awadallah 的联合创始人 Amin Ahmad 2019 年在谷歌时所做的研究。这在2019 年的一篇论文Multilingual Universal Sentence Encoder for Semantic Retrieval中有所描述。Awadallah 解释说,Vectara 改进了最初的设计,提供了一个高度准确的检索系统。

合理的生成式AI是怎样的?

在新更新之前,搜索平台为用户提供了受益于语义关键字和 AI 功能的结果列表。然而,结果列表仍然只是用户必须浏览才能获得答案的列表。

通过平台更新,用户现在可以获得生成式 AI 结果,该结果将汇总最相关的来源以提供查询答案。  

生成的 AI 结果(例如来自 ChatGPT 的结果)可能存在 AI 幻觉的风险,即会显示不准确的结果。Awadallah 解释说,LLM 会出现幻觉,因为该模型压缩了大量信息,并可能产生不真实的答案。

为了帮助解决这个问题,Vectara 集成了一种基础生成方法,其他供应商有时将其称为检索增强生成。基本思想是生成的结果与来源引用相关联,以帮助提高准确性并引导用户从原始来源获取更多信息。

Vectara 平台还使用所谓的“零样本”机器学习 (ML) 方法,使模型能够不断地从新数据中学习,而无需进行更耗时的微调和再训练。

Awadallah 说:“随着数据的传入,几秒钟之内,数据就已经成为混合的一部分,并将反映在引擎生成的答案中。”

总的来说,他强调他公司的战略是帮助企业不仅找到正确的搜索结果,而且为最终用户提供行动。

“从长远来看,我们相信我们正在从搜索引擎转向答案引擎,”Awadallah 说。“现在我们正在做的是‘答案引擎’——意思是我不给你返回结果列表,我给你答案。但如果你得到真正准确的答案,我们就可以从答案引擎转向行动引擎。”

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部