作为国内最知名的 AI 智能助手之一,Kimi 早就成了包括小雷在内很多人的「心头好」。但在此之上,月之暗面今天(10 月 11 日)又推出了 Kimi 探索版,按照官方的介绍:
Kimi 探索版可以自主海量搜索解决复杂问题。
事实上,之前就有爆料指出 Kimi 团队在国庆期间疯狂赶进度,就是为了即将上线一个「很牛的功能」。根据透露,这个功能可以回答简单搜索无法解决的问题,甚至可以自我反思。
现在来看,那个「很牛的功能」就是刚刚发布的 Kimi 探索版。不仅如此,现在我们还知道,Kimi 探索版可以「模拟人类的推理思考过程,多级分解复杂问题,执行深度搜索,并即时反思改进结果,」在一定程度上具备了 AI 自主搜索能力。
经常关注大模型的朋友,可能很快就会想到 OpenAI 在上月发布的 o1 模型,都是模拟和学习人类的推理思考过程,并且拆解复杂问题、反思和改进结果。但实际上,Kimi 探索版的体验又如何?
Kimi 探索版突破:会拆解任务了
正所谓「不看广告看疗效」,尽管官方表示 Kimi 探索版能够提供更全面和准确的答案,帮助用户更高效地完成分析调研等复杂任务,但 Kimi 探索版到底好不好用,还是只有用了才知道。
按照官方提供的信息,Kimi 探索版已逐步分批上线 Web 端,内测过程中用户每天能用 5 次,移动端 APP 则将在后续上线该功能。不过有幸,小雷的 Kimi 已经推送到了这个最新功能,可以在首页输入框下方直接开打。
打开「探索版」后,就会弹出提醒告诉我,「Kimi 会拆解复杂问题,做更深入的搜索。」比如 CS 本科学生可能非常关心的专硕申请情况,可以让 Kimi 探索版「分析一下 2024 年 QS 排名前 10 的高校计算机专业硕士申请情况」。
先不论生成的回答,首先我们能看到一个非常明显的变化,Kimi 探索版把任务大体拆解成了两步:一是搜索 2024 年 QS 排名前 10 的高校;二是分别搜索了解各家高校计算机专业的硕士申请情况。
Kimi 探索版就像一个有条理的分析师一样,基于大模型的能力识别用户的真实提问意图,并把复杂的问题分解为多个层次化的子问题和多个匹配的搜索关键词,然后分步骤执行。
不只是简单的「给你结果」,而是帮你「分析问题、找出答案」。
如果是常规的 AI 智能助手或 AI 搜索,面对类似的复杂问题,通常也只是将问题提炼成一组关键词进行搜索。如果能够搜索到现成的文章和数据,或许可以给出有价值的回答;但如果没有,AI 给出的答案可能表面上看着丰富,但实际信息密度很低,准确性也很难保证。
所以很多时候,很多问题,我们还是只能回到传统的搜索引擎,一步一步找。
与之相对的是,Kimi 探索版的多级分解与策略规划功能,通过模拟人类的思考过程,一定程度正在改变这种局面。在给出的回答中,不仅准确给出了 QS 前 10 的高校名单,还有比较明确的申请要求。
10 个网页不够用,那就搜索500 个
众所周知,数据对于 AI 输出结果有着很强的影响,这既体现在模型训练的过程中,但同时也体现在模型推理的过程中。
事实上,包括 Kimi 在内,不管是支持联网搜索的 AI 智能助手,还是独立的 AI 搜索引擎,RAG(检索增强生成)技术都是事实上的标配。通过 RAG,大模型能够利用强大的搜索算法查询网页等外部数据,同时通过整合数据增强了大模型的上下文,可以生成更精确、更翔实且更具吸引力的回答。
然而,RAG 能够让 AI 获取更多数据来提升回答质量,却不能解决数据获取数量和质量的问题。
而 Kimi 探索版最让人惊艳的一个升级,恰恰就是面对大规模数据的检索能力。按照官方提供的数据,在标准版的基础上,Kimi 探索版的「大脑容量」剧增,支持 10 倍的搜索量,「一次搜索即可精读超过 500 个页面。」
小雷体验过程中也看到了这项升级带来的巨大潜力。
在提出问题后,Kimi 探索版会把问题拆解为不同的子任务后,每执行一个子任务,都会单独搜索和阅读相关资料。比如「专硕申请」拆解成 11 个任务单独搜索,同时阅读了 48 个网页。
但当我请 Kimi 探索版「总结全球主要科研机构对量子计算的最新进展,包括英文、中文、法语和德语的权威论文和研究,并分析其中的趋势」,Kimi 探索版最终拆分成了 25 个任务进行执行,并阅读了 310 个网页。
相比之下,其他 AI 智能助手或者 AI 搜索,往往依赖单一关键字的简单查询,一次搜索仅处理几个页面的信息,给出的结果不够全面,很多时候需要用户自己再去做筛选和判断,更不用说要面对巨大工作量的任务。
又比如官方测试过的实例,让 Kimi 探索版在 2024 年《财富》中国科技 50 强公司找出总部位于北京的公司,也遍览了 276 个网页。
这些问题的解答,都需要建立在庞大数据检索量的前提上。不同的是,过去我们依赖已有答案或者手动一个个搜索,但现在 Kimi 探索版就可以实现自主地海量搜索。
至于 Kimi 探索版的自我反思,可能是更多面向开放式的问题,实际有限的测试中很少出现,还没有太深的体会。不过也看出,Kimi 探索版可能会在回答问题,重新阅读回答进行补充。
Kimi 探索版只是探索,但方向是真对了
小到查找优质高校专业的申请信息,大到了解全球量子计算的科研前沿,当小雷从 Kimi 探索版得到回答的那一刻,多少还是有些难以置信。并不是这些问题因为对人类来说太难,而是在可靠回答之上,超越想象的速度,或者说效率。
很多人都知道,作为全球最大的搜索引擎公司,谷歌的使命是「整合全球信息,供大众使用,让人人受益」。但传统搜索引擎可以整合,却无法化繁为简,让我在海量的信息快速、便捷地找到想要的信息。
与此同时,Kimi 探索版通过理解问题、分拆任务执行,大幅提高检索能力以及自我反思,在一定程度上解决了生成式 AI 的部分难题。具体到回答结果上,Kimi 探索版也确实带来了不小的惊喜。
当然也存在一些问题,比如大模型的「幻觉」,回答中字节跳动的研发支出实际是引用 2022 年的数据。
又比如在理解用户意图上,AI 还是很长的路要走。当我询问 Kimi 探索版 2024 年 QS 排名前 100 中国高校计算机专业的专硕申请情况,但实际却给出了 QS 排名 100 开外甚至不在排名内的高校情况。
此外,目前内测的 Kimi 探索版,在推理能力可能还是要弱于 o1-preview,至少面对一个模糊提问的时候,Kimi 探索版并没有给出有用的信息,o1-preview 却能根据信息推理出是 Ben Thompson 提出的「聚合理论」(Aggregation Theory)。
当然,我们可能还是需要更长时间、更多提问才能发现 Kimi 探索版的真正能力。但不论如何,我都相信 OpenAI o1 和 Kimi 探索版找到了一条通往 AGI(通用人工智能)的正确方向。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有