方小雷对“AI+HR”模型的终极设计是,“面试之后,AI不仅要给出评分,还要给出评分依据,并且给下一轮面试官提供建议。”
文|钱丽娜
ID | BMR2004
2024年春天,金沙江创投创始人朱啸虎站出来讲了一个“中国现实主义的AIGC故事”。故事的主角之一就是从事AI招聘的上海近屿智能科技有限公司(以下简称“近屿智能”)。
01
AI视频面试
“一针捅破天”
“我信仰AGI(通用人工智能),但我更信仰应用,我信仰能马上商业化的应用。”朱啸虎在一次采访中提到,“有个做AI视频面试的企业,2023年时做得非常好。这让我很吃惊!2023年招聘市场很冷,但其AI视频面试比2022年翻了一倍以上。企业招多少人我不知道,但面试还是要面的。校招面试成本很高,现在用AI可以降低成本。”
朱啸虎所说的“有个做AI视频面试的企业”就是近屿智能。2018年,在OpenAI的GPT-1诞生前三个月,近屿智能创始人方小雷带着一款基于NLP(自然语言处理)技术的篇章级语义识别算法产品——“AI得贤招聘官”去融资,讲了一个“生成式AI招聘”赛道的故事。他一共被VC(风险投资)拒绝了69次,直到遇到朱啸虎,方小雷才有幸成为“中国现实主义AIGC故事”的主角之一。
约到方小雷并不容易,业务量的不断增长让他每天都沉浸在各类繁忙的事务中。2021年,金沙江创投投资近屿智能仅仅两年,近屿智能的业务量便爆增四倍,A轮融资就实现了盈利。2023年,公司业务量较2022年更是翻倍增长。2024年1月,金沙江创投追加第三轮投资。近屿智能以AI面试为核心的AI招聘平台,以非常快的速度跑出了SaaS企业的赢利模式。
02
碰了69次壁
方小雷是“非典型AI创业者”。HR出身,没有任何创业经历。为了培养方小雷,朱啸虎在决定投资他后,要求他每周六来家附近的酒店大堂开会,探讨商业问题。
2005年,方小雷从南京大学毕业,曾履职中兴通讯、德国瑞好、五星电器、万科集团等公司,在中国、德国、西班牙、英国和加拿大等地负责集团所在区域的人力资源相关工作,历经地产、零售、化学和通信等多个行业。方小雷得知“篇章级别的语义识别算法”是在一个极偶然的场合,他结识了这个算法的发明人陈清才。陈清才告诉他,所谓“篇章级别”,是计算机可以完整的理解一个人表达的意思,而不仅仅是理解其中的关键词。方小雷听了非常激动,这意味着AI能够理解人类的思维逻辑,甚至拥有人类的思维逻辑,而招聘面试这一场景恰好适用于这项技术,两人一拍即合。
站在2017年那个时点,方小雷并不十分清楚NLP技术有多强,但是在甲方人力资源工作了十多年的经验告诉他,用AI做招聘的逻辑是成立的。如果用AI机器人把所有候选人都面试一遍,为什么还要筛简历呢?
从2018年开始,方小雷频繁地拜访VC,向他们解释篇章级别语义理解的NLP技术的先进性。然而,在被VC拒绝了69次之后,他看到了很多奇怪的逻辑,比如明明是自然语言处理技术,那些VC却去请计算机视觉专业的人做评估。
2019年,方小雷参加苏州电视台《创赢未来》节目,本来他也没抱多大希望。现场一共有六位投资人,除了朱啸虎,其他人都认为这个产品不落地。
方小雷直白地告诉朱啸虎:“我这个技术可能大家都不理解。”朱啸虎反问道:“你说谁能懂吧?”方小雷说:“你至少得找个懂NLP的人。”朱啸虎认真了,他让同事找来卡内基梅隆大学NLP专业的博士做验证,确认算法是自研的且领先性很强。
但这项技术能立刻商业化吗?方小雷的业务逻辑成立吗?
朱啸虎曾经是一个SaaS创业者,也投资了很多SaaS企业,方小雷经历的事他都经历过。在每周六与朱啸虎的沟通中,方小雷都会认真准备两三个小时的问题,朱啸虎基本上二三十分钟就解答完了。方小雷说:“朱啸虎是个真正的创业者,他会告诉你怎么做判断。”
公司刚创立时,方小雷问朱啸虎:“要不要去谈生态合作?”朱啸虎说:“这事以后是水到渠成的,你做好了,别人都会找来合作的。要让客户主动安排合作伙伴和你对接,你现在这么做是白费力气!”
的确,商业逻辑很重要,但产品更重要。只有把产品做到“1”,之后才会有无数的可能性。
03
在应用和炫技之间,需要有一个平衡
2019年前后,人们对AI面试会提出质疑。“当别人说不行的时候,我无法反驳,因为我没有那么多案例,谁让我们是中国最早做AI面试的呢?”方小雷需要找到证明AI面试有效的办法。
第一阶段是双盲人机对比实验。比如客户先做100人的AI面试,机器评分打印出来密封好寄给客户,客户再安排人类面试官对同一人群进行面试,两相对比分值,看是否具有一致性。方小雷说:“这个方法很有用,很多客户看到一致性结果后就愿意使用了。”
第二个阶段被称为人才命中率。人员入职后还要看两个指标,一是绩效,二是“闪离”。如果员工入职不久就离职,代表招聘失败,需要对AI面试和离职原因建立相关性分析,考验的是AI建模能力。
AI面试蕴藏着一个巨大的数据金矿,“你问我答”的形式天然可转化成结构化数据。方小雷关注的是数据积累之后形成的飞轮效应,它将不断提升AI面试自动评分的精度,从而形成竞争壁垒。“这不就是一个优秀产品的形态吗!”
近屿智能对开源大模型基座进行增量预训练来构建自己的人力资源行业大模型,采用的底座目前已经升级至Llama3-70B。“我们对大模型的训练已经是非常奢侈了,因为做增量预训练,用了大几百张显卡。”虽然团队在前期训练的时候投入了几千万元的成本,但相比从零开发大模型底座,这是一条相对快捷的路径,也是绝大多数AI应用公司的共同选择。
04
AI面试的商业实践
近屿智能的第一家客户是美国科勒公司,其HR在招聘展会上对AI招聘颇有兴趣。每年公司校招、社招都会收到2000多份简历,其中一半候选人在海外。相对中意的海外候选人,公司会出机票让候选人飞来中国面试,招聘成本极高。双方在交流时,科勒HR的想法是,让AI招聘程序先把候选人筛选一遍,以此节约成本。AI的价值首先就体现在了解决人不想做、做不好或者来不及做的事。
2021年,一家银行在考虑采用AI面试前,要求近屿智能做双盲测试,验证AI面试的能力。银行挑出一千位候选人,由AI对胜任能力打分。拿到评分结果时,方小雷吃了一惊,怀疑算法出错,因为在五颗星的评价体系中,绝大多数候选人的能力评分都在三星以上。客户看到结果后反倒放心了,因为这些候选人已经通过了人类面试官的筛选,人工评分结果与AI面试评分基本吻合。
目前,AI得贤招聘官已经迭代到L5级别(此为近屿智能企业自定义级别,达到高度自动面试水平),实现了多轮对话、千人千问、深度追问、深度解析以及多语言能力。方小雷发现,面试者听到AI面试官不仅能总结回答,还能就他的回答提出更深刻、更精准的问题时,通常会打起精神,认真对待。追问的问题是AI根据候选人的回答自动生成的,不是题库现成的。如果候选人第一轮没有回答到点子上,系统追问时就会给他一个机会。“通常,追问是一个让候选人被公平对待的机会,有些人的反应会稍慢,但不代表他们没有思维深度。”方小雷说。
近屿智能核心团队集合了三大领域的资深人才:HR专业领域、大模型领域的优秀团队和国际知名的工业和应用心理学专家。只有这三大领域的深度碰撞,才能让一款领先的“AI+HR”产品的诞生和不断优化迭代成为可能。方小雷对L5模型的终极设计是,“面试之后,AI不仅要给出评分,还要给出评分依据,并且给下一轮面试官提供建议。”
自从2017年近屿智能闯入AI面试赛道,一时间市场上出现了20多家同类公司,但是绝大多数都没能活下来。一个重要原因是,这些公司无法用AI对候选人的面试结果自动打分,招聘量一大就无法交付。为此近屿智能将自己的核心技术申请了20多项发明专利,目前已经成功拿到3项发明专利。
面对行业竞争,近屿智能还面临着要不要降价参与竞争的抉择。在一家公司的竞标中,竞争者开出的条件是20万元包年不限次数使用。而近屿智能坚持按人单次收费。方小雷坚信,要达到与人工面试同等的质量,AI面试是有技术门槛的,在技术主导的AI应用面前,客户对质量的要求排在首位,价格反倒居其次。2024年,近屿智能连续第三次与客户续约签下了为期三年的订单。
如今,近屿智能已经积累了10个行业的案例,每家公司可覆盖到95%以上的面试量。AI招聘节省了66%的招聘时间成本,降低87%的人力成本,提高35%的面试命中率。方小雷说:“客户一旦验证成功,就不会再回到人工面试。这个工具比较适合校招或是销售招聘等大规模的社会招聘,但如果是高端岗位的招聘,我认为目前还不太适合。”
至于未来会不会出现一个突破性的技术,降低AI招聘的门槛,方小雷认为,有这种可能性,但当前暂时没有看到。目前AI招聘有几千万元的市场体量,“虽然市场总体招聘需求在下降,但近屿智能业务还能保持增长,说明市场对AI技术有着强烈的需求。”
来源 | 《商学院》杂志2024年12月刊
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有