3个月收入翻一倍,OpenAI多次下注!AI口语教练Speak,为什么爆了

3个月收入翻一倍,OpenAI多次下注!AI口语教练Speak,为什么爆了
2024年07月08日 11:55 乌鸦智能说

6月底,OpenAI投资的AI教育公司Speak,完成了一轮2000万美元融资,估值提升到5亿美元。这是Speak在一年半时间里完成的第三轮融资。三轮融资相加,总额已经到了6300万美元。

不仅拿钱多,Speak投资人的质量还很高。Speak投资人里不仅有OpenAI,还有大名鼎鼎的Khosla Ventures,它是OpenAI 最早的投资机构。此外,YC 创始人 Paul Graham 和 LinkedIn CEO Jeff Weiner也参与了投资。

这么多投资人愿意下注的原因是,Speak的收入出现了指数级增长。

根据点点数据,今年2月Speak在 App 端全球双端月流水已经增长到了143万美元,而去年11月这个数据还只有74万美元。也就是说,短短三个月时间,Speak的收入就增长了1倍。

如果算上网页端收入,Speak的收入已经能够排在同类产品的第三位,仅次于Duolingo、Babbel。

Speak爆发的背后,AI正在以超出想象的速度影响教育行业。根据data.ai在5月21日的发布数据,在美国App Store排名前20位的教育应用程序中,就有5款是帮助学生完成学校作业的AI 产品。

至少从目前看,AI很大有机会解决教育资源规模化优质供给的难题。这或许如此多大佬看好AI教育赛道的原因。

/ 01 / 3个月收入增长1倍,收入已到行业前三

自2023年以来,Speak的表现一直稳定在韩国苹果商店 “教育应用”的前10位。根据白鲸出海数据,2月Speak双端月平均 DAU已经达到10.7W(近 30 天平均 DAU),DAU较去年11月增长 42%。

相比流量数据,Speak在商业化上的表现更亮眼。今年2月,Speak在 App 端全球双端月流水已经增长到了143万美元,较去年11月增长了1倍。

根据Statista数据,如果算上网页端收入,Speak的收入已经能够排在同类产品的第三位,仅次于Duolingo,Babbel。甚至在Speak主攻的韩国市场,其收入已经超过Duolingo了。

从产品定位上看,Speak主打的是口语学习,用户可以通过一系列交互式口语体验练习英语会话。在AI Tutor的引导下,让用户像和真人教师对话那样一样不断进行口语练习,并对发音、语法和词汇等方面给予实时反馈。

在开始教学前,Speak会让用户做一些选择,包括学习英语的目的、希望提升的技能、现有的英语水平、感兴趣的主题、每天计划的学习时间等信息。然后,App会根据用户的选择,生成一套符合用户水平和兴趣点的课程。

Speak课程主要分为视频课程、口语练习、角色扮演。在视频课程里,它会播放一段录制好的的视频让用户观看,详细讲解一些基础的语法和用法。口语练习环节,用户需要做的就是朗读例句,然后AI会通过语音识别功能判断用户的朗读是否正确,并给用户实时反馈。

视频课和口语练习完成后,就到了角色扮演环节。角色扮演就是集成了 GPT-4能力的AI Tutor,也是Speak主打的点。

角色扮演其界面就像一个聊天室,它会让AI进行模拟情景对话,它会模仿一个真人与你交谈,在与AI对话过程中,如果你不知道如何聊天,它会给你一些建议和提示。在整个过程,用户可以与其就一系列固定主题进行开放式对话,同时接收有关其发音、语法和词汇的反馈。

Speak在官方博客里说,自2019年在韩国市场推出以来,现已在40多个国家拥有超过1000万名学习者,在过去五年中,学习人数每年都翻了不只一倍。在韩国,近6%的韩国人正在使用Speak学习英语。

/ 02 / Speak做对了两件事

自ChatGPT横空出世以来,发布的AI教育产品不在少数,为什么Speak最终能够脱颖而出?这得益于Speak做对了两个事情:更早地拥抱大模型,以及把更多资源投入到课程设计。

先说前者,Speak几乎是教育领域最早拥抱大模型企业之一。在2022年获得OpenAI Startup Fund投资后,Speak 在去年3月就接入了 OpenAI 全新自动语音识别模型 Whisper——它在英语语音识别方面已接近人类水平的鲁棒性和准确性,无论用户口音如何(比如韩国、日本用户),都能更准确的识别出来,提供更准确的反馈。

接着,他们又成为首批使用 GPT-4 的语言学习平台。与之前的模型相比,GPT-4出现了两个升级:

一是GPT-4可以理解更复杂的表达,生成更准确性也更连贯的文本。二是GPT-4记性更好,不会在几轮对话后忘记之前聊过内容,交互体验也更流畅,这也让人机对话变得高度个性化。

更早拥抱OpenAI,让Speak的人工智能技术优于多数竞对的技术。

在Speak CEO Zwick看来,高度个性化和语境反馈只能使用GPT-4开发。他表示:“在底层,我们将 OpenAI 的最新技术与内部模型相结合,在语音识别、语音生成和对话生成方面提供最佳性能,这反过来又提高了用户的参与度和学习效果。

除了AI技术上没有短板外,相比很多初创AI教育公司,Speak还在课程设计上投入了更多的资源。

2023年之前,Speak把业务重点放在课程研发,累计开设了近1500万节英语课程。在教研设计上,Speak会有自己统一的原则,比如让用户在最开始的 30 秒内就要开口说话,课程设计中也要考虑单词、语法和口语同步学习的效果。

在课程设计上,Speak强调本土化。Speak每个地区会有专门的教研负责人,早期内容以韩国教程版本为基础,之后的课程会同时考虑通用版和细化版,始终市场开拓与教学效果提升的平衡。在这个过程中,Speak会不断地进行A/B测试去迭代修正课程逻辑,而不像很多英语APP将绝大部分重点都放在营销上。

通过更有针对性的课程设计,使Speak与市面上免费的AI口语教练在体验和效果上,形成了明显的对比。

随着ChatGPT发布以来,AI 口语教练产品多如牛毛,比如C.ai上就有AI languauge teacher虚拟角色。但由于没有合理的prompt和专业训练数据,大部分AI口语教练在处理体验专业术语、方言和俚语时较差,提供错误信息几率较高,仅能满足初步需求。

总的来说,Speak的成功,是垂直场景积累与大模型技术结合的典型案例。而这背后,也揭示了AI教育的本质:通过AI技术,实现高质量教育资源的低成本规模供给。

/ 03 / 教育,正在被AI主导

过去一年,你能明显感受到,与其他产业相比,AI对教育领域的渗透更迅速。

根据data.ai在5月21日的发布数据,在美国App Store排名前20位的教育应用程序中,就有5款是帮助学生完成学校作业的AI 产品。

根据不完全统计,仅在 2023 年下半年,就有十多家在线语言学习创企完成融资,总融资额达 1.6 亿美金。而投资者名单中,不乏 OpenAI、Google旗下的风投Gradient Ventures等知名资本。

之所以AI在教育产业跑得这么顺利,原因是教育特征与AI现阶段能力高度匹配。

在很长时间里,教育产业都在解决一个问题——如何规模化优质供给?从网络录播课到教育工具类产品,再到Vipkid用“北美教师”供给和线上授课的模式,莫不是如此。

对学习者来说,最好教学的方式肯定是1对1服务,但成本也往往是最高的。随着大模型等AI技术的成熟,AI能够模拟过去只有真人教师才能提供的实时互动教学。也就是说,通过AI老师,教育行业用技术实现了规模化教师供给,让低成本真人授课成为可能。

除了路径清晰外,AI在教育场景的落地门槛也更低。首先,教学内容素材本身经历了反复打磨,已经相当成熟,有足够多可供AI学习的数据。其次,用户在教育场景需求也比较明确,更有利于AI产品的设计和落地。

必须要强调的是,当前AI在教育场景的能力尚未被完全开发。随着后续大模型的更迭,AI教育的体验和能力还有很大提升空间。比如,OpenAI最新推出的GPT-4o就已经证明,AI助手能够能带着情绪进行语音互动,实现更加个性化的教学。

或许,AI在教育中应该扮演什么角色仍然存在争论。但有一点可以确信,就像OpenAI创始人奥特曼说的那样,AI最终将会重塑教育行业。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部