朱宇投身信奥编程:我为什么要做信奥领域垂直大模型?

朱宇投身信奥编程:我为什么要做信奥领域垂直大模型?
2024年08月09日 01:14 多知网

来源|多知

作者|徐晶晶

  2021年底,告别东方优播后,朱宇便在新东方的支持下,启动再次创业,创办优编程。在大凉山支教完回京后,他带着优编程步入正轨。

  此前,朱宇曾历任新东方北京学校校长助理、东方优播CEO。东方优播曾在五年内实现营收从零到8亿元的跨越。

  当下,优编程已实现盈利,2023年营收超过2000万元。

  从线上拓展到了线下,是优编程过去一年来的显著变化之一。再过一个月,优编程的旗舰店——公主坟校区将正式开业,这也是优编程在理想大厦校区外的第二所线下校区。

  优编程聚焦的是信奥领域(全称“全国青少年信息学奥林匹克竞赛”,National Olympiad in Informatics,简称NOI)),并与悉之智能合作研发了“优香农大模型”,采用AI老师讲题模式。作为立足于信息学编程领域的垂直大模型,优香农大模型当前处于开放内测阶段。

  为什么这一次创业选择信奥领域?为什么选择用AI老师解决信奥答疑问题?

  近日,朱宇向多知分享了他的思考。

01

  信奥领域为什么需要垂直大模型?

  当前,信奥领域市场蓬勃发展,但一个明显的制约因素是,信奥对师资的要求很高,因而师资供给匮乏。

据优编程内部测算,在供给端,全国的编程类老师和教练共有20万,其中真正理解算法的老师更少。而在需求端,国内有编程需求的学生接近2000万,按10%的渗透率估算,大概需要200万名教练。

  那么,大模型能否顶上呢?

  从技术方面来看,有一定的可行性。

尽管大模型存在幻觉问题,但用大模型解决信息学问题的精准度要高于其他学科。这是因为,互联网上的开源信奥题有很多,信奥题的答题过程是线上化的(写完代码需要测试运行,必须在线上进行),这意味着,信奥领域能用于训练大模型的数据多,大模型给信奥带来实际价值的可能性也更大。

“技术处于发展期时,所有构想的实现其实都取决于成本和代价。当下,受限于算力、算法、数据、场景,大模型的成本还很高。当算力、算法、数据还并不给力时,选择一个合适的商业场景就很重要了。”朱宇说道。

朱宇找到的信奥学习关键性场景、大模型的切入口是帮学生答疑/debug。“很多学生信奥学不下去是因为,课后在自己编写代码时,碰到问题,往往没有老师立刻指导。这时,如果能有一个AI老师出现解决痛点,这种方式也能更低成本、大规模地推广起来。”

  在信奥编程学习场景下,优香农大模型究竟能做什么?

  据介绍,优香农大模型具备给学生讲解信奥题、答疑的能力。

  当用户输入一道信奥题时,大模型会先生成题解(思路+Code)。当遇到不懂之处时,AI老师会进行多模态交互讲解。

  有了优香农的AI老师后,在没有老师指导的情况下,学生要想找出代码的bug,就可以先把信奥题目和代码粘贴进优香农,得到AI老师的讲解。

  对于老师来说,优香农也是一个趁手的提升效率的工具。对信奥老师而言,给学生讲题、看代码是一件耗时耗力的工作,有了AI老师,可以极大提升答疑效率。

朱宇透露,在AI老师出现前,老师一个晚上最多能够服务 10 个学生,而现在借助优香农,一个老师一晚上服务的学生数可能达到30个。

  另一个判断优香农大模型解题能力的数据是,在CSP-J/S题目上,其拥有近90%解题率(OJ通过率),远高于市面上的主流模型。且当前市面上主流模型的代码能力准确率并不高,更偏向于解决实际业务问题、面向专业程序员,回答风格倾向于使用专业名词解释代码,并不适配教学场景。

  关于优香农大模型底层的技术原理,优编程的合作方悉之智能创始人孙一乔回忆了双方两年来的合作历程:

  首先,双方构建了基于信奥编程教学的完整知识体系下的数千知识点,并将其开发为可以供模型调用的KAS节点,让其成为了模型最有力的解题支持和工具。

  其次,在教学过程中,双方一起开发信奥的学科体系。比如信奥里有一种“分治法”,要把它开发成大模型可以调用的方法。

  第三,引入优编程的优秀教练的教学方式,来训练模型,让AI能够真正像信奥编程教练一样讲题。通过在实际教学中积累的海量解题、讲解素材,对模型基座进行了进一步的SFT和强化学习,让其使用Muiti-Agent的思路进行推理,并学会真人名师教练的拆解题目、分析思路、讲解风格。并且针对信奥赛道进行大量的对齐和指令优化,让其输出更遵循信奥教学准则。

02

  开放优香农

  朱宇认为,优香农大模型达到了商业级应用的标准。

  孙一乔认为,优香农大模型让整个信息学编程行业出现供给端改革的可能。

  不过,朱宇坦陈,当前,优香农的AI老师可以做好每一道信奥题的答疑,可以解放老师的部分工作,但并不能完全代替主讲老师的工作。“让它单独的讲题是没有问题的,但真正的课堂不只是一道题,还涉及到学生的知识背景等,非常复杂。”

  据朱宇介绍,接下来,优香农大模型会进行两个方向的迭代:

其一,将推出更多简便易上手的功能。

  例如,当借助优香农给自己的代码debug时,学员目前的操作路径分为两步,先粘贴题目,再粘贴自己写的代码。对比真人老师帮找bug,这已经是一种很高效的debug方式了,不过,省去“粘贴题目”这一环,直接粘贴代码、一步到位得到指点,是优香农未来要努力实现的。这在用户体验上也得到了极大提升。

  再比如,优编程也在筹备出版信息学教辅。“未来的教辅就是AI教辅。”朱宇说道。从用户体验来看,用系统自动给书里的每道题配讲解视频后,学生扫码就能看到讲解,还可以继续提问。对企业来说,制作成本要比人工录制视频讲解题目低得多。

其二,将完善B端的系统功能。

  优香农的用户有三种:学员、家长及老师。当前,除了要考虑学生和家长端的需求外,优香农面向老师的功能也将不断完善。

  如果要让老师更好地利用优香农,则要符合老师的需求,和学情系统结合。比如不需要导入数据分析,系统就能自动分析学生学情。

  如前文所说,优香农大模型带来信奥领域的师资供给端改革。那么未来,优编程是否会开放给行业机构、学校等?

  朱宇表示,当前优香农还在测试阶段,未来也希望其能令全社会受益。“技术不断发展,在很多事情上无非就是时间早晚的问题。我们会存在一个领先期,但就发展规律上而言,只要有精力、有时间、有金钱投入,别人想做这件事,最终有一天也是有可能追得上来的。优香农如果能帮助国内编程领域、算法学习领域取得更好的发展,我们肯定是很乐意的,也欢迎大家一起探讨怎么使用它。”

03

  AI时代来临,“信奥代表未来”

  “做优编程并非是突发奇想,我已经思考了两年多,且有一套比较清晰的定位和清晰的策略推进这件事情。”朱宇说。

  为什么坚定选择信奥领域?

  朱宇分析了三方面因素:

其一,AI时代来临,学信奥,愈发重要。

  朱宇提到,工业革命对教育产生的最大影响就是把深层次的科学理论变成人人都要学的内容(不同于传统师徒制下传承的是各类具体的传统技术)。只有学习了这些理论之后,人才能够成为机器的主人。

  而人工智能革命对教育带来的影响是,基础性的编程在人工智能时代或将得到普及化。“基础编程可能本身不重要,但是编程背后的算法、数据结构、信息学原理变得更重要了。”时代的需求使得家长意识到孩子要学信奥,不仅是简单的学编程,更要学背后的算法原理。

其二,在全球竞争格局下,对高科技人才(含信奥领域人才)培养的需要。

其三,学编程可提升孩子的能力素养。

  朱宇分析:

  “各科目对孩子能力的考察可分为两类:第一类是结果性输出。第二类是过程性输出,比如语文和英语的作文侧重对感性能力的训练。物理和化学的实验虽然是培养理性能力的过程性输出考察,但限于场地、实验器具等。

  而编程是一个可以低成本进行逻辑思维能力的过程性考察的品类,它输出的程序是个过程,孩子们写的代码也有明确的迭代空间(迭代指标明确,代码量、行数、空间存储量、程序耗时等)。”

当前,信奥市场规模在急剧增长。

  朱宇粗略判断,兴趣类的编程(主要学图形化编程,不涉及有难度的算法内容)是 400 亿的市场规模,信奥的规模目前只有兴趣类规模的 1/ 10。但信奥市场每年以70%的增速增长,预计未来三到五年,信奥市场规模能够超过 100 亿。

就市场格局而言,多年来,信奥行业囿于小众垂直,业态格局高度分散,“学信奥的学生有八成是跟着个体老师或者学校的教练在学,类似于新东方创立之前的英语培训市场。”

  “现在各个选手都在起跑阶段。随着需求不断增加和有规模化运作经验的参与者不断入局,信奥领域会逐渐形成有如新东方成立后的英语培训市场格局,跑出龙头机构。”朱宇判断。

朱宇向多知透露,2023年优编程年营收超过2000万元。当下,优编程已实现盈利,单季度学员超过2000人次。

04

  “教育产品的四个组成部分,都有很强的个性化诉求”

“现在的AI,有可能实现过去3000年来技术革命都没有做到的事情——让教育实现个性化。”朱宇判断。

  双方合作之初,当孙一乔问朱宇心中理想状态下的个性化AI教育产品长什么样子时,朱宇洋洋洒洒,抛出了一个非常理想化的愿景:

  在大模型广泛使用之前,过往的技术无法批量化生产教育的个性化产品。

  在此之前,教育产品一直处于一个不可能三角:低成本、大规模和高质量,在教育上不可能同时达成。

  而现在的AI,有可能打破这个不可能三角,实现过去3000年技术革命都没有做到的事情——让教育实现个性化。

  细分来说,教育产品的四个组成部分,都有很强的个性化诉求。

  第一,课程知识。课程内容要做到个性化的,要满足学生水平、兴趣、背景。

  第二,课堂体验。不同的孩子对于课堂风格的要求也不一样,如果可以借用某个导师的形象生成虚拟教师,按照学生要求赋予他不同的风格,以不同的语言、语调、神态和授课方式给学生呈现,就能够发挥生成式AI的特性来让孩子调动他最大的积极性来去学习。

  第三,课后管理。包括个性化地推送作业。要达成高效的学习效果,盲目刷题不可取,而是让孩子做自己恰好不太懂的内容。大模型既可以学习广泛的经验,又可以了解这个孩子过往的学习经历,就可以推送更适合这个孩子的学习路径。

  第四,教育理念。AI不仅能在家长的价值观基础上生成三观一致的AI老师,还可以告诉家长现在先进的认知方向、教育理念以影响家长。

  技术派孙一乔听完表示,这样的构想太过遥远,当下难以落地。但他也愿意和朱宇一起探索。

  毕竟,谁又能拒绝走向这样的未来呢?

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部