松鼠Ai创始人栗浩洋在GET2024分享
11月11日至12日,芥末堆在北京举办以“新质学习力,通向更美好的教育未来”为主题的GET2024教育科技大会。在12日的领袖论坛上,松鼠Ai创始人栗浩洋就《AI自习室没有大模型能走下去吗?》进行了主题分享。
以下为演讲实录,经编辑:
栗浩洋:大家好,能出现在最后一天这个时候都是教育科技行业的铁粉,非常感谢大家的守候,希望能够给大家带来一些干货。AI自习室很火,大模型也很火,我和大家分享这两者结合在一起能够有什么价值。
大语言模型是用大模型做了汉字或者英文单词的排序。而我们知道SORA,生成视频跟大语言模型没有任何关系,它是用大模型做了一个像素的排序。如果一款产品只是跟学生说几句话,那只是用了大语言模型API,并不是自己做出了大模型。
松鼠Ai的大模型也不是大语言模型,而是学生的学习顺序排序——这个学生应该学什么、不应该学什么、先学什么、后学什么,这看起来很简单,但等一下大家会知道玄妙在哪里。
过去十年我们一直都在做这个事情,而且是在松鼠Ai的统一系统里面,我们有了2400万学生100亿学习行为数据,才可以训练这样大模型,这是我们不同的Agent。
大模型是什么?就是参数量大,大家听说过1000亿参数、100亿参数,参数是什么呢?我举个例子,大家吃过鱼香肉丝,但你每次吃味道都不一样,原因是什么呢?就是参数在变化。有时候你吃的鱼香肉丝几乎没有肉,说明肉的数量就是一个参数,蔬菜数量也是一个参数,炒的火候又是一个参数,当所有参数都对的时候,你就吃到了你一生中最爱的鱼香肉丝。
对于大模型来说,我们简单的讲,大参数就是给了你无限的可能性,来找到最优解、最好的方案。
我们可以回忆一下Alpha Go的表现,当年还是深度学习、强化学习的时代。而我们现在已经进入到大模型时代,AI可以思考100亿步、1000亿步,它一定能找到最好最优解。AI在设计层面的像素也可以找的比人类准,尽管会出错,但AI能把1000亿种可能性画出来,最后再用概率排序找出最优解,一定比你画得好。未来任何一个画家也赶不上AI,就是因为参数量可能还会更大,这就是参数量大的意义。
参数量变大之后能解决什么问题呢?解决暗逻辑,人类不理解的逻辑。
回到自习室,这些大模型的大参数,暗逻辑,对人工智能自习室有什么关系呢?自习室最难的是什么?不像一对一辅导,现在成绩不好的学生来了自习室是厌学的,他90%的时间是走神的,他不能控制自己的思维。
我们看一个松鼠Ai的案例,一个被认为厌学、精神专注力有问题,每周要看医生的孩子。他学了100分钟,我们就得出了一个诊断报告,18个知识点测出来12个漏洞,成绩方面这个孩子是极差生。
这个孩子精神有没有问题?我们看进步幅度的标签,学习报告里有大量的知识点进步幅度在40%、60%,说明这个孩子在100分钟里非常认真用心专注学习,在大量知识点上有了成长和进步,而我们最怕的是进步只有10-20%孩子,等于什么都没有学会。
但是通过另外一个数据报告可以发现,他可能存在一些问题。每一道题的做题时间,我们用蓝色曲线标注出来,再和橘色的全国平均时间曲线比较,我们可以看到这个孩子大概率是有容易走神的问题,也可能是个不算聪明的孩子,但是他至少是用心的。
比如,平均用时47秒的题他用了五分钟,但是他做对了,而且这是一道系统标注为难度系数76级的题,已经超过了这个同学当时的能力范围,但他花了五倍时间用心做出来了。
如果你习惯去分析大数据,你会发现这个图里还有一些问题。我们可以看到,这个孩子19题做错了之后放弃了,没有作答,连续20到23题全部放弃了,说明做错题之后心态崩了。而且从题目难度系数的角度来说,这道26级难度的题完全可以做出来。那么,刚才他只差一步,所以系统又把难度降到17级,按道理这时候应该百分之百可以做对,但他又没有做,我们系统最后降到1级难度,他才慢慢从20多级难度升到70多级水平。
这里的关键在于这个孩子心态崩溃连续放弃答题之后为什么又接上了,为什么不再厌学,不放弃了。因为系统一直给他1级难度的题目,几乎是类似1+1=2的题,让他又找回自信了,然后系统再不断给他难题,再重新慢慢拉高难度,所以在这100分钟时间里大部分知识点都有了提升。
所以我想表达的是,学习路径是多么重要,在大模型的帮助下,每一道题的难度系数变化都可以看出对孩子的心情、心态产生什么影响。像这样一个基础较差的孩子,他平时在学校里面大部分80多级难度题,偶尔能做对几个,但根本没多少20多级难度的题来持续给他信心,他为什么厌学的原因就在于此。
如果你的AI自习室给学苗、学霸都上一样的课,这样自习室不崩才怪,你没有AI,没有算法,没有一个能理解孩子、给他安慰的方法,这中间家长根本不知道怎么回事。而这就是AI的价值,这不是任何人类老师可以做到的,这样AI自习室不再仅仅是自习室,而是在让学生跟着AI超级智能老师学习,没有一个特级老师能够与之相比。
再来聊聊AI自习室怎么征服学霸。学霸他在家也可以自习,为什么要来你的自习室?
我们有一个名校北师大附中的孩子,七年级平时最多扣三四分,但从来没有得过满分。他刚用我们系统,上来就把他降到四年级水平去学习了,四年级学了一个月又降到三年级学习了。他父母是双博士,母亲更是一个家庭教育集团四千家连锁店的老板。他母亲当时在群里面就跳出来说,你们松鼠Ai什么人工智能?人工智障吧,我家孩子不是哪里不会学哪里,97分只学3分不会就行了,你为什么让他学四年级、三年级的呢?
很简单,我们看数据。你在三年级几百个知识点里有12个漏洞,你在四年级知识点有19个漏洞,虽然你的漏洞只有10%、5%,但这些漏洞到了高年级的时候遇到混合出题,五个知识点、八个知识点混合出题,有的时候你没有卡在同步知识点,卡在前置知识点里面。
我说你们家孩子考试之后是不是经常一拍大腿说这题怎么能错呢,他说你怎么知道,我说很简单,我们算法找到了问题。你不需要通过七年时间学过去七年的内容,这个孩子在松鼠Ai只用了56个小时,就把过去的知识漏洞补完了,然后就考了五年没有考过的100分,很开心。
但是有一天,他的同步课突然只有75%正确率,他说太痛苦了,今天怎么只有75分,而我看了数据以后,我说你不是75分,你是99.5分。因为系统给他推的题是多少级别,99级,这是什么意思呢?中考的最后一道题才是99级难度,我们把全中国所有中考的最后一题都汇集过来,才能够在几百个知识点找到这么多的99级题目,给到这个学霸来训练。这孩子说AI太智能了。
所以,有了大模型的加持,AI自习室不会浪费学霸一分钟时间,因人而异给到不同的人完全不同的学习路径。
那么AI自习室和名师相比,又是什么水平?
一个AI教育公司没有做过人机大战,基本上说明你技术完全不成熟,我们2017年在亚太地区第一个做人机大战,至今已经做了七次,全部获得成功。帮一些个别孩子提升分数非常简单,但你能不能让整个班,甚至百人、万人超过同时提升?
在国家教育部期刊上面的论文,有我们松鼠Ai人机大战的数据,结果是比实验班的教师高出31.2分。我们是第一个有智慧的大模型,我们的大模型不是跟孩子对话,我们最核心的应用,在于能够识别孩子的错因。这道题孩子有草稿纸,我们看出来以为时钟敲11下是11个间隔,实际上是10个间隔,他可以深度理解这个孩子错因,然后给对症下药。
一道题目,全国的孩子最多能有977种错法。这997种错因,你能一样对待吗,不能。人类老师很难一一应对,只能是AI,只有大模型可以。大模型已经可以理解孩子是自律有耐心的还是草率的,是喜欢挑战的还是畏难的,是有小聪明还是坚韧不拔的,我们整个模型对于孩子性格描述可以通过两个小时就非常精准地给出画像,然后我们再对他进行对症下药,千姿百态的大模型算法对应的是千姿百态的学生,即“千人千面”。
我父亲是一名特级教师,市教研室主任,他帮助了无数学生提升。但他能够帮助七、八十分孩子提升,不可能帮助不及格学生提高上来。而我们已经可以帮助30分水平的孩子考到130分,七年级需要一年半的时间,八年级需要两年的时间,大概需要600-700小时。
你想要的分数,在大模型眼里就是你的学习速度和你的学习时间。一般来说,开头差生会非常慢,一二三年级要求反复学习好几次,但之后被我们的算法推起来后,这些孩子的学习速度会越来越快。大家常说的笨孩子、差生并不是如你想象的那样,人的大脑智能几乎是相当的,只不过有的孩子就是慢一点,只是他需要你两倍的时间,就可以解决。
我们的大模型能够解决这么多问题,背后就是我们强大的技术实力。松鼠Ai所获得的国家发明专利,并且拿到授权的有110多个发明专利。北交所专精特新需要2项发明专利,我们有112项。此前在为期五天的UNESCO人工智能全球大会的第一天最高级别的全球教育部长论坛,我是唯一一个非部长参与这个论坛讨论并演讲的嘉宾。
在43万科学家组成的IEEE协会,BAT有两个标准委员会委员,而华裔主席华为有一个,我是第二个。我是IEEE人工智能教育大模型标准组主席,也算是给中国教育科技争口气。全球40多个国家的83位科学家都在我做主席的标准委里面申请成为我的委员。
最后我想说,大部分人对新生事物往往会从“看不到”到“看不起”到“来不及”,我们无论对抖音还是拼多多等等都是,我相信很多人对人工智能也曾是这样的感觉。
十年前做人工智能更不用说了,那个时候共享经济非常火,我的下属都拿了两、三亿融资,我2000万都拿不到。我在2014年拿不到钱,因为大家不知道人工智能是什么。所以我们今天不是赶上风口,我们是蹲了十年,一直蹲到了这个风口。
我们也希望一些有识之士,愿意跟我们一起合作,把人工智能教育真正推广普及出来。我认为人工智能教育大模型是对整个行业的一场颠覆,而做AI自习室,你要想让孩子来自习,你就得拥有世界最强的大模型技术,谢谢大家。
4000520066 欢迎批评指正
All Rights Reserved 新浪公司 版权所有