投资人、创业者、学者、用户四方会谈:哪些应用场景最先被AI改变?

投资人、创业者、学者、用户四方会谈:哪些应用场景最先被AI改变?
2023年12月15日 19:45 略大文化

12月14日,以“智能涌现 数开万物”为主题的腾讯科技Hi Tech Day暨2023数字开物大会将在北京国家会议中心召开,共同探索前沿数字科技,探讨产业数字化生存法则,揭开生成式AI爆发下万物盛开的奥秘。

大会中,以“哪些应用场景最先被AI改变”为主题,昆仲资本投资副总裁陈希(投资者),清华大学交叉信息学院助理教授袁洋(学者),木牛机器人CEO郭林(创业者),腾讯科技创作者、互联网基金公司AI业务负责人张仁杰(用户),开始这场启发性的讨论。

以下为讨论内容:

陈希(投资者):人工智能是下一代产业赋能和革新的技术,所以从2016年上一波AI起来的时候就一直专注地围绕AI+各个重点领域去做投资布局。随着AI底层技术的不断发展,从深度学习向CNN、RNN到后来的Transformer,GPT为代表的大模型技术,我们也是在寻找大模型以及AIGC带来的新的创业机会。

袁洋(学者):我做的科研主要是大模型技术理论,跟着学院院长一起开展人工智能、大模型的常识推理和数学题的研究,我是做大模型的医疗,就是智慧中医,打算办一个智慧诊所。

郭林(创业者):我做的主要事情就是AI技术在工业方向和传统机器人的结合,创造一些创新性的产品。公司有两个主要的业务方向,机器人底层系统也是很强大的技术平台,通过这种平台赋能很多产业应用,主力在抓的就是智能物流和物流搬运,主要是在生产制造的重载搬运场景。

我的公司做了两年,目前第一代产品刚发布,大概就是这样一个阶段,也是因为有了新技术的突破,我们也有一些思想和技术的红利,才能实现以前行业同行基本不太能够做到的事情,大概就是代表以新技术和产业结合,发现一些新的产品机会的创业历程。

问:投资人现在怎么看待AI?你们要投资这些项目是怎样的思考决策逻辑?

陈希(投资者):AI大模型,上半年和下半年变化比较大。上半年特别热,曾经有一段时间大家都看到有大笔的融资,下半年相对来讲投资人会变得稍微冷静一些,很多行业偏谨慎一些。

这里有一个比较大的原因,Gartner最近发布了一个报告,就是每年都会做一个新技术曲线,会把新兴技术有高峰到低谷的曲线,现在是Generative AI放在期望过高的顶峰,每一波新技术都会面临这样一个阶段,就是大家期望很高的顶峰到商业化的速度,大家也在期待中有些更多的东西出来。现在很显而易见的就是,市面上很多项目估值存在比较高的溢价,所以是整体AI大的阶段。

要是从行业Mapping来讲,我们把AI看成三层:最底下是基础大模型层,中间层和应用层,基础大模型层是壁垒最高的,也是所有巨头今年最发力角逐的,所谓的百模大战、群雄争鹿,大家都在砸钱往大模型的方向去投,所以上半年绝大多数国内外的AIGC领域的投资都投在技术大模型。

中间层类似于云计算时代,就是PaaS或者在大模型的基础上做一个中间件,刚开始就是在行业的发展初期也是比较火的领域。现在大家发现一个趋势,原来做大模型的公司,现在大家的野心都很大,包括GPT4出来,大家就开玩笑说硅谷非常多的创业公司可能直接就被OpenAI降维打击,最大的区别就是比它差,中间层的公司也有很多投资人在看,但是也都比较观望,取决于市场竞争的发展速度。

最上面的应用层是最有发展机会的,就是大家结合自己的数据集以及对各个垂直行业的Knowhow,在大的模型基础上对模型去做Tune微调,能够让很多企业开箱即用,实实在在产生商业价值的应用,这些是最有机会的创业领域,我们相信也是未来三五年可能诞生很多牛逼的公司。可以说现在还在一个刚开始,百花齐放,大家也都在寻找这样的商业场景的阶段。

目前投资人还是期待很多新的商业机会和商业前景出现,但整体来讲,尤其是考虑估值都比较高,所以大家还是会守得比较紧。

袁洋(学者):学生看待AI的态度各有不同,有些想了解尝试一下大模型,有些觉得学术界没有那么多资源,我肯定做不过工业界,想做科研。我觉得各个方向其实都要拥抱大模型。

最近我们在做推理,包括做数学方面的算法。我们更强烈地意识到大模型分为算法和普通的给出答案之分,AI要分为System1和System2。

人的思考有System1直觉思考和System2深思熟虑、反复琢磨,最后给出的答案。现在大模型很多都是前者状态,写文章就是一下子生成一篇文章,都不用改,其实都是不思考、不修改,凭直觉直接产生。如果允许能够来回迭代、修改,那么能力一定比现在强很多,这是一块没有精雕细琢的方向。

去年我们自己还提了Communicative Reasoning,可能一看就知道有一个瑕疵。但更复杂的问题,比如医疗、教育和法律,其实价值是很高的,可以让AI通过深思熟虑产生更大的作用。

我们不光是针对很多数据训练模型,训练的模型可能只是瞬间凭直觉给出的答案。在我看来,需要把思维的流程像工业流水线一样变成一个一个小的步骤,然后把这些步骤有机地结合起来,在此过程中可以调整,可以选择不同的岔路,找到一个最好的方案。再过一两年,我们能够看到大模型有一个更大的能力上的飞跃,所以我比较看好这个方向。

问:这次AI变革整体的发展会有什么不一样的变化?

郭林(创业者):机器人落地应用的领域,AI给大家带来的更多的是方向和信心,AI和机器人应用的结合能够带来颠覆式的机会,也是真正做业务的过程中,所有的创业企业包括我们在内,最讨厌的就是实际应用场景中无穷无尽的Corner Case。

我们从财务报表回报的层面来看,这是所有创业公司面对的最大最头疼的问题。行业里有一个笑话,叫做买机器人送工程师,基本上就是这样一个状态。原来某些具体的,不是大模型,而是行业垂直应用很干净、很多的数据结合,会有机会解决各种各样的Corner Case的成本结构。

我觉得教授水平特别高,真正走到场景落地的时候,不寄希望AI解决所有问题,而是解决关键节点的一些问题。我们承担得起这样的成本提升,因为用AI解决问题显然是有一定的成本。但是在这些关键节点的特殊问题之外,存在大量可被工程化解决,可被数学解决的实际能够落地的应用,所以以AI能力解决那些最复杂、最知名,通过传统的工程化思维解决落地的应用问题,会给这些企业带来一个新的思路,非常好地快速实现落地。

张仁杰(用户):去年10月到现在,我的阈值可能会变得越来越高,所以可以以时间流程作为单位去聊这个东西。

自从ChatGPT出来以后,国内国外的克罗德我也用过,包括国内的通义千问,后面已经很难给我初建ChatGPT的那种惊艳。最近10月有一个公司的大模型会让我重新惊艳,就是Kimi Chat,那个大模型有一个非常牛逼的特点,20万字的文档进去以后无衰减。

我们知道GPT4或者克劳德,虽然支持几十万的Token,但扔进去以后在文档后半部分大海捞针提一个问题,它是抓不到的。Kimi Chat的成功率是100%,所以让我比较惊艳。

ChatGPT以后就是AI绘图,今年2-3月还是很火的,最开始就是Stable Diffusion,然后MidJourney的审美会非常高,这是两款让我比较惊艳的AI绘图应用,后面就是偏功能性的,包括AI扩图或者实时绘画,这些给我的冲击最大。

我在5月还有在玩一个AI声音,现在的技术包括文本生成音频和音频转音频。11Labs是做TPS,只要给5分钟不到的语言音频就可以扩展到29国语言。之前有一个应用非常火,会让赵本山翻译各种各样的英文或者说中文,其实那个就是11Labs提供的技术,会让我非常惊艳。

最后就是AI视频,最开始的Runway,刚开始出来的时候《流浪地球III》的预告片让我觉得终于有了这样一个东西,这些是最开始玩到现在比较让我惊艳的。

AI的各种应用已经不是提高效率了,而是颠覆式的。以前很多都是做不了的事情,但是现在能做了,以前能做的,现在可以以10倍的效率去做。

最近我做了一个《三体》的AI预告片,里面就是各种AI生成的视频,包括李雪健老师的声音训练的模型和台词,其实一分钟的时长,以前要是用玛雅去做的话,光是建模一个镜头就要做一个礼拜,里面有将近四五十个镜头,可想而知得做半年以上,但是这次我只花了五个晚上不到的时间就做完了。

问:目前从投资的角度,你们觉得杀手级的应用会出现在To B还是To C?

陈希(投资者):有关To B和To C,针对AIGC时代的产品,分界线并不是特别清晰,既能让C端用户玩起来,也能够在B端产生价值,所以其实是大模型时代产品的一个特点,从产品的角度来看没有办法特别明确地说To C还是To B,而且从爆发式的增长点来看往往是C端比较大。

最近一段时间以来,今年一波一波被很多AI生成的东西刷屏,ChatGPT开始到有一段时间大家都在刷AI的孙燕姿,郭德纲说英文、特朗普说中文,C端能够提供爆发式的增长点。

但是从投资人的角度来讲,Killer APP肯定还是要有一些定义,不是说量突然爆发、突然增长就是Killer APP。需要解决真实存在,而且非常重要的需求。要有一些可拓展性,不光是局限于某个特定的场景,而是能够有些随着用户需求的增长不断扩展,还要产生足够大的商业价值,才能为投资人产生回报。

从这个逻辑上来讲,某种程度上这些To C的产品最后还是要找到To B的应用点,然后才能让垂直行业的企业,包括各种企业、各种B端的用户付费。

在国内,大家知道C端用户的免费习惯是已经被无数次证明。我们很难主动付费,要是做出一款AI产品,C端付费的难度也是很大的。未来AIGC时代的Killer APP应该是从产品层面能够让C端玩起来产生价值,这样才能有爆发性的增长,但对开发者来讲可能更大的目的还是要在B端场景商业化,那么要做的就是所谓的微调Tune也是针对某个垂直行业的Knowhow去做训练,产生的价值能够让B端付费。

大家知道大模型也是消耗算力的,尤其在国内还是有些算力瓶颈的,所以对开发者来讲也是更应该专注于B端的这些场景。

问:从基础科研的角度觉得解决什么样的问题才有可能出现杀手级的应用?

袁洋(学者):我觉得是System2,不要只是凭直觉,而是能够交互的,多次反馈的,调整到我们用户能够用的应用。个人在用大模型的过程中经常还是会犯错,画画确实画得挺好,但可能是很专业的用户做得更好,但相对我这种比较一般的,可能画一个兔子,我想把尾巴改一改,没有那么容易,包括写代码,有些地方理解得不对。背后的原因还是因为模型是凭直觉,给了一个指令马上就做一个大差不差的,要是这个模型是真的人的话,往往交互一下就能够帮你调得很好。

怎么才能把用户真正想要的东西分步,通过某种方式能够让模型理解,然后去调整?如果能够把这个做好的话,用户就会很满意。

要是能够做好的话,其实可以应用于教育行业,一个学生这一步做错了,跟模型交互一下,我们告诉你应该怎么做怎么想,可以分成很多步骤,所以会有很多妈妈会买。

医疗当然也是这样,看病的话不能只开一个方子,要看中间有什么原因,患者有没有额外的病要在调整一下,因为有了System2这样的架构。怎么充分调动模型能力,反复思考,未来还是需要研究的。

问:AI有没有能力解决人类解决不了的数学问题?有没有可能未来大奖让AI获得?

袁洋(学者):2022年初,如果我没有记错的话,GPT3的MASS只能打5分,过了两年,现在最高可以打70-80分,明年可能就是90-100分,也就是国际金牌的水平。我觉得可以展望未来数学家至少要和AI合作,未来AI的知识非常广博。

要是用到教育领域可能价值更高,相当于一个私人的教师从小学就开始教你,循序渐进,不仅告诉你答案,而且可以知道哪里错了,现在我学习一个新的领域,我都是先让GPT跟我说这里有哪些核心的概念,关系是什么,所以我学的就特别快,比我自己读书快很多倍。

郭林(创业者):我们所处的是行业与硬件挂钩极强,非常难在短期产生什么实际的颠覆性应用。我是有一个自己的模型或者自己的逻辑,现在看AI这个事情,大概是叫做你的数据质量和数据量高的领域划分为一个维度,到底有多少数据集。

很多人很关注模型本身,但模型本身的资源对绝大多数人来讲其实是在同一水平线,相当于一个公共资源。很重要的就是给模型什么样的输入,可以拿数据质量画一条线。

另一条线只是在于越软的层面,还是要软硬结合,越软的层面越容易涌现,越硬的层面其实距离非常遥远,其实还是要有真实物理的交互和反馈。这里的逻辑差异非常大,哪怕涉及一点点的真实物理交互反馈就非常麻烦,基本上现在技术发展没有到这个程度。要是从应用里面选出一个范围再去看,想要AI帮你实现的结果是相对确定性的结果,还是相对开放的结果,越开放的结果越容易产生一个产品,越确定的就越麻烦,对数据的质量就会极速上升,哪些领域能够预先爆起来?显然不是跟硬件息息相关的,跟真实物理世界息息相关的产业和领域,所以这是一个技术视角。

但是要看这个问题的话,更重要的是产品视角,我们知道技术的发展会带来很多东西,但往往并不是由于技术的发展带来爆发式的增长或者新的应用和产品的涌现,而是用新的供给方式去解决一些麻烦的问题。

举个例子,作为一个创业者,每天真的是事情多的要命,但真实的情况是我大量的时间要用来写PPT、看PPT、看文件。PPT这个东西和业务相关,可能还有仔细思考的价值,但是要有大量的时间来审合同,所以从另外一个角度来看,哪些真正具体的场景,都有哪些用户群体真正面对以前的技术手段不能解决,但如果换了一个新的思路,就是一个颠覆式的应用,也是非常容易发生好的产品的,就是从用户需求的角度去看。刚才举了一些我的人群的需求,说实话,如果有一个模型,把一个问题解决好就是爆款应用。

最近我最大的焦虑就是整个人类成长的、学习的关键要素有什么变化,这是让人巨大的焦虑的问题。我经常会想,现在的“海淀妈妈“、“海淀爸爸”到底有没有价值?你的孩子到底在学什么?孩子在成长的过程中怎么利用AI完善人生,家长应该怎样改变思维模式、习惯和结构,把这些新的时代的变化趋势跟孩子的教育结合,那就是爆款产品。现在一方面是需求侧,另一方面是供给侧,怎样产生好的、新的供给的形态组合,就是从这个视角来看一些问题。

问:有没有发现一个杀手级的应用?什么领域能够出现杀手级的应用?

张仁杰(用户):杀手级应用至少不是昙花一现的,可能是用户用完,要有一个非常高粘度的留存。

因为AI这个东西,我们本身的定义到现在都是提高效率、降本增效的工具,就是底层的类似计算机的基石,上面会涌现出无数的应用,但目前还是To B的提效。C端需要的是什么?更多需要的是生活或者娱乐,普通用户的使用场景其实是很难跟AI这个东西结合起来,很难出现能够解决他们需求的一些杀手级应用。现在是有一些苗头,解决普通用户需求这一块,可以看到很多图片类、处理类,开始流量暴增不断涌现,并且8月到现在,每个月流量都在增长,包括国内的Must Goo或者及时设计,美图秀秀也开始有一定的增长。图像处理类可能是普通C端用户更强的需求,并且能够打动他们,而且能够和AI结合,未来这个领域可能会出现第一个爆款,而且让用户留存下来的杀手级应用。

问:有没有可能AI的发展会使得产品、行业甚至您所在的行业,一个小进步可能让这个行业被覆灭?

郭林(创业者):非常有可能让很多传统模式覆灭,关键是我们有一个黑话,就是要越过“恐怖谷”,其实还比较遥远,但是在具备基础条件的产业,应该是这样的。卡斯特讲他做一个食品,建模需要非常久的时间。前两天火了一段时间的新的视频制作的AI生成,可能会大幅度颠覆一些影视。随着质量的提升,影视从业者的效率毫无办法比较。可能跟普通人息息相关,每个人都能够看到不是一个概念的应用。大家最熟悉的就是自动驾驶,虽然国内可能还离真正全面的自动驾驶落地相对遥远,但特斯拉已经证明这件事情是可行的,而且没有那么遥远。如果说干线物流或者干线自动驾驶一旦发生,所有的货车司机都是相当庞大的群体,被替代的也有很多。

要是说有什么被替代的可能性,这些都是非常有可能发生的,所以这些是确定的,也是必然的。我们以为是越重复的,越没有思考属性的,越没有异常处理逻辑属性的,就是没有更多的分支偏差要判断的越是会快速被替代,按照我们自己的话语就是没有任何属性的事情都会被大家替代,越是有创造性、有思考、有认知层面的、独立见解的非常难被AI替代。

问:中国如何用大模型撬动更大的商业价值?

陈希(投资者):AI行业一直在说拿着锤子找钉子,大家现在也在找锤子,得先把锤子造好,我们再满世界找到可以钉的地方,也会有带来商业价值的东西。刚才大家都有列举可能出现的产品应用,但现在还是需要有一个过程,这个距离不光是技术上的,还是有大家对新技术的认可,包括对信任度的方面需要酝酿,长期来看肯定会是不断涌现的,明年应该会是一个元年。

袁洋(学者):大家可能看大模型只是看AI的那一面,但商业不能光看技术,还要看外面的包装。发动机在外面加上品牌、加上装饰,最后不只是卖发动机的零件,而是整个车卖很多钱。

要是只是当作大模型本身,当作API,OpenAI的模型很聪明,但是卖不了什么价。要是某个场合包装起来,包装成医疗服务,患者愿意付几百块钱甚至上千块钱,所以是很重要的一个点。

郭林(创业者):要是从创业的角度和企业的角度,我们要的更多的是确定性,因为没有更多的试错成本,确定性的角度,我们不太愿意拼概率,所以要看事情的本质。

大模型的本质是通过很多人才能集合起来,需要很长时间的能力解决的问题,通过新的方法快速答案,本质需要解决的是这个问题。可能这些对所有企业是效率大幅度提升的办法,但是技术不成熟,算力的要求、成本的要求很高。

在我们看来主要有三个关键的原始要素,其实就是算力、算法和数据。算力这件事情成本一定大幅度下探,算法的资源对所有人都是平等的,除非是极其特殊的专业领域。可能对企业而言也是我们自己着重抓的,就是在我们看来,能够产生壁垒,迎合时代,等到真正爆发最重要的核心壁垒建立在数据上,到底有多少数据,拿到的数据可不可以训练,有没有可持续增长的范式。

我们尽可能要让自己保持冷静,忽略现在算法和算力的热潮,尤其是我们这个与硬件相关的行业,就是踏踏实实、老老实实进入产业拿到这些数据,然后让自己产品的量起来。等到整个技术和一系列配套设施成熟的那一天,基本上就是应用壁垒非常强大,并不是一定要现在很热闹。

张仁杰(用户):我觉得就是资源和需求两个方面:不管是国外的巨头META、微软还是国内,其实在算力和资源一直都有非常大的瓶颈,导致对C端消费者,一个是价格非常高,另一个是体验也非常差,所以就是想要未来大面积商业化或者出现爆款应用的基石,至少要把资源打下来。

我非常看好边缘计算,用户所有手机电脑算力都是空转的,没有任何用处,所以我相信后面的AI手机,包括Google和小米所做的东西会让未来基于算力的需求大幅度下降,让这些东西触达更多的用户。

资源端的话,人们根本不需要一个大模型,这种东西根本用不到,需要的是基于大模型的应用,真正能够用上的,能够让我这个用户傻瓜式地用上的应用,才能真正走进所有百姓消费者的家里,光拿一个大模型放在那里百模大战,大家天天问你好吗、你在吗、你是谁,不能解决什么东西。可能更加需要PIKA把底层视频大模型包装成很强的应用,或者是文本大模型、声音大模型都可以,只要能够包装出来变成大家能够用上的,加上对算力需求的降低或者价格的降低,能够真正开始走向下一个时代。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部