大模型激战长文本

大模型激战长文本
2024年04月10日 17:37 ChinaByte比特网

多模态大佬角逐、文生视频Sora爆火、长文本Kimi脱颖而出,一个接一个热点事件,将大模型带向一个又一个小高潮。在此起彼伏的演变中,大模型不再是单纯追求“人无我有,人有我优”的“小学生”。在笔者看来,大模型发展至少要在“小学生”的角色上加上“寻求差异化竞争优势”的戏份。

然而,“寻求差异化”并不代表不需要“算力”“算法”“数据”支撑的硬核实力,相反,更像是在了解自身实力之后,主动选择避“竞品”锋芒的战略性选择。毕竟,与为人处世一样,大模型并不能做到面面俱到,既要长文本出众,又要文生视频出色,同时还要多模态能力强,并非易事。 

这是最近爆火的长文本给到笔者的启示,而引爆这场热潮的是一家由清华学霸牵头的本土AI初创企业——月之暗面(Moonshot AI),它于前不久宣布,旗下对话式AI助理产品Kimi应用现已支持200万字无损上下文输入。“Kimi的长文本处理能力着实让我眼前一亮,以前需要将文本拆分,现在直接长文本处理就可以,很方便。”贺某向笔者透露。

月之暗面跑马长文本

事实上,长文本一直是大模型所应强化的能力,同时也是AI大佬们厮杀的新赛道。这一“故事”的开始,还需从月之暗面发布Kimi Chat说起。在2023年10月,月之暗面发布首款大模型产品——Kimi Chat,将上下文窗口长度扩展至20万字。

在那时,由亚马逊投资的Anthropic公司发布的Claude 2也仅支持100K(约8万汉字),OpenAI的GPT4支持32K(约2.5万汉字)。换言之,Kimi的长文本能力分别是Claude 2、GPT4的2.5倍和8倍。 

强悍的长文本能力也让刚刚发布的Kimi Chat将越来越多的大模型厂商带进长文本的漩涡。彼时,百川智能的Baichuan2-192K(约35万汉字)、零一万物的Yi-34B(约40万汉字)等大模型先后打破Kimi的纪录。

“不服气”的Kimi在不久前又迎来新的进化,支持200万字无损上下文输入,相比前一代版本,Kimi直接提升了10倍的文本处理能力,同时也引起强烈的市场反应:

阿里强化长文本处理能力,向大众免费开放1000万字长文本处理能力;360智脑正式内测500万字的长文本功能;百度也将升级长文本能力,范围定在200万-500万字。 

相比跟进OpenAI的文生视频能力,国内大模型头部企业有能力,也有资金持续跟进长文本,这使得长文本赛道变得愈发热闹,可以说,头部企业的入局也为这场“长文本”大战增添了很多看头。

有必要的长文本之争

“之前使用大模型的时候,需要将长文本进行分拆,将多个短文本进行分别处理,这样大模型抓的文本主旨也不相同,而且使用起来也不太方便,操作复杂。”经常使用大模型的李某向笔者透露。

这里反映出之前长文本处理的弊端,诸如,多个短文本语义理解偏差,使用起来也很不方便,效率低下等。

这就需要长文本处理能力。同时,笔者也注意到,无论是百川智能,还是零一万物,抑或是月之暗面的Kimi,甚至持续跟进的阿里、百度、360,这些企业的参与,也让长文本之争持续火爆,而这种长文本之争是很有必要的。 

实际上,这种竞争促进了长文本技术的不断进步。以Kimi为例,它具备的无损长文本处理能力有效地解决了大模型在实际应用中因文本长度限制而引发的性能下滑问题。

同时,长文本技术还成功克服了因上下文信息丢失而导致的大模型理解偏差的难题。这使得模型能够全面捕捉长文本的上下文信息,从而更精准地解读文本含义和用户的真实意图。

笔者认为,这一进步不仅提高了模型的精确性和可靠性,还为用户提供了更加精确和个性化的服务体验。

月之暗面透露,Kimi提升AI处理复杂、长文本的能力,使AI更加深入理解和分析文本信息,能够支持小说创作、剧本编写,以及历史文献研究。

另外,长文本处理能力也使AI在办公、医疗、电商、教育领域有了更为广泛和深入地应用。

在盈利与烧钱之间寻找平衡

在大模型领域掀起的一次又一次热潮中,没有任何一家企业是不烧钱的,OpenAI、谷歌、亚马逊云科技、META都在疯狂烧钱。这是有相关数据支撑的:

中信证券测算显示,为满足现在ChatGPT日常访问使用场景的算力,基于1亿用户保守测算GPU需求量在23.3亿美元。

阿里通义千问现已向所有用户免费提供高达万页的文档处理能力。若我们按照当前市场上最低的收费标准0.1元/页来计算,那么处理10000页文档所需的解析费用将高达1000元。

再来看,目前,Kimi在投放广告方面的获客成本大约为每位用户10元。若进一步考虑拉新后用户进行问答互动所产生的算力成本,那么每个用户的总获客成本将上升至12至13元。

根据第三方平台的下载量预测数据,Kimi在最近一个月内,在苹果和安卓两大平台上的日均下载量达到了17805次。基于这一数据,我们可以推算出Kimi每天需要投入的获客成本至少为20万元。 

面对烧钱的长文本大模型领域,除了寻求资本的助力外,持续迭代长文本能力,寻找商业化的可能性已经成为月之暗面考虑的问题。分析师认为,由于Kimi的技术门槛不是很高,所以未来必将面临激烈竞争。

据了解,大模型的应用效果不仅取决于“计算”能力,还取决于“内存”能力,发展长文本不仅投入少,且更贴合于产业应用。或许正是这些可预见的商业落地前景,才让诸多人工智能企业都押注长文本。

商业可落地性是Kimi被看好的重要原因。长文本能大幅提高大模型问答、内容生成的个性化程度和准确率。相当于既能帮用户解决问题,也能帮AI企业解决大模型本身的一些问题。在科研、学习、创作、娱乐、服务等领域,将得到广泛应用。

在笔者看来,月之暗面不仅掀起了长文本之争,同时也开启了长文本的商业化落地实践,并在盈利与烧钱之间寻找平衡点。

写在最后

在笔者看来,月之暗面Kimi的爆火与其在长文本领域的坚持有巨大的关系,其切入的长文本赛道,主打了差异化优势,迅速占领市场。

虽然相比文生视频领域,国内大模型企业望尘莫及,长文本门槛较低。但也让国内企业看到,即便是成立时间较短的企业,在找到极具商业潜质的赛道之后,也会受到资本与市场的欢迎。 

月之暗面寻求商业化道路上仍旧存在烧钱与盈利平衡的难题,此时,针对市场的策略与打法变得尤为重要。最后,期待月之暗面的未来发展。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部