【深圳商报讯】(记者 陈姝)10月31日,百川智能创始人兼CEO王小川在“2023云栖大会”上分享了百川智能在大模型时代的思考与实践。日前,百川推出全球最长上下文窗口大模型Baichuan2-192K引发媒体关注。王小川称,虽然在技术创新和技术理想上美国有所领先,但是中国的应用落地能力更强,相信中国明年将诞生若干款超级应用。
2023年4月,王小川官宣创办AI大模型公司“百川智能”,此后百川短短数月便跻身科技独角兽行列。尤其令人瞩目的是,仅半年时间,百川先后发布7款基础大模型,研发速度远超行业水平,且开源模型表现优异。10月30日,百川智能发布Baichuan2-192K大模型,其上下文窗口长度高达192K,是 GPT-4(支持32K上下文窗口,实测约 2.5万字)的14倍。“得到行业的认可,创业公司和大厂内部都在用百川模型”,王小川说。
“理想上慢一步,落地上快三步”,王小川说,这就是百川做大模型的理念。在4月下场之后,百川在两个月时间就完成了第一个70亿参数的模型的发布,行业一般需要半年。他说,国内大模型的发展与“不计成本登月”的OpenAI还存在差距。但年底之前,国内会有几家公司能够做到GPT3.5的水平。
王小川认为,在做应用方面,中国企业会走得很快。基于现在已有的技术,相信中国明年有若干款超级应用。谈到搜索与大模型的关系,他说,搜索与大模型融合才能构成完整技术栈。搜索经验可以助力大模型研发,搜索能力也能补齐大模型模板。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有