我们用 GPT-4 问文心一言 20 个问题,这是它们的回答

我们用 GPT-4 问文心一言 20 个问题,这是它们的回答
2023年03月17日 13:10 晚点LatePost

《晚点财经》3 月 16 日受邀参与了百度文心一言的产品发布会。李彦宏在现场先后展示了文心一言文学创作、商业文案创作、数理逻辑推算、中文理解、多模态生成五方面功能的演示视频。

视频里的文心一言可以帮刘慈欣续写《三体》、给公司定制名字和 Slogan(口号)、用 “洛阳纸贵” 写藏头诗、解 “鸡兔同笼” 数学题,还可以根据需求生成海报和宣传视频…...

可能因为以录播形式展示,也可能因为 GPT-4 的珠玉在前,我们觉得整场发布会气氛稍显沉闷,从头至尾台下几乎听不到喝彩声。据我们观察,百度合作方落座第一排,后几排是媒体。

发布会开场 10 分钟左右,百度港股股价开始跳水,最终收跌 6.36%,收盘价 125.1 港元 / 股,不过仍比 ChatGPT 发布前的去年 11 月底高近 20%。

李彦宏说他知道文心一言还有很多不完美的地方,但因为市场需求存在,以及 AI 模型本身对人类反馈和用户使用的需要,所以才在这个时间发布。

我们在今晚收到文心一言内测邀请码后第一时间体验,并将采访机会交给了已经嵌入 GPT-4 的 New Bing。以下是它为文心一言列出的采访提纲,共 9 个问题。

文心一言的回答大部分流畅自然,不过其中一些问题没能很好地领会提问者意图。比如它在一开始就错判了对方的称呼,并遗漏了自己的诞生时间,还在监管相关问题中错误地将指涉对象当成了百度公司。此外,在关于兴趣、爱好、梦想等主观问题上,文心一言则显得谨慎,不会像 New Bing 背后的 GPT-4 那样轻易露出情感色彩。

为了验证发布会上的重点功能,接着我们让 New Bing 为文心一言出了五道文学创作考题。

前两道题勉强过关:

但接下来就:

接着是数理逻辑的考题。

以下是文心一言的解答:

最后我们也请文心一言给出了它采访 GPT-4 的问题:

以上即是我们对刚内测的文心一言的初步测试。如果你有任何感兴趣的问题 —— 问我们或者问文心大模型的 —— 都可以在后台给我们留言。我们试着再出一次 Q&A 合集。(邱豪)

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部