讯飞星火认知大模型体验测评:国产大模型领域的“排头兵”

讯飞星火认知大模型体验测评:国产大模型领域的“排头兵”
2023年04月27日 14:07 科技阿维

这个春天里,“国产大模型”正在狂飙突进。

相关数据显示,国内已发布的大模型达到了20余个,从百度、阿里等互联网大厂,到复旦、清华这些著名高校,都纷纷入局该领域。

作为“人工智能国家队”,科大讯飞自然也不甘落后。

4月20日,科大讯飞官宣,“星火”认知大模型将于5月6日正式发布,并在同日晚间的业绩说明会上,披露了“星火”的最新进展,引发业界极大关注。据悉,该模型围绕“知识问答、代码编程、数理推算、创意联想、语言翻译”等实用场景,通过海量文本、代码和知识学习,可实现基于自然对话方式的用户需求理解与任务执行。

4月24日晚间,科大讯飞星火认知大模型官网正式上线,并已开放需求调研,填写企业、姓名、电话号码以及使用场景,便可以获取体验资格。

“星火”上线,体验究竟如何?

进入测试页面,首先映入眼帘的便是UI交互,风格十分简洁。在左下罗列着一些预设提问,如“为什么下水道的盖子是圆的”、“从1加到100等于多少”,左上则是对话任务窗口。

我们首先提问了关于模型自身的问题。

“讯飞星火认知大模型是什么?”

“为什么要叫‘星火’?”

总体上,“星火”对于自身的认识还是十分到位的,在回答名字由来时也是条理清晰。并且作为科大讯飞的大模型,表现出对于人工智能领域的期望。此外,在回复速度上,以中文显示时,“星火”表现得毫无迟滞感,十分顺畅。

日常问题的解决,对普通用户十分重要,在这一方面,“星火”表现如何呢?我们问了以下问题。

“如何做一份糖醋鲤鱼?”

在菜谱之外,居家“生活妙招”也毫不含糊。

“鞋子除臭有什么妙招?”

在日常问题的处理中,“星火”可谓做到了“有始有终”,不仅列出了详细的步骤和方法,还“贴心”地附加了各种提醒,结构十分完整。

在学习工作中,“星火”能否有所发挥呢?我们选择了最经典的翻译问题,以一本研究AI的英文书籍为例。

“星火”游刃有余,翻译准确度比较高,而且较为简洁,在学习工作中充当“翻译助手”,显然不在话下。

日常生活问题之外,测试“星火”的“IQ”,我们采用了最常用的脑筋急转弯。

“小明的妈妈有四个孩子,前三个是小亮,小红,小丽,那第四个孩子叫什么呢?”

推理能力不够的AI,经常会在这种问题上翻车,可“星火”的表现却令人惊喜,轻松给出了正确答案,完全没有被绕进去。尽管在后续测试中,面对“缺乏逻辑”的问题和“地狱笑话”,“星火”也和很多AI一样败下阵来,但前面的表现依旧亮眼。

IQ不错,那EQ呢?我们又选择了刁钻的两性难题

“冷战时,对方拒绝沟通怎么办?”

面对棘手的两性问题,“星火”的回答还是很合情合理的,能够围绕“沟通”给出十分具体实用的建议。在EQ方面也有着不错的表现。

在笔者的体验中,“星火”总体表现可圈可点,尤其是在日常应用以及学习工作中,“星火”的表现十分稳定,作为国产大模型领域的“新军”,其潜力是十分巨大的。可以预见的是,5月6日“星火”大模型正式发布,无疑会给日常用户带来更加惊喜的体验。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部