讯飞星火认知大模型体验测评：国产大模型领域的“排头兵”_

这个春天里，“国产大模型”正在狂飙突进。

相关数据显示，国内已发布的大模型达到了20余个，从百度、阿里等互联网大厂，到复旦、清华这些著名高校，都纷纷入局该领域。

作为“人工智能国家队”，科大讯飞自然也不甘落后。

4月20日，科大讯飞官宣，“星火”认知大模型将于5月6日正式发布，并在同日晚间的业绩说明会上，披露了“星火”的最新进展，引发业界极大关注。据悉，该模型围绕“知识问答、代码编程、数理推算、创意联想、语言翻译”等实用场景，通过海量文本、代码和知识学习，可实现基于自然对话方式的用户需求理解与任务执行。

4月24日晚间，科大讯飞星火认知大模型官网正式上线，并已开放需求调研，填写企业、姓名、电话号码以及使用场景，便可以获取体验资格。

“星火”上线，体验究竟如何？

进入测试页面，首先映入眼帘的便是UI交互，风格十分简洁。在左下罗列着一些预设提问，如“为什么下水道的盖子是圆的”、“从1加到100等于多少”，左上则是对话任务窗口。

我们首先提问了关于模型自身的问题。

“讯飞星火认知大模型是什么？”

“为什么要叫‘星火’？”

总体上，“星火”对于自身的认识还是十分到位的，在回答名字由来时也是条理清晰。并且作为科大讯飞的大模型，表现出对于人工智能领域的期望。此外，在回复速度上，以中文显示时，“星火”表现得毫无迟滞感，十分顺畅。

日常问题的解决，对普通用户十分重要，在这一方面，“星火”表现如何呢？我们问了以下问题。

“如何做一份糖醋鲤鱼？”

在菜谱之外，居家“生活妙招”也毫不含糊。

“鞋子除臭有什么妙招？”

在日常问题的处理中，“星火”可谓做到了“有始有终”，不仅列出了详细的步骤和方法，还“贴心”地附加了各种提醒，结构十分完整。

在学习工作中，“星火”能否有所发挥呢？我们选择了最经典的翻译问题，以一本研究AI的英文书籍为例。

“星火”游刃有余，翻译准确度比较高，而且较为简洁，在学习工作中充当“翻译助手”，显然不在话下。

日常生活问题之外，测试“星火”的“IQ”，我们采用了最常用的脑筋急转弯。

“小明的妈妈有四个孩子，前三个是小亮，小红，小丽，那第四个孩子叫什么呢？”

推理能力不够的AI，经常会在这种问题上翻车，可“星火”的表现却令人惊喜，轻松给出了正确答案，完全没有被绕进去。尽管在后续测试中，面对“缺乏逻辑”的问题和“地狱笑话”，“星火”也和很多AI一样败下阵来，但前面的表现依旧亮眼。

IQ不错，那EQ呢？我们又选择了刁钻的两性难题

“冷战时，对方拒绝沟通怎么办？”

面对棘手的两性问题，“星火”的回答还是很合情合理的，能够围绕“沟通”给出十分具体实用的建议。在EQ方面也有着不错的表现。

在笔者的体验中，“星火”总体表现可圈可点，尤其是在日常应用以及学习工作中，“星火”的表现十分稳定，作为国产大模型领域的“新军”，其潜力是十分巨大的。可以预见的是，5月6日“星火”大模型正式发布，无疑会给日常用户带来更加惊喜的体验。

头条号入驻

科技阿维了解手机只为更好的使用

今日推荐优秀作者看点月榜

4000520066 欢迎批评指正