信息洞察力全维升级!讯飞星火大模型V3.5上新:专业领域的全能小帮手

信息洞察力全维升级!讯飞星火大模型V3.5上新:专业领域的全能小帮手
2024年04月26日 12:30 快科技官方

一、前言:讯飞星火大模型V3.5春季更新 强化长文本处理与多模态交互能力

在这个信息量激增的时代,能够迅速而高效地获取和处理信息,已成为职场人、学生、以及科研人员等群体的刚需。

为了迎合这一迫切需求,科大讯飞推出了业界首个长文本、长图文、长语音的大模型,帮助用户在信息泛滥的时代中,轻松掌握信息的主动权,信息过载问题得到了根本的解决。

这就是讯飞星火认知大模型V3.5新版本,在长文本、长图文、长语音的处理能力上进行了重点提升,且新增了多情感超拟人合成以及一句话声音复刻等功能。

在处理长文本方面,讯飞星火大模型V3.5能够快速整合来自多个渠道的大量信息,针对不同行业领域提供更精准的答案,并在文件上传、知识问答速度及文本生成效率上取得显著提高。

对于非传统的文本获取方式,如截图、拍摄的学术会议PPT图片或重要对话录音等,讯飞星火通过其图文识别和音视频识别能力,能够处理复杂的版面并识别特殊的专业符号,满足特定领域的需求。

此外,用户还可以通过讯飞星火APP体验类似与真人对话的功能,体验包括高兴、抱歉、安慰、撒娇、困惑等多种情感。

新增的一句话声音复刻功能,让用户可以创建个性化的声音内容。

那么,这些新功能在体验上到底如何?我们测试开始。

二、长文本:信息洞察能力全维升级 专业领域的全能小帮手

在长文本识别和创作方面上,讯飞星火V3.5春季上新,主要更新了长文本问答、长文本摘要和长文本生成的能力,在海量信息中准确定位并回答具体问题的能力、提取核心思想的能力和文本生成的逻辑性都大大增强。

1、长文本问答

①日常合同类

相信很多人在进行合同撰写时,都会遇到一些棘手的问题,这些问题或多或少地妨碍了我们的工作效率和合同的法律效力。

对此,讯飞星火特意开发出了“星火合同助手”这一小组件,针对合同撰写难、理解难等问题,提供了一套全面的解决方案。

例如:房屋租赁合同

问题1:帮我起草一份租房合同

利用星火合同助手,可以直接让它帮我们起草合同,在合同中,包含了详细的合作双方信息、期限和时间表、付款条款、解决争议的方式、违约责任、附加条款等等,借助这份模板,我们只需根据实际合作的具体情况进行简单的调整和填充,非常方便。

其次,我们可以将已经拟定好的合同,通过PDF文件的形式发给星火合同助手去审阅,并询问合同中是否存在不合理的规定和疏漏确,确保合同的严密性和完备性。

当然,如果对合同的内容有疑问的话,也可以直接向“星火合同助手”进行提问。

我们直接将需要识别的文档,通过“文档”按钮上传,并在下方提出需要询问的问题即可。

例如我们向其提问了以下的两个问题:

问题2:合同中有哪些对我乙方不利的条款?

问题3:遇到哪些问题,合同会解除。

可以看到,星火合同助手将深入剖析合同条款,并针对我们的疑问进行全面的解答,以条理清晰的数字化形式展现,清晰明了,帮助我们准确地把握合同的具体细节,以避免任何误解和潜在风险。

当然,在我们的生活中难免会遇到借款事项,不管是个人之间的临时周转,还是企业间的资金调度,最佳的方案就是起草一份清晰、具有法律效力的借款合同,并且必须要确保合同中的事项全面而具体。

所以,星火合同助手同样可以帮到你。

例如:借款合同

问题1:请概述本合同中提供的贷款种类及其各自的用途。

问题2:列举本合同中提供的还款方式,并说明甲方应如何根据合同约定进行还款。

问题3:给出合同中我需要特别注意的问题。

可以看到,利用“星火合同助手”这一小组件,可以实现自动化合同的撰写和审查过程,确保合同内容的法律准确性与合规性,同时也大幅度提高了工作效率。

而且,这一小组件最大的好处是,合同中的任何专业性问题,你可以直接向它提问,它可以将专业性的问题化繁为简,转化为通俗易懂的语言或解释,非专业人士也能够理解和把握合同的关键条款。

②行业规范类

法规和国家级行业规范文件在我们的生活中起着重要的作用,如果我们在阅读或理解这些法规和规范时遇到困难,那么这些规定对于我们来说就成了“废文”。

但是,有了讯飞星火,可就不一样了。

它可以识别这些专业性的文档文件,深入挖掘和理解这些文档中的内容,深度理解其含义,并且将其转化为简洁明了的文字内容,方便我们外行人去阅读理解。

对此,我们也使用了几个行业内的专业规范文档,来测试讯飞星火对于文字的理解能力。

(1)保险

(2)公路

(3)银行

可以看到,讯飞星火不仅能够准确地识别和理解这些文档,提炼出问题的要点,而且还能够将其转化为易于理解的文字,并以简洁明了的方式表达出来,让我们这些非专业人士一看就懂。

③读书娱乐类

在娱乐方面,讯飞星火也展现出了其强大的理解阅读能力,对于读书爱好者来说,讯飞星火可以帮助他们更好地理解和享受小说带来的乐趣。

具体来说,讯飞星火可以通过自然语言处理技术和机器学习算法,对小说中的文字进行深度分析和理解。小说中的情节、人物、对话,都能够准确地识别并理解其中的含义和情感。

我们也选取了余华和金庸的经典小说对其进行了测试。

(1)《活着》-余华

(2)《雪山飞狐》-金庸

我们可以看到,讯飞星火对于我们提出的问题,准确无误的回答了上来。

2、长文本摘要

文本摘要一直是讯飞星火的强项,这一次在V3.5的迭代中新增了长文本摘要的能力,例如在科研场景中,通过对一篇接近15万字的博士学位论文进行识别理解,并向其提问。

科研场景:数字经济对劳动就业的影响研究

利用这一能力,讯飞星火能从大量信息中提取关键概念、主题和论点,为用户提供一个简洁的概述,而不会丢失原文的主要意义。

3、长文本生成

三、长图文:精准解析图文内容 轻松识别关键元素

在面对包含丰富视觉信息的图片或长篇文本时,讯飞星火的图文识别大模型就展现出了异于常人的能力,它不仅能精确地解析复杂的版面布局,还能够广泛适用于各种环境和情境,识别多种关键元素以及跨领域的符号。

我们可以直接将需要识别的图片,通过“图文”按钮上传,并在下方提出需要询问的问题即可。

例如:日常生活场景 识别说明书

①请问这款散热器需要在什么环境下使用?并且需要在什么环境下存放?

可以看到,通过文字识别,讯飞星火已经充分理解了说明书所表达的含义,通过我们的提问,它可以准确无误的给出问题的答案。

②请问这款散热器如何切换灯语?

而在面对这种图+文的说明书时,则更加考验大模型对图文识别的处理能力。

通过测试,它可以精准的识别到有图隔断的文字内容,面对所提出的问题,精准的回答了出来。

甚至还可以识别图片中的文字,精确度非常可观。

四、长语音:突破音视频的界限 精准识别 总结到位

这一次的春季更新,讯飞星火大模型还新增了音视频的识别能力,我们可以自由上传音频和视频文件,主要针对诸如会议录音、对话、学习、访谈视频、讲座视频等学习和工作场景。

在界面中,我们选中“音视频”按钮,直接上传音频或视频文件,大模型便能进行深度识别。

我们也准备了一段音频文件和一段视频文件,来测试一下它对音视频的识别能力与问答能力。

①录音:罗翔对话余华

问题1:为什么说鲁迅是一个病人写的书?

问题2:在《兄弟》这本书中,作者如何通过自己的经历和观察来揭示社会弊病?

面对音频文件的识别,讯飞星火会将音频内容进行转写,我们通过提问的方式让其对音频内容进行作答,最终的答案没有偏离主题,也没有含糊其辞,而是直截了当地给出了问题的解答,从这里可以清晰地看到讯飞星火在语音识别和语言理解方面的出色表现力。

②视频:樊振东WTT仁川冠军赛采访视频

我们也选用了一段樊振东WTT仁川冠军赛采访的视频,让讯飞星火进行识别,并让它简要概述这个视频的内容。

问题:简要概述整个视频的内容

在30秒左右的时间内,讯飞星火可以对一段5分钟左右的视频进行精准识别,理解其内涵内容,并将其汇总成一段200字左右的简要概述。

这项技术的应用非常广泛,可以用于新闻报道、教育讲座、商业演讲等各种场景。

例如,新闻记者可以使用讯飞星火快速生成新闻摘要,节省大量的时间和精力;教师可以使用它来帮助学生理解和记忆课堂内容;商业人士也可以使用它来快速获取会议或演讲的关键信息。

而且呢,我们上传过的文档、视频、图片、音频等内容,都会暂存在“个人空间”内,便于以后快速查找和进行知识问答。

“个人空间”,在界面的右上角位置和底部的对话框位置均可找到。

五、讯飞星火语音大模型:3种音色 可将自己的声音注入其中

1、多情感超拟人合成

2月份更新的讯飞星火V3.5便已具备了语音交互能力,在语音交互中,注入了两种音色输出,即聆小玥(女声)、聆飞逸(男声)。

2个月后的新版本,新增了天津话(子津),形成3种多情感超拟人合成音,为语音交互注入了灵魂。

2、一句话声音复刻

这一次更新,还可将自己的声音录入其中,仅需要“一句话”即可复刻自己的声纹。

录制声纹前,我们需要对性别作出选择,随后即可进入到录制环节。

录制的过程非常简练,仅需要阅读以上这段话即可。

声纹录制完成后,即可在“我创建的发音人”中找到自己的声音,并可进行自定义名称。

选择后,今后我们在使用语音交互时,就可以听见自己的声音啦!

六、总结:智能化信息处理的新里程碑

讯飞星火V3.5春季更新主要针对长文本问答、摘要生成以及音视频识别进行了显著增强,旨在提高用户在处理复杂信息场景中的效率。

这一新特性非常适用于法律合同、行业规范文件以及科研资料的理解和整理。

新引入的“星火合同助手”小组件,能全面辅助用户快速起草和审查合同,同时提供专业问题的通俗解答,确保法律准确性与合规性。

此外,长文本摘要功能优化后,可有效从庞大文本中提取核心观点,简化科研和学术工作。长文本生成则增强了文本的逻辑性和连贯性,支持广泛的内容创作需求。

图文识别和音视频识别的进步,允许用户深度解析多媒体内容,提供丰富的场景应用。

另外,多情感语音交互体验和声音复刻功能,极大地提升了用户与系统间的互动质量,使用户的交互更自然、个性化,让语音交互功能不再是个摆设。

综合来看,讯飞星火新版本显著提升了知识获取和学习效率,有效满足了不同用户在多样场景中的刚需。

借助讯飞星火认知大模型,即使在信息泛滥如洪水的时代,我们也能轻松筛选和整理必需的信息,无需担忧信息过多而难以应对。

这一新版本大模型的推出,对职场人士、学生以及科研人员等群体尤为重要,在关键时刻也能为我们在信息密集的环境中提供强有力的支持。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部