大模型拯救智能音箱?它推动的,或许还有大厂生态战

大模型拯救智能音箱?它推动的,或许还有大厂生态战
2023年07月09日 22:30 用户5590018809

谁将是最先迈入“ChatGPT+”时代的智能硬件?智能音箱正在奔跑的路上。

7月5日,有消息曝出,天猫精灵启动内测业内首个大模型终端操作系统。随后,A股智能音箱板块出现异动,奋达科技直线拉升触及涨停,惠威科技、全志科技、国光电器等拉升。

在今年5月10日,国光电器曾发布公告称,公司研发的搭载ChatGPT智能音箱于本月推出。虽然当时该产品未正式对外销售,未实现销售收入,但在5月11日,该公司股价涨停。

6月15日,国光电器又在活动平台上表示,其目前推出的搭载ChatGPT的智能音箱,是依据云端的算力提供反馈内容的。

6月30日,智度股份在投资者互动平台表示,公司正委外研发搭载了ChatGPT的智能音箱,并计划后续向市场推出搭载了ChatGPT的自有声学品牌产品。

AI大模型的火热,让智能音箱这一智能家居硬件再次引起了市场关注。

互联网巨头们也在试水大模型落地应用时,考虑到了智能音箱。今年2月9日,百度旗下智能硬件品牌小度科技就宣布,融合百度大模型文心一言的全面能力,打造针对智能设备场景的AI模型“小度灵机”。借助它,可将现有智能音箱中的语音助手变成“超级助理”。

阿里的天猫精灵,也已接入通义千问大模型。在通义千问发布时,时任阿里集团首席执行官的张勇还透露说,希望未来天猫精灵成为“个性化的智能助手”。

事实上,发展陷入瓶颈状态的智能音箱,已经期盼着“破局”很久了。当年的智能音箱市场,曾经历了热闹非凡的“百箱大战”,包括BAT、京东、小米、喜马拉雅、科大讯飞等一众互联网公司,纷纷下场参与竞争,甚至展开了惨烈的价格战。但在智能音箱市场格局初定之后,其市场增长便开始逐渐放缓。

根据市场调研机构洛图科技(RUNTO)发布的报告,在2022年,百度、小米、阿里三家厂商的智能音箱产品,占据了整体市场规模的93%;国内智能音箱去年的销量为2631万台,同比下降了28%;市场销售额为75.3亿元,同比下降25%;在售品牌也从2020年的43个减少到了2022年的27个。

销量下降、中小品牌退出,无不显示出了智能音箱行业发展的困顿。今年3月,国内的智能音箱“老大哥”叮咚音箱发出公告,宣布在月底停服,也成为当前市场情况的注脚。

曾被大厂们寄予“下一代交互入口”期望的智能音箱,如今已经落寞。在不少家庭中,它甚至已经沦为“吃灰”的命运。现在,它能借由ChatGPT,重获新生吗?

实际上,大模型带来的AI语音助手的飞跃,对于百度、阿里、小米、华为等互联网大厂而言,也意味着,它们的智慧生态入口争夺战,也终于迈入了新的阶段。

大模型能改变智能音箱什么?

搭载了ChatGPT的智能音箱,能做什么?

关于这个,我们可以通过其他应用,来做个预测。

5月23日,Build 2023年度开发者大会上,微软一口气宣布了超过50项和人工智能相关的更新。其中最引人注目的一项是,微软表示将在Windows系统中全面接入AI助手Windows Copilot,让它成为全新的PC助手——或许,这是比Siri更强大的AI助手。

office大礼包之后,Windows大礼包也来了。搭载了大模型,Windows Copilot工具的使用场景更丰富了:它可以帮助用户处理文档,进行内容的解释、总结,直接生成图片发给相关工作群组;它也可以帮助用户调整PC设置,比如,它可以帮你把电脑调成夜间模式;此外它也可以直接帮助你打开音乐App,推荐和播放相应的歌单等等。

当然,它也可以作为PC上直通Bing/ChatGPT体验的门户,比如你可以向它提问,让它帮你制定出行日程,查找航班和酒店等。

对各类服务提供商来说,大模型是一个“扩音器”,把各类应用的能力升级。对用户来说,比如办公、家居服务,效率将得到大幅提升,就像拥有一个全能的AI语音助手,和以前不同,它能真正做到聪明、善解人意。

今年2月和3月,百度公布了小度灵机大模型内测的系列视频。其中很有趣的是,工程师们模拟日常真实环境中多人对话发问的场景,比如给小度灵机安排开公司例会的日程,但测试者在其中故意多次更改时间,还插入了多个事件,比如剪头发、看望妈妈等,添加了准备会议材料、找孩子的学生卡、带钥匙、买东西等一大堆事。最后考验小度灵机,是否能准确地理解,列出一份正确的待办事项日程表。

作为“智能管家”的身份,小度灵机还调度全屋智能家电。比如,它能认识到用户想要的到家时间、不同季度的温度,不仅按时开关空调,还能调节空调温度。

在4月阿里云峰会上展示的天猫精灵,也更智慧了。比如,用户在跑步,就可以要求天猫精灵合成一个“50%穿插摇滚风格的歌曲”的定制版歌单,来适应场景。对话时,用户也可以随时打断不感兴趣的话题,开展新的对话。

在B站上,此前就有了可以在无违规基础上,在Github上将ChatGPT接入小爱同学的视频。完成部署后,小爱同学被唤醒进行提问时,ChatGPT生成的文本会被小爱同学通过TTS(语音合成技术)进行语音回答。在视频中,有开发者说,部署完的小爱同学“智商飙升”。

想当初,大厂鏖战智能音箱,就是期待它能成为家庭场景中,智能家居“入口级”的设备。现在,或许通过ChatGPT和大模型,有了实现的曙光。

音箱背后,是智慧生态入口争夺之战

智能音箱,对现在很多家庭来说,早已不是什么稀罕物。有的家庭中,甚至拥有不止一台,从小度音箱到天猫精灵、小爱同学,不一而足。但问题是,购买它的人,却往往都不太满意。

早在很久前,西局就问了周围一圈人对智能音箱的看法,包括年轻人、老人以及小孩,得到最多的反馈就是:鸡肋。老人喜欢看剧、听书,而智能音箱的内容偏少,不太好用;低龄儿童则对智能音箱的语音交互功能理解不够。对他们来说,更喜欢带屏的智能音箱,而它更受欢迎是因为能提供视频通话的功能。

对年轻人而言,智能音箱并不是生活的刚需。

同时,大部分智能音箱在功能上,也不能满足大众的需求:不少音箱搭载的语音助手们不仅不“聪明”,甚至在交互上,还有些困难。比如有的音箱唤醒的时间较长;语音识别容易出现偏差、对于长句理解不够准确,对于多轮对话无法准确理解前后语义。此外,这些语音助手只能理解有限的问题,在对话时,对很多问题无法提供答案。

大多数音箱能够走入大众家庭,是背靠大厂,可以打低价策略。竞争激烈时,一款智能音箱能卖出只有几十块钱的“白菜价”。当低价补贴不再,大众的新鲜感也已过去,它走到在普通家庭中落灰“吃土”的境地,也就并不稀奇。

但当初的智能设备入口之争,为什么落在了音箱的头上?

在智能手机陷入红海之后,手机的故事也已经挖空了市场的想象力。那么,接下来什么才是人类未来新的入口级产品?从智能眼镜到可穿戴设备,科技公司们进行了无数试验。但在这个过程中,随着互联网的成熟,人工智能技术的发展,触屏之外,语音成为被寄予期望的下一个核心入口。

当初亚马逊Echo的成功,给科技公司们提供了一个现成的样本,证实了这一产品的可行性。于是,不肯错失机会的巨头们,纷纷在智能音箱市场会师,这类产品也日趋同质化。

尽管智能音箱市场已经扩大,但AI语音识别技术的算法却没有在近几年获得更大的突破。厂商们作出了创新,包括在其上加入大屏,但始终缺乏一个真正实现质变的拐点。

实际上,大厂们还希望,智能音箱能够在AIoT时代,当更多的设备可以联网时,替代手机,担负起其智慧家庭战略中,全屋智能设备的“唯一入口”的重担。

像小米,在2019年启动“手机+AIoT”双引擎战略时,就将智能音箱作为其了全屋智能设备的操控入口之一。

2020年,小度科技宣布独立融资,之后公布了其“一屋一屏”战略,加快了全屋智能的布局。在智能音箱之后,其围绕着对话式AI操作系统,不断扩充家庭硬件品类。2021年3月,小度发布了首款专业学习平板;今年3月,小度推出“添添闺蜜机”;今年5月22日,小度正式发布了旗下首款小度青禾学习手机。

天猫精灵也不止植根于音箱。早年其就成立了“天猫精灵AI联盟”,并已植入到越来越多的产品中,如空调、扫地机、投影仪等,还发布了智慧屏天猫精灵E1切入教育赛道。天猫精灵启动首个大模型全面驱动的终端操作系统内测消息传出后,有媒体报道,在技术架构上大模型已全面掌管和驱动对话式AI操作系统,这个版本对大部分存量智能硬件也可用,具有几十秒内在线升级能力,将陆续覆盖音箱、眼镜、智慧屏、APP和部分AIoT生态设备和场景。

“百箱大战”竞争、智能音箱卖出“白菜价”背后,是一场AIoT生态的争夺战。

但“交互”没有得到改善,其他创新都缺乏力量。智能音箱在很多家庭中,也更多地是像普通的蓝牙音箱一样,用来听歌了,更遑论和其他家居设备打通。

创新服务难以持续,用户增长也就放缓。同时,智能音箱市场也逐步集中到头部企业产品,缺乏充分竞争,市场活力逐渐减弱。

大模型能不能带来希望?

当大模型火热推出后,大厂们也在为其寻找落地场景。

通义千问大模型发布时,张勇曾说:“所有行业、所有应用、所有软件、所有服务都值得基于新型人工智能技术、基于AIGC各方面技术支撑、大模型支撑重做一遍。”

这也包括家庭和办公场景应用,而其中,智能交互入口的重要性也再度得到了关注。大模型不断拓展新的应用场景,或许也将给智能音箱带来破局机会。

ChatGPT的出现,给语音助手提供了新的优化思路。ChatGPT背后的大语言模型,自然语言理解能力更强,且具有更强的通用性。当机器理解人类语音指令的能力能够实现飞跃,AI语音助手也就能够成为用户工作和生活中真正的“助手”。

这为智能音箱担负起更多的服务功能,充当“入口”,又一次提供了可能。申万宏源证券报告曾提出,ChatGPT将助力智能音箱成为AI“嘴替”,点燃智能语音应用生态。

技术的飞跃,为智慧入口带来了希望。而一切尝试,或许都给未来打开了一扇大门。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部