深陷创新瓶颈的智能手机,AI能否成为“渡劫”法器

深陷创新瓶颈的智能手机,AI能否成为“渡劫”法器
2017年08月04日 17:13 用户6053884532

你是否有过这样的困扰——

收到的消息信息量极大,有时间、地点、日程、号码等多种内容,复制想要的内容实在考验眼力和手力,还要打开无数个app选择复制粘贴选择复制粘贴......心疼手残党。

你是否有过这样的幻想——

手机在收到大段信息之后,不管是地址还是吃喝玩乐等信息都可以一键识别关键信息,秒懂你的需求。

救星来了。

2016年全球智能手机出货量达到14.5亿部,同比仅增长0.6%(数据来自:IDC)。出货量的整体萎靡凸显了一路高歌猛进的智能手机面临创新困境的事实,购买智能手机从解决刚需转变成了一个以考虑喜好换机为主导的市场,“改善型”需求的释放意味着仅仅依靠硬件、系统进行 PK 的时代渐渐远去。之前智能手机经历的硬件和系统创新的过程其实是用户使用习惯培养的过程,当引导的使命完成之后,要求越来越“苛刻”的用户急切需要更加差异化的服务,“智能”的概念也由以平台为中心的应用扩展性转变为以用户使用体验为中心的“人工智能”。

2016年下半年,由于技术的成熟和市场环境的发展,AI 开始在手机行业爆红,比如三星 Galaxy S8 的 Bixby、荣耀 Magic 的 Magic Live 智慧系统,AI 为陷入创新瓶颈的手机厂商们抢占离用户最近的入口增添了更多想象,据 CounterPoint 的数据显示,2017年第一季度全球智能手机出货量同比增长了11%,与2016年第一季度下降2% 形成鲜明对比,其中一个重要原因就是搭载人工智能等技术的设备推动了智能手机用户升级。

目前来说,智能手机与 AI 的结合主要是从两个方向进行:

一 从 ROM 层面引入 AI 来优化系统,比如魅族在 Flyme 6上引入人工智能技术,推出系统服务“One Mind”。

二 利用 AI 优化单个功能体验,比如锤子的 Big Bang 功能和智能语义拖拽功能。

但是 AI 究竟是会昙花一现还是会长期为手机品牌建立竞争壁垒?其中很重要的一个考量因素就是场景。真正能够存活下来的技术必然要回归到应用场景上,否则技术再强都没意义,因为技术代表你能否做到,而场景则决定了你能否走得更远。

说到场景,曾经“便携性”是智能手机应用场景在一定程度上高于 PC 论调的优势和资本。但与这种论调同时存在的一个尴尬就是:一直举着“便捷”大旗的手机在面对海量信息从 PC 端迁移到手机上时却又无法给用户提供超出 PC 的便捷体验。

那这种悖论的问题究竟出在哪里呢?其一便是产品目标与用户操作习惯的脱节,而这也是影响用户体验的重要环节。三角兽语义技术在锤子手机 Big Bang 和 One Step 上的落地就恰好为这一问题的解答做出了有益尝试。

提到语义技术在手机场景里的应用, 首先大家可能会想到语音助手一类的产品,例如 Siri 等,但其实手机上最频繁的操作是 touch。

无论是语音作为输入还是用户点击一段文本作为输入,涉及到文本方面的语义理解处理技术的实现其实并没有特别大的区别。

三角兽的语义技术可以更广泛的支持手机用户的多模态输入方式,提升手机在交互上的体验。具体来讲,对于任何一段文本,三角兽都可以使用自身语义技术进行语义意图识别及关键信息的提取。

其中语义意图是对应手机上各种类型的 App,将用户看到及点击的文本对应到不同 App 的应用上。

而关键信息的提取,则会进一步串联 App 间的操作,做到真正的一步直达(One step)。

但真正的“智能”除了技术能力升级之外还需要适应及培养用户使用习惯,加入个性化因素,这样才能做到千人千面。

因此在具体的实现细节方面,三角兽考虑到手机场景的限制,提供了端侧和云侧两套解决方案:

端侧的解决方案部署在手机内部存储空间上,可以在手机网络状况不佳的环境下,提供语义理解的能力。对于端侧环境,由于手机内存、存储空间及耗电量的限制,需要尽可能减少对手机内部资源的占用,所以在端侧方案的选择中,三角兽采用了较轻量的模型并针对模型对系统资源的占用做了大幅度的优化,最终实现了在用户无感知的时间内完成整套语义理解流程。其中对于语义意图识别子功能,三角兽采用了SVM模型;对于关键信息提取子功能,则采用了CRF模型。

文本意图分类:SVM模型结构

文本序列标注:CRF预测结构图

云侧的解决方案可以在手机接入网络的情况下提供语义理解能力,其能力要强于端侧的解决方案。由于没有了手机端苛刻环境的限制,在整套解决方案中大量的采用深度学习的模型,其准确率和召回率都有了一定的提升。其中对于语义意图识别子功能,三角兽采用了CNN模型;对于关键信息提取子功能,则使用了BiLSTM+CRF模型。

文本意图分类:CNN模型结构

文本序列标注:BiLSTM + CRF结构图

对于模型相关的评估标准,三角兽采用了准确率召回率及 F1 值等评估标注。评估数据也是收集覆盖各场景所用到的语料类型,例如短信文本、微信聊天文本、新闻文本等等。三角兽的模型最终在多个场景的评估语料中都得到了较好的评估结果。锤子手机的落地应用恰好佐证了这一结果。

智能语义技术的推出和发展势必会重新定义用户对手机交互的感知,“智能手机”将真正变成“智能的手机”,洞悉用户的一切需求。

更多产品方案持续解锁中......

敬请期待!

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部