苹果的Siri应用了什么技术和算法?

苹果的Siri应用了什么技术和算法?
2017年12月09日 21:23 神秘许家屯儿

所有语音助手包括若琪、天猫精灵等几乎拥有相同技术组成,所以设计像Siri这样的私人语音助理,你需要:

语音到文本(STT)引擎。引擎将用户的声音转换为文本。语音可以是音频文件或用户的语音流。

文本到语音(TTS)引擎。将文本转换为语音。这在驾驶或烹饪时特别有用,所以用户不必停止他正在做的事情与语音助理交互。另外,它在助理人性化方面起着重要作用。

标记(智能)。标记有助于语音助理了解用户的需求。例如,用户可能会问:“今晚我需要一把雨伞吗?”然后标记引擎可以标记天气或日历信息标签的信息。

降噪引擎。对于语音请求几乎很难有一个安静和完美的环境,总是会有一辆汽车或狗叫。所以降噪引擎不仅可以消除白噪音,还可以帮助你的助手了解你。

语音生物识别。这是一种认证方式,所以你的助手可以识别你的声音,只响应你的命令。 Siri当然有语音生物识别,你可以教它怎么说“Hey Siri”。

语音识别。机器学习组件,驱动所有的个人助理移动应用程序。这项技术让助理能够理解你所说的话的背后的含义。

语音压缩引擎。这个引擎特别有用,因为它为用户提供了快速的输出。它压缩用户的语音,使其更快地发送到服务器。为此,您可以使用不会丢失数据的G711算法。

用户界面。用于语音助理的用户界面由两部分组成,即语音和呼叫。语音部分是用户听到的问题的结果,呼叫是就是在手机屏幕上看到的。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部