所有语音助手包括若琪、天猫精灵等几乎拥有相同技术组成,所以设计像Siri这样的私人语音助理,你需要:
语音到文本(STT)引擎。引擎将用户的声音转换为文本。语音可以是音频文件或用户的语音流。
文本到语音(TTS)引擎。将文本转换为语音。这在驾驶或烹饪时特别有用,所以用户不必停止他正在做的事情与语音助理交互。另外,它在助理人性化方面起着重要作用。
标记(智能)。标记有助于语音助理了解用户的需求。例如,用户可能会问:“今晚我需要一把雨伞吗?”然后标记引擎可以标记天气或日历信息标签的信息。
降噪引擎。对于语音请求几乎很难有一个安静和完美的环境,总是会有一辆汽车或狗叫。所以降噪引擎不仅可以消除白噪音,还可以帮助你的助手了解你。
语音生物识别。这是一种认证方式,所以你的助手可以识别你的声音,只响应你的命令。 Siri当然有语音生物识别,你可以教它怎么说“Hey Siri”。
语音识别。机器学习组件,驱动所有的个人助理移动应用程序。这项技术让助理能够理解你所说的话的背后的含义。
语音压缩引擎。这个引擎特别有用,因为它为用户提供了快速的输出。它压缩用户的语音,使其更快地发送到服务器。为此,您可以使用不会丢失数据的G711算法。
用户界面。用于语音助理的用户界面由两部分组成,即语音和呼叫。语音部分是用户听到的问题的结果,呼叫是就是在手机屏幕上看到的。
4000520066 欢迎批评指正
Copyright © 1996-2019 SINA Corporation
All Rights Reserved 新浪公司 版权所有
All Rights Reserved 新浪公司 版权所有