kaldi合并出门问问唤醒recipe

kaldi合并出门问问唤醒recipe
2021年09月09日 11:29 语音之家SpeechHome

freewym(Yiming Wang)在kaldi的master分支合并了Wake-word detection #3467。

此前,出门问问团队在openslr上上传了数据,此数据含有:“hi,小问”和“你好,问问”,还包含一些非唤醒的数据。可以说这个数据基本包含工业界做唤醒的一些数据。数据开源了,当然脚本就开出来。其实脚本还早是ready,可能是等数据出来后才一起开放出来。

脚本提供了chain的方案跟e2e的两套方案。此外,在kaldi/src/online2下也提供在线的程序(online-nnet3-wake-word-faster-decoder),主要根据唤醒的一些特性改了一些。

其中当时这个recipe并没有用SLR87的数据,而是内部数据。@freewym把SLR87合并进去了。至此,在kaldi用chain这套做唤醒的框架有三个recipe:mobvio,mobviohotwords,snip。基于chain的这套方案,可能大家自己在论文或者其他地方都没怎么看到过此方案的具体介绍,但目前效果还是挺好的。在recipes里面提供了一套基于chain的方案,还提供了一套E2E的方案,有兴趣的同学可以自行去研究下。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部