北京达佳互联申请音色转换专利,能够快速准确将源音频转换为任意音色目标音频

北京达佳互联申请音色转换专利,能够快速准确将源音频转换为任意音色目标音频
2024年12月02日 13:31 金融界火线

金融界 2024 年 12 月 2 日消息,国家知识产权局信息显示,北京达佳互联信息技术有限公司申请一项名为“音色转换方法、装置、设备及存储介质”的专利,公开号 CN 119049490 A,申请日期为 2024 年 9 月。

专利摘要显示,本公开提供了一种音色转换方法、装置、设备及存储介质,属于计算机技术领域。上述方法包括:将第一音频的内容信息、音高信息以及第二音频的声纹信息编码为第一特征向量,第一特征向量表示第一音频的内容特征、音高特征以及第二音频的音色特征;基于第一特征向量的分布信息,将第一特征向量映射到潜在空间,得到潜在特征向量;对潜在特征向量进行解码,得到第三音频,第三音频的音色为目标音色,第三音频的内容与第一音频的内容相同。上述技术方案能够快速准确地将源音频转换为任意音色的目标音频,并在转换过程中保留源音频的音高信息和内容信息,从而在保证音色转换的准确度的同时,保留了音频中的细节信息,提升了目标音频的自然度和流畅度。

财经自媒体联盟更多自媒体作者

新浪首页 语音播报 相关新闻 返回顶部