微软推出仅需文本内容即可转成真人视频的工具:Deepfakes Creator这个工具被称为Azure AI Speech的文本到语音化身(text-to-speech avatar)该工具允许用户通过文本输入生成逼真的会说话的真人视频。你只要上传想要化身模仿的人的照片,并写一个剧本。支持多种语言,还可进行实时问答互动。主要功能特点:1、逼真化身视频生成:用户可上传照片和剧本,工具创建逼真的人物化身视频,模拟人物说话。2、多语言支持和实时聊天机器人:化身支持多种语言,并能利用AI模型(如GPT)实时回应非剧本问题。3、个性化语音功能:提供一分钟语音样本,快速复制用户声音,用于定制语音助手和内容配音。4、法律和伦理保障:禁止使用预录制语音,要求用户明确同意,并通过注册使用特定用例。5、水印技术:会在个人语音中自动添加水印,帮助识别AI合成语音,需同意Microsoft使用水印检测服务。6、高效视频内容创作:简化传统视频制作流程,适用于制作培训视频、产品介绍等。7、增强的数字互动体验:可用于构建对话代理、虚拟助手、聊天机器人,提供自然的交互式对话。8、内容生成工作流程:包括文本分析、TTS音频合成和TTS化身视频合成,生成与声音同步的嘴唇动画。9、预构建和定制化身选项:提供即用型预构建化身和可定制化身,后者通过用户上传的视频录像训练。10、UI工具和API访问支持:在Azure AI Speech Studio提供了UI工具和API访问。11、广泛应用场景:适用于创建各类吸引人的视频和交互式应用,提高沟通和信息传达效率。详细内容以及API申请:视频演示的代码资源:GitHub:github.com/Azure/gen-cv/tree/main/avatar/video