微软推出仅需文本内容即可转成真人视频的工具：Deepfakes_

微软推出仅需文本内容即可转成真人视频的工具：Deepfakes Creator这个工具被称为Azure AI Speech的文本到语音化身（text-to-speech avatar）该工具允许用户通过文本输入生成逼真的会说话的真人视频。你只要上传想要化身模仿的人的照片，并写一个剧本。支持多种语言，还可进行实时问答互动。主要功能特点：1、逼真化身视频生成：用户可上传照片和剧本，工具创建逼真的人物化身视频，模拟人物说话。2、多语言支持和实时聊天机器人：化身支持多种语言，并能利用AI模型（如GPT）实时回应非剧本问题。3、个性化语音功能：提供一分钟语音样本，快速复制用户声音，用于定制语音助手和内容配音。4、法律和伦理保障：禁止使用预录制语音，要求用户明确同意，并通过注册使用特定用例。5、水印技术：会在个人语音中自动添加水印，帮助识别AI合成语音，需同意Microsoft使用水印检测服务。6、高效视频内容创作：简化传统视频制作流程，适用于制作培训视频、产品介绍等。7、增强的数字互动体验：可用于构建对话代理、虚拟助手、聊天机器人，提供自然的交互式对话。8、内容生成工作流程：包括文本分析、TTS音频合成和TTS化身视频合成，生成与声音同步的嘴唇动画。9、预构建和定制化身选项：提供即用型预构建化身和可定制化身，后者通过用户上传的视频录像训练。10、UI工具和API访问支持：在Azure AI Speech Studio提供了UI工具和API访问。11、广泛应用场景：适用于创建各类吸引人的视频和交互式应用，提高沟通和信息传达效率。详细内容以及API申请：视频演示的代码资源：GitHub：github.com/Azure/gen-cv/tree/main/avatar/video