678CHAT AI资讯微软Azure AI语音服务新招：虚拟人物，文本秒变视频！

微软Azure AI语音服务新招：虚拟人物，文本秒变视频！

作者: 678chat 发布: 2024 年 8 月 23 日 243阅读 0评论

8月23日，科技界传来振奋人心的消息，微软Azure AI语音服务再次升级，为开发者带来了全新的文本到语音虚拟人功能。这项创新技术能够将简单的文字内容转化为逼真的人类语音视频，为多语言应用开发开辟了新天地。

微软今日正式宣布，Text to Speech Avatar功能全面上线。开发者现在可以利用这项技术，为用户打造独一无二的个性化虚拟形象。输出视频的分辨率高达1920 x 1080，帧率稳定在每秒25帧，确保了视频的清晰度和流畅性。以下为示例展示：

Text to Speech Avatar功能亮点如下：

借助Azure AI的文本转语音技术，将文本内容转化为具有自然语音的视频，让虚拟形象栩栩如生。
提供多样化的人物预设形象，满足不同用户的审美需求。
虚拟形象的声音由Azure AI精心打造的文本转语音技术生成，确保语音的自然度和真实感。
支持使用批量合成API，无论是异步还是实时合成，都能高效地将文本转化为语音人像视频。
在Speech Studio中，开发者可以利用内容创建工具，无需编程知识即可轻松制作视频内容。
通过Speech Studio的实时聊天头像工具，实现虚拟形象与用户的实时对话，提升互动体验。

在定价策略上，文本转视频服务的费用将根据视频的输出时长来计算，以秒为单位进行收费。目前，这项服务已在东南亚、北欧、西欧、瑞典中部、美国中南部以及美国西部等地区推出，为全球用户提供了更便捷的服务体验。

本文来自网络，不代表678CHAT立场，转载请注明出处：https://www.678chat.com/ai/1791.html

27赞

标签:微软

发表回复取消回复