678CHAT AI资讯 微软Azure AI语音服务新招:虚拟人物,文本秒变视频!

微软Azure AI语音服务新招:虚拟人物,文本秒变视频!

8月23日,科技界传来振奋人心的消息,微软Azure AI语音服务再次升级,为开发者带来了全新的文本到语音虚拟人功能。这项创新技术能够将简单的文字内容转化为逼真的人类语音视频,为多语言应用开发开辟了新天地。

微软Azure AI语音服务新招:虚拟人物,文本秒变视频!插图

微软今日正式宣布,Text to Speech Avatar功能全面上线。开发者现在可以利用这项技术,为用户打造独一无二的个性化虚拟形象。输出视频的分辨率高达1920 x 1080,帧率稳定在每秒25帧,确保了视频的清晰度和流畅性。以下为示例展示:

Text to Speech Avatar功能亮点如下:

  • 借助Azure AI的文本转语音技术,将文本内容转化为具有自然语音的视频,让虚拟形象栩栩如生。

  • 提供多样化的人物预设形象,满足不同用户的审美需求。

  • 微软Azure AI语音服务新招:虚拟人物,文本秒变视频!插图1

    虚拟形象的声音由Azure AI精心打造的文本转语音技术生成,确保语音的自然度和真实感。

  • 支持使用批量合成API,无论是异步还是实时合成,都能高效地将文本转化为语音人像视频。

  • 在Speech Studio中,开发者可以利用内容创建工具,无需编程知识即可轻松制作视频内容。

  • 通过Speech Studio的实时聊天头像工具,实现虚拟形象与用户的实时对话,提升互动体验。

在定价策略上,文本转视频服务的费用将根据视频的输出时长来计算,以秒为单位进行收费。目前,这项服务已在东南亚、北欧、西欧、瑞典中部、美国中南部以及美国西部等地区推出,为全球用户提供了更便捷的服务体验。

本文来自网络,不代表678CHAT立场,转载请注明出处:https://www.678chat.com/ai/1791.html

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

返回顶部