678CHAT AI资讯微软新研究：用AI把会议演讲者的语音现场变成画面

微软新研究：用AI把会议演讲者的语音现场变成画面

作者: 678chat 发布: 2024 年 10 月 15 日 386阅读 0评论

在科技领域，微软公司再次以其创新精神引领潮流。据科技媒体MSPoweruser于10月14日的报道，微软成功获得了一项引人注目的新专利，这项技术能够根据用户的实时语音输入生成图片。

这份专利文件长达20页，微软在2023年4月5日提交了申请，并在10月10日获得了正式批准。该专利详细阐述了一种系统，该系统能够实时捕获会议或讲座中的音频，并利用先进的语言模型对音频内容进行分析和总结，最终生成相应的AI图像。

根据该媒体的详细报道，这一创新过程主要分为三个关键步骤：

首先，系统通过麦克风捕捉用户的语音，并将这些语音实时转换为文本数据。
其次，系统将文本分段处理，每一段文本都通过语言模型进行精炼和总结。
最后，系统根据这些总结生成的提示，利用AI技术创建图像，并在屏幕上实时展示这些图像。

微软预计这项功能将被集成到Microsoft Teams中，为在线会议和讲座提供实时的视觉支持。随着演讲者话题的转换，系统将自动更新生成的图像，从而提升视觉沟通的效果。微软强调，这种实时生成的图像对于澄清复杂概念极为有效，尤其适合那些依赖视觉辅助进行学习的用户。

本文来自网络，不代表678CHAT立场，转载请注明出处：https://www.678chat.com/ai/2276.html

93赞

标签:AI技术微软

发表回复取消回复