最新动态显示,科技界再次迎来了令人瞩目的突破。在昨日的一篇博文中,知名科技媒体 testingcatalog 透露了 OpenAI 正在秘密研发的一项新功能——为 ChatGPT 应用增添语音功能,旨在让机器朗读的声音更加贴近人类,充满情感与表现力。
根据逆向工程的分析结果,OpenAI 似乎正计划推出多达 8 种全新的语音选项,每一种都拥有一个独特的代号,预示着它们将拥有独特的声音特征。这些新声音的开发,无疑将为语音合成技术带来革命性的进步。
更加引人入胜的是,这些即将问世的声音不仅能够模仿人类的自然语调,还能够模拟动物的叫声和其他非语言的声音,这无疑将极大地丰富语音合成的应用场景。
在处理文本时,这些新声音还能够根据文本的格式,如加粗或斜体,来调整朗读的语调和情感,从而更加精准地传达作者的意图和文本的情感色彩。然而,需要注意的是,尽管这些新功能令人期待,但它们仍然是基于 TTS 技术的语音合成,与目前尚处于测试阶段的高级语音模式可能并不相同。
为了让观众更直观地感受这些新声音的魅力,OpenAI 还特别制作了一段语音演示视频,展示了这些新声音在不同场景下的应用效果。通过观看这段视频,我们可以一窥未来语音技术的发展方向,以及它将如何改变我们与机器的交互方式。