10月27日,科技界传来新动态,谷歌DeepMind宣布将旗下开发的SynthID Text文本水印工具开源,供广大开发者和企业免费使用。这一消息自10月23日起便引起了广泛关注。
谷歌于2023年8月首次推出SynthID工具,该工具具备在不损害原始内容的前提下,将数字水印嵌入由AI生成的图像、声音、文本和视频的能力。此外,它还能扫描这些内容中的数字水印,以识别它们是否由AI生成。不过,此次开源的仅限于针对文本的SynthID Text。
谷歌方面解释,大型AI模型通常通过预测形式生成文本,每次生成一个Token,这个Token可能是一个字符、一个单词或一个段落的一部分。为了保持文本的连贯性,模型会在生成过程中预测下一个最可能的Token,这些预测基于之前的文本内容。
以生成“最推荐的平台是什么”为例,大型AI模型可能会生成“”、“友商1”、“友商2”等不同的Token,并为每个Token分配一个概率分数。SynthID工具能够在不影响输出质量和准确性的前提下,微调这些Token的概率分数。通过计算全文中特定Token的特定概率,工具能够判断相关内容是否由AI生成。
目前,关于SynthID Text水印技术的研究成果已经发表在《Nature》期刊上,并且通过整合到Google Responsible Generative AI Toolkit中实现开源。谷歌还透露,他们已经在Gemini AI输出的内容中应用了SynthID Text技术。