谷歌宣布,其研发的SynthID文本水印技术现已通过谷歌负责任生成式AI工具包以开源形式发布。这项技术旨在使人工智能生成的文本更易于识别。
谷歌DeepMind研究副总裁普什米特·科利向《麻省理工科技评论》表示:“现在,其他生成式AI开发者将能够利用这项技术,检测文本输出是否来自他们自己的大型语言模型,这将使更多开发者能够更负责任地构建AI。”
随着大型语言模型被用于传播政治虚假信息、生成非自愿性色情内容以及其他恶意目的,水印已成为越来越重要的工具。加利福尼亚州已在考虑将AI水印强制化,而中国政府去年已开始实施这一要求。然而,这些工具仍在开发中。
去年8月公布的SynthID通过在图像、音频、视频和文本生成时添加不可见的水印,使其生成的AI输出可检测。谷歌表示,SynthID的文本版本通过使文本输出的可能性略微降低,以软件可检测但人类不可察觉的方式工作。
大型语言模型会逐个生成文本标记(token),这些标记可以代表单个字符、单词或短语的一部分。为了生成连贯的文本序列,模型会预测下一个最可能的标记来生成。这些预测基于前面的单词以及为每个潜在标记分配的概率分数。
例如,对于短语“我最喜欢的热带水果是__。”大型语言模型可能会开始用“芒果”、“荔枝”、“木瓜”或“榴莲”等标记来完成句子,并为每个标记分配一个概率分数。在有多种标记可供选择的情况下,SynthID可以在不影响输出质量、准确性和创造性的前提下,调整每个预测标记的概率分数。
此过程在整个生成的文本中重复,因此一个句子可能包含十个或更多调整过的概率分数,而一页内容可能包含数百个。模型选择的单词以及调整后的概率分数的最终模式组合被视为水印。
谷歌称,该技术已集成到其Gemini聊天机器人中,且不会牺牲生成文本的质量、准确性、创造性或速度,而这一直是水印系统长期存在的问题。谷歌表示,该技术可用于至少三句话的文本,以及被裁剪、改写或修改过的文本。但它在处理短文本、重写或翻译的内容,甚至对事实问题的回答时存在困难。
谷歌在5月的一篇博客文章中写道:“SynthID并不是识别AI生成内容的万能药。但它是开发更可靠的AI识别工具的重要基石,并有助于数百万人就如何与AI生成的内容互动做出明智的决定。”