Google DeepMind 宣布将 SynthID 技术开源,并将其集成到 Gemini 模型中。SynthID for Text 是一种为 AI 生成的文本添加水印的技术,通过微调 LLM 预测的下一个标记概率来实现,不影响文本质量和创造力。这项技术能够在不改变文本内容的情况下,可靠地识别 AI 生成的文本,为应对 AI 生成内容的挑战提供了一种新的解决方案。它适用于多种语言,并已集成到 Gemini 应用和网站中,方便用户使用。
SynthID 会对生成的文本添加一个隐蔽的水印,即使经过编辑也能被识别出来。Google DeepMind 声称其性能优于现有文本水印系统,并已将该技术开源,方便开发者和研究者使用和改进。这项技术的开源发布,将有助于推动 AI 生成内容的可靠性和透明度,为构建更安全可靠的 AI 生态系统做出贡献。
近日,Google DeepMind 正在将其 SynthID 技术集成到其 Gemini 模型中,并将其作为开源项目发布。SynthID for Text 使用复杂的流程来干预大型语言模型 (LLM) 的文本生成。
SynthID 会略微调整 LLM 预测的下一个标记的概率分数,但前提是它不会影响输出的质量、准确性或创造力。这个过程会对所有生成的文本重复,形成了水印。
据 Google DeepMind 介绍,这项技术可以应用于最少三句话。对于较长的文本,水印会变得更加稳健和准确。虽然该方法适用于各种语言,但在编辑 AI 文本时,它存在一些弱点。
Google DeepMind 已将 SynthID 集成到 Gemini 应用程序和网站中,用于为生成的文本添加水印和识别。该技术还可作为开源项目在 GitHub、Google Responsible Generative AI Toolkit和Hugging Face上使用。
Google DeepMind 声称 SynthID 的表现优于现有的文本水印系统。此前,Google DeepMind 已推出用于图像、语音和音乐的 SynthID 。
Google DeepMind 开源 SynthID 技术的举措,标志着在对抗 AI 生成内容滥用方面迈出了重要一步,也体现了其对负责任 AI 开发的承诺。未来,随着技术的不断完善和应用范围的扩大,SynthID 将在保障信息安全和维护内容真实性方面发挥更大的作用。