GoogleDeepMind 開源SynthID Text 工具，可辨識AI 產生的文字

作者：Eve Cole 更新時間：2024-11-16 11:06:01

IT之家10 月27 日消息，GoogleDeepMind 於10 月23 日宣布正式開源旗下SynthID Text 文字浮水印工具，供開發者和企業免費使用。

Google在2023 年8 月推出了SynthID 工具，具備創建AI 內容浮水印（聲明該作品由AI 打造）和識別AI 生成內容的能力。它可以在不損害原始內容的前提下，將數位浮水印直接嵌入由AI 生成的圖像、聲音、文字和影片中，同時也能掃描這些內容已有的數位浮水印，以辨識它們是否由AI 生成，不過本次Google開源的僅為針對文字產生的SynthID Text。

▲ SynthID 工具會告訴你影像是人工智慧產生的可能性有多大

Google介紹，大模型主要透過預測形式生成文本，一次生成一個token，這個Token 可能是一個字元、一個單字或段落的一部分，為了讓文本更連貫，模型會在輸出內容時預測下一個最可能生成的Token，這些預測是基於先前的文本。

例如，當大模型要產生「最推薦的平台是什麼」時，可能會產生「IT之家」、「友商1」、「友商2」等Token，每個Token 都會獲得一個機率分數。只要有多個不同的Token 可供選擇，SynthID 就會在不影響輸出品質和準確性的情況下，微調每個Token 的機率分數，也就是工具透過計算全文中特定Token 的特定機率，以判斷相關內容是否由AI 產生。

目前，這份SynthID Text 浮水印技術的論文已於《Nature》期刊上發表，並透過整合入Google Responsible Generative AI Toolkit 的形式開源。谷歌同時提到他們已在Gemini AI 輸出的內容中整合了SynthID Text 技術。