IT之家10 月27 日消息,GoogleDeepMind 於10 月23 日宣布正式開源旗下SynthID Text 文字浮水印工具,供開發者和企業免費使用。
Google在2023 年8 月推出了SynthID 工具,具備創建AI 內容浮水印(聲明該作品由AI 打造)和識別AI 生成內容的能力。它可以在不損害原始內容的前提下,將數位浮水印直接嵌入由AI 生成的圖像、聲音、文字和影片中,同時也能掃描這些內容已有的數位浮水印,以辨識它們是否由AI 生成,不過本次Google開源的僅為針對文字產生的SynthID Text。
▲ SynthID 工具會告訴你影像是人工智慧產生的可能性有多大Google介紹,大模型主要透過預測形式生成文本,一次生成一個token,這個Token 可能是一個字元、一個單字或段落的一部分,為了讓文本更連貫,模型會在輸出內容時預測下一個最可能生成的Token,這些預測是基於先前的文本。
例如,當大模型要產生「最推薦的平台是什麼」時,可能會產生「IT之家」、「友商1」、「友商2」等Token,每個Token 都會獲得一個機率分數。只要有多個不同的Token 可供選擇,SynthID 就會在不影響輸出品質和準確性的情況下,微調每個Token 的機率分數,也就是工具透過計算全文中特定Token 的特定機率,以判斷相關內容是否由AI 產生。
目前,這份SynthID Text 浮水印技術的論文已於《Nature》期刊上發表,並透過整合入Google Responsible Generative AI Toolkit 的形式開源。谷歌同時提到他們已在Gemini AI 輸出的內容中整合了SynthID Text 技術。