出品 | 技术栈(微信号:blog51cto)
谷歌正在推出其 SynthID Text 技术,让开发者能够对生成式 AI 模型生成的文本启动水印token和检测,并且该技术如今曾经片面放开。
SynthID Text 可以经过 AI 平台 Hugging Face 和谷歌降级后的担任任生成式 AI 工具包下载。
谷歌的这项成绩曾经被nature接纳了!在这篇论文中,谷歌具体揭秘了水印的上班原理。
那么,SynthID Text 终究是如何上班的呢?
一、SynthID的AI查重:哪个“token”最或许出自AI之手
假定给出一个相似“你最青睐的水果是什么?”的疑问,文本生成模型会预测哪个“token”最有或许跟在另一个token之后——逐一token生成。token可以是单个字符或单词,它们是生成模型用来处置消息的基本构件。
以 "我最青睐的热带水果是____"为例。LLM 或许会从 "芒果"、"荔枝"、"木瓜 "或 "榴莲 "等标志词开局实现句子,并为每个标志词调配一个概率分数。当有一系列不同的标志可供选用时,SynthID 可以在不影响输入品质、准确性和发明性的状况下,调整每个预测标志的概率分数。
谷歌示意,SynthID Text 经过“调理生成token的或许性”在这种token散布中拔出了额外消息。
上图:LLM 文本生成通常是经过从左到右生成文本的方式,重复从 LLM 散布中启动采样。下图:生成式水印方案通常由三个组成局部形成,如蓝色框中所示:随机种子生成器、采样算法和评分函数。这些组件可以用于提供一种文本生成方法和水印检测方法。在 SynthID-Text 生成式水印方案中,咱们经常使用的是锦标赛采样算法。
谷歌宣称,自往年秋季以来,SynthID Text 已与其 Gemini 模型集成,并且不会影响文本生成的品质、准确性或速度,即使在文本被裁剪、改写或修正后依然有效。
这种技术可用于少至三句话的内容。随着文本长度的参与,SynthID 的持重性和准确性也会提高。
二、SynthID的多模态停顿:音频、视频也有水印
谷歌示意,经常使用谷歌模型生成的AI音频、视频,也曾经“自带水印”。
1.音频
在音频方面,SynthID 会把 Lyria 模型生成的音频加下水印。
SynthID的技术是,先将音频波(声响的一维体现方式)转换为频谱图。
计算出频谱图后,SynthID会将数字水印参与其中。最后,将频谱图转换回波形。在这一转换步骤中,SynthID 应用音频个性确保人耳听不到水印,从而不会影响听觉体验。水印对许多经常出现的修正(如参与噪音、MP3 紧缩或放慢和减慢音轨)都很持重。
SynthID 还能扫描音轨,检测不同点能否存在水印,以协助确定其中的局部能否由 Lyria 生成。
2.视频
SynthID 将人眼不可发觉的数字水印间接参与到AI图像和视频中。
而且,即使经过各种技术操作,比如裁剪、参与滤镜、扭转色彩、扭转帧频和经常使用各种有损紧缩等,也不可解脱这个水印。
三、写在最后
不过,谷歌抵赖其水印方法存在局限性。
例如,SynthID Text 在处置短文本、改写或从其余言语翻译的文本时体现不佳,或许在处置回答理想性疑问时效果较差。“在回答理想性揭示时,调整token散布的时机较少,且不会影响理想准确性。”这包含像“法国的首都是哪里?”之类的疑问,或许像“背诵威廉·华兹华斯的诗”这样简直没有变动空间的恳求,此类输入很难被识别。
谷歌并不是惟逐一家努力于 AI 文本水印技术的公司。OpenAI 多年来不时在钻研水印方法,但因为技术和商业方面的思考,推延了发布。
假设文本水印技术被宽泛驳回,它可以协助应答日益盛行但经常失误token的“AI 检测器”疑问,这些检测器会失误地将以较为通用的语气撰写的文章或论文token为 AI 生成的。但是,疑问在于,这些技术能否会被宽泛驳回,以及能否有某一组织的规范或技术会胜出。
未来或许会有法律机制迫使开发者驳回这些技术。中国曾经引入了对 AI 生成内容强迫加水印的规则,加利福尼亚州也正方案采取相似措施。
情势十分紧迫。依据欧盟执法机构的一份报告,到 2026 年,90% 的在线内容或许会是由 AI 分解生成的,这将带来关于虚伪消息、宣传、欺诈和诈骗的新执法应战。据 AWS 钻研显示,因为 AI 翻译工具的宽泛经常使用,网络上约 60% 的句子或许曾经是 AI 生成的。
参考链接:
1.
2.
想了解更多AIGC的内容,请访问:
AI.x社区