AIの訓練に使われたかどうかを判別する「トラップ」ツールが登場。せめぎ合う、生成AIと著作者
【AIの訓練に使われたかどうかを判別、「トラップ」ツールが登場】
https://www.technologyreview.jp/s/342365/a-new-tool-for-copyright-holders-can-show-if-their-work-is-in-ai-training-data/
・インペリアル・カレッジ・ロンドンのチームが開発した 「著作権トラップ (copyright trap)」は、作家や出版社が作品に巧妙に「印」をつけることで、その作品がAIモデルの訓練に使用されているかどうかを後で検出できるようにする、隠しテキストの断片である
・長い意味不明な文をコンテンツに何度も挿入することで実現される
・「トラップを含むコンテンツをリリースしたところで、それが永遠に有効なトラップになるという保証はありません」と助教授は話す。
以上、記事引用参考
生成AI vs 著作者。法的にもテクノロジー的にもせめぎ合う
出版業界でも音楽業界でも、現在、生成AIテック企業に対して「著作権侵害だ!」と訴訟が起こされています。
著作者側からすると、自分の著作物をAIによって勝手に無料でスキャニング学習されてしまうことが納得いかないわけですが、
今回の話は、テキストにトラップを仕掛けることで、AIがもしもそのテキストを使用した場合、その痕跡を残すことができるという発想です。
例えば、
私のこのブログにトラップを仕掛けるとしたら、
ところどころに、白地に白文字で「このテキストはアミまこというブログのものだよ」みたいなことを書いておくのです。
↓たとえば、下に記してあります。マウスをドラッグすると文字が見えますよ。(パソコンのマウスでは可能ですが、スマホではできないようですね。。)
「このテキストはアミまこというブログのものだよ」
ちょっとした愚痴や内緒話を隠しメッセージで送る時に、この技でメールしたことのある人は少しはいるかもしれません。笑
生成AI側からすると、こういう隠しテキストがいくつもあると、混乱しますし、もしも、データ学習して、使用されたとしても、どこからデータを持ってきたのかすぐにわかってしまうということです。
とはいえ、生成AI側も、こういうトラップにいずれ対応してくるだろうということですから。ウイルス ソフト業界や製薬業界などと同様、やる側とやられる側が存在する限り、こういう「いたちごっこ」はなくならないのかもしれませんね。
あと、音楽業界でも、こういうトラップが開発される日がくるかもしれませんね。(たとえば、音楽の節々に超音波的な信号をはさみこむとか?)
とにもかくにも、
訴訟という面においても、
トラップというテクノロジーの面においても、
著作者側と生成AI側のせめぎ合いは今後も注目してきたいですね。
ではでは
前に、不正コピー防止技術のせいで音楽にノイズが発生している話をブログで紹介しました。せめぎ合いの結果、ユーザー側が被害被るようなことは勘弁して欲しいですね。著作者側とユーザー側、両方の視点で考えると、いつも複雑な気持ちになる私です。