![メタのメールが明らかにする、AIトレーニングのための海賊版書籍のトレント転送](https://ja.wizcase.com/wp-content/uploads/2025/02/Screenshot-2025-02-10-at-17.11.58.webp)
Image by Nokia621, from Wiki Commons
メタのメールが明らかにする、AIトレーニングのための海賊版書籍のトレント転送
新たに公開されたメールは、著作権訴訟の進行中にMetaに対する「最も有害な証拠」として著書の著者たちから指摘されています。これは、Ars Technicaが初めて報道しました。
急いでいる方へ!ここに要点をまとめました!
- Metaは、LibGenやZ-Libraryのような影の図書館から81.7テラバイトの海賊版書籍をトレントでダウンロードしました。
- 内部のメールによると、Metaの従業員たちは、著作権のある資料をトレントでダウンロードし、シードすることについて法的な懸念を表明しました。
- Metaは allegedly Facebookのサーバーを避け、シード活動を最小限に抑えることでトレント行為を隠蔽したとされています。
Ars Technicaの報道によると、著者たちはMetaが不法に著作権を侵害した書籍でAIモデルの訓練を行ったと主張しています。また、電子メールからは、トレントやシードによる著作権付き資料の合法性についての社内の懸念が明らかになっています。
先月、Metaは、数千万冊の海賊版書籍を含むという物議を醸すデータセット、LibGenをトレントでダウンロードしたことを認めました。
しかし、詳細は未修正のメールが公開されるまで不明のままでした。
著者たちの裁判提出書類によれば、Metaは「Anna’s Archiveというサイトを通じて、複数のシャドウライブラリから少なくとも81.7テラバイトのデータ、そのうちZ-LibraryとLibGenから35.7テラバイトのデータをトレントでダウンロードした」とされています。さらに「Metaは以前にもLibGenから80.6テラバイトのデータをトレントでダウンロードしていた」と記載されています。
著者たちの提出書類には「Metaの違法なトレントダウンロードの規模は驚異的である」と述べられており、「Metaが違法にダウンロードした著作物の量のわずか.008パーセントにすぎないデータ海賊行為でも、それが裁判所によって米国検察官事務所に刑事捜査を依頼されるほどの重大な行為である」と指摘されています。
Ars Technicaは、これらのメールがメタ社内の不安をも明らかにしていると指摘しています。2023年4月、研究エンジニアのニコライ・バシリコフは「法人のラップトップからトレントを利用するのは何か違う気がする」と書き、スマイリーの絵文字を加えました。
彼は、メタのIPアドレスを使って「海賊版コンテンツをトレント経由でダウンロードする」ことについて懸念を表明しました。そして2023年の9月には、バシリコフはジョークをやめ、メタの法務チームに相談し、「トレントを使うということはファイルの”シード”(つまり、コンテンツを外部に共有すること)を伴うことになり、これは法的に問題になるかもしれない」と警告しました。
これらの警告にもかかわらず、著者たちはメタが引き続き違法コンテンツをトレント配信し、シード(配信)し続け、さらにはその活動を隠蔽しようとしたと主張しています。
Ars Technicaの報道によれば、内部のメッセージによれば、研究者のフランク・ジャンによると、メタは「誰かがシーダー/ダウンローダーを”追跡”する”リスク”を”避ける”ために、データセットをダウンロードするためにFacebookのサーバーを使用することを避けた」とされています。
メタのエグゼクティブであるマイケル・クラークも、証言の中で設定が「可能な限り最小のシーディングが行われるように」修正されたと認めました。
現在、著者たちは新たな証拠が「以前の証言と矛盾する」と主張し、トレントの決定に関与したメタのスタッフは再度、証言台に立つべきだと主張しています。
例えば、CEOのマーク・ザッカーバーグは、LibGenをAIトレーニングに使用することに関与していないと主張していましたが、非開示のメッセージは、「LibGenを使用するという決定は」、「MZへの事前のエスカレーション」の後になされたことを示唆しています。
Ars Technicaの報道によれば、メタはLibGen上でのAIトレーニングが「公正使用」を構成し、否認したとしています。しかし、トレントに関する新事実がその防御を困難にし、著者たちは直接の著作権侵害の主張を拡大する機会を得ました。
事件が進行するにつれて、Metaは著作権資料の取り扱いについて増大する監視を受けています。著者たちは、彼らが「大規模な違法トレントスキーム」と評していることに対して、このテックジャイアントを責任を問うつもりです。
コメントする
キャンセル