以下の文章は、電子フロンティア財団の「Blocking the Internet Archive Won’t Stop AI, But It Will Erase the Web’s Historical Record」という記事を翻訳したものである。
ある新聞社が、図書館に対して自社の紙面のコピー保存を一切禁じると宣言したとしよう。
ここ数ヶ月、それに等しいことがオンライン上で起きている。世界最大のデジタル図書館であるInternet Archiveは、1990年代半ばに開設されて以来、新聞を保存し続けてきた。ウェブを保存し、公衆がアクセスできるようにすること――それがArchiveの使命だ。その一環として運営されているWayback Machineには、現在1兆を超えるウェブページのアーカイブが収録されており、ジャーナリスト、研究者、そして裁判所が日々活用している。
しかし近月、The New York Times紙がウェブの慣習的なrobots.txtルールを超える技術的手段を用いて、ArchiveによるWebクローリングの遮断を開始した。これにより、歴史家やジャーナリストが数十年にわたって依拠してきた記録が途絶える恐れがある。The Guardianをはじめ、他の新聞社も同様の動きを見せている。
約30年にわたり、歴史家、ジャーナリスト、そして一般市民はInternet Archiveを頼りに、ニュースサイトがオンライン上でどのように掲載されていたかを確認してきた。アーカイブされたページは、記事がどのように最初に公開されたかを示す唯一の信頼できる記録であることが少なくない。多くの場合、記事は編集され、書き換えられ、あるいは削除される――それが公然と行われることもあれば、密かに行われることもある。そして、そうした変更を確認できる唯一の手がかりが、しばしばInternet Archiveなのだ。大手メディアがArchiveのクローラーを遮断すれば、その歴史的記録は自ずと消えていく。
Times紙は、AI企業によるニュースコンテンツのスクレイピングへの懸念がこの措置の背景にあると説明している。メディア各社は自社コンテンツの利用方法に対するコントロールを求めており、Times紙を含む複数の社が、著作権で保護されたコンテンツによるモデル訓練が法律に違反するかどうかをめぐってAI企業を提訴している。こうした訓練はフェアユースにあたるという主張には十分な根拠がある。
しかし、訴訟の結果がどうなろうと、非営利のアーカイブ機関を遮断するのは見当違いな対応だ。Internet Archiveのような組織は商業的なAIシステムを構築しているわけではない。我々の歴史の記録を保存しているのだ。AIのアクセスをコントロールしようとする試みの中でそのアーカイブ機能を停止することは、Archiveのような図書館が始めたわけでも望んだわけでもない争いのために、数十年分の歴史的記録を実質的に焼き捨てることになりかねない。
メディアがArchiveを締め出すとき、それはボットを制限しているのではない。歴史的記録そのものを消去しているのだ。
アーカイブと検索は合法である
素材を検索可能にすることは、確立されたフェアユースである。検索可能なインデックスを構築するには素材そのもののコピーが不可欠な場合が多いと、裁判所は長年にわたって認めてきた。Googleが検索可能なデータベースを作るために書籍全体をコピーした際、裁判所がそれを明白なフェアユースと正しく認定したのはそのためだ。そのコピーは変容的な目的――創作物の発見・研究・新たな知見の創出――を果たすものだったからである。
Internet Archiveも同じ原則の上に成り立っている。物理的な図書館が将来の読者のために新聞を保存するのと同様、Archiveはウェブの歴史的記録を保存する。研究者やジャーナリストは毎日そこに頼っている。Archiveのスタッフによれば、Wikipediaだけで、Archiveに保存された260万件を超えるニュース記事――249言語にわたる――にリンクを張っているという。そしてそれは一例に過ぎない。無数のブロガー、研究者、記者が、オンラインで公開されたものの安定した、権威ある記録としてArchiveを活用している。
検索エンジンを守るのと同じ法的原則は、アーカイブや図書館をも守らなければならない。AI訓練に対して裁判所が一定の制限を設けるとしても、検索とウェブアーカイビングを保護する法律はすでに確立されている。
Internet Archiveはほぼ30年にわたってウェブの歴史的記録を守り続けてきた。大手メディアがその使命を阻むようになれば、将来の研究者はその記録の大部分が単純に消失していることに気づくだろう。AIの学習をめぐって、法廷で決着をつけるべき真の争点があることは確かだ。しかし、そうした戦いのために公的記録を犠牲にするなら、それは深刻で、しかもおそらくは取り返しのつかない過ちとなる。
Blocking the Internet Archive Won’t Stop AI, But It Will Erase the Web’s Historical Record | Electronic Frontier Foundation
Author: Joe Mullin / EFF (CC BY 3.0 US)
Publication Date: March 16, 2026
Translation: heatwave_p2p