
Image by Bernard Goldbach, from Flickr
デジタルアーキビストたちは、公共データが消失するのを防ぐために活動しています
30年以上にわたり、インターネットアーカイブのウェイバックマシンは、研究に不可欠な政府のウェブサイトやデータセットを保存し続けてきました。これについては、Spectrumによる新しい報告書で詳しく説明されています。
急いでいる方のために、ここに要点をまとめています:
- ウェイバックマシンは、科学や工学の研究に不可欠な資料となる重要な政府データを保管しています。
- トランプの第二期大統領任期中には、8,000以上の政府のウェブページやデータベースが公開アクセスから消えました。
- ハーバード大学のライブラリーイノベーションラボは、Data.govのコレクションの一部であった311,000のデータセットを成功裏に保存しました。
NASAや全米科学基金などの機関から得られるこれらの記録は、科学者やエンジニアにとって不可欠なデータを提供します。これらが消えてしまうと、研究の信頼性や歴史的な正確性が危険にさらされる可能性があります。これは、Spectrumが指摘している通りです。
政府によるデータの削除は新しい現象ではありません。9/11以降、ブッシュ政権はセキュリティ上の理由から何百万バイトもの情報を削除しました。オバマ政権は異なるアプローチを取り、2009年にData.govを立ち上げ、公開情報を拡大することにしました。これについてはSpectrumが報じています。
トランプの第一期目では、環境データ&ガバナンスイニシアティブの研究者たちが、一部の政府のウェブサイトにアクセスできないこと、また”気候変動”に関する言及が複数のページから消去されていることを発見しました。これについてもSpectrumが述べています。
トランプの2期目中、データ保存に関する懸念が高まっています。2月には、ニューヨークタイムズが8,000以上の政府のウェブページやデータベースが削除されたと報じました。
その後、一部は再現されましたが、Gristは「気候変動」や「クリーンエネルギー」などの用語の削除を含む変更を発見しました。2月11日には法的な異議申し立てが続き、Spectrumによれば、連邦裁判所の判事が特定のCDCとFDAのデータセットの復元を命じました。
この損失に対抗するため、デジタルアーキビストたちは行動を起こしています。ハーバード・ロー・スクールのライブラリー・イノベーション・ラボは、Data.govの全16テラバイトのアーカイブ—311,000以上のデータセットを含む—をコピーしました。彼らはAPIを通じた自動化されたクエリを使用して、それを毎日更新しています。
アーキビストは、将来の世代のために歴史的記録を保持することにより、知識を保護する重要な役割を果たしています。彼らの不在による重要な情報の損失は、公的記録の書き換えをもたらし、それにより将来の研究の可能性が制限される結果をもたらします。
コメントする
キャンセル