何のための “インターネットアーカイブ” なんだ? と、深読みしたくなるな。

Wayback Machine というサービス

インターネットアーカイブとは、

インターネットアーカイブ(Internet Archive) は、WWW・マルチメディア資料のアーカイブ閲覧サービスとして有名なウェイバックマシン (Wayback Machine)を運営している団体である。 本部はカリフォルニア州サンフランシスコのリッチモンド地区に置かれている。 アーカイブにはプログラムが自動で、または利用者が手動で収集したウェブページのコピー(ウェブアーカイブ)が混在しており、これは「WWWのスナップショット」と呼ばれる。 (by Wiki)

つまり、この Wayback Machine は、世界中にわんさかあるウェブサイトの情報を、自動あるいは手動でせっせと集めて、無料で公開しているっちゅうことなんだな。
なぜ、そんなことをしているかというと、国立国会図書館 (日本)の説明では、

インターネットアーカイブはなぜデジタル情報を集めているのでしょう。それはデジタル形式で保存された歴史資料を、研究者や歴史学者ひいては全世界の人々が将来にわたって利用できるようインターネット上に図書館を作るためです。

だそうな。

国立国会図書館 インターネット資料収集保存事業

まぁ、とにかくすんげぇ量の情報を収集しているのらしい。国立国会図書館によると、40ペタバイト以上のデータ量(2019年2月現在)なんだそう。もうすでに単位がわからん。ペタ? 某やきそばのカップ麺でしか見たことがない。

この Wayback Machine のサービスはほんとうにすごいと思っていた。今はもう無いサイトも閲覧できる可能性があるから。
たとえば、わたしが昔、運営していた『ぷぅぷぅ村のくす玉工房』(←なつかしい!!)。

このサイトもしっかりアーカイブされている。

Wayback Machine が保存した 『ぷぅぷぅ村のくす玉工房』 (2009年10月10日バージョン)

多少、レイアウトが崩れて、画像が無いとはいえ、初めて見たときは、おおおおおおーっ!!! すげーーー!!!! って、すんごい感動した。

ジョセフ・メルコラ博士のサイト

だから、ジョセフ・メルコラ博士のサイトが消えるって、とあるサイト(In Deep)の情報で知った時、

普通の公開サイトだから、たぶん、大丈夫。インターネットアーカイブがある。

なんて、軽く思ったんだ。
でも、実際、検索をかけてみると、

Sorry.
This URL has been excluded from the Wayback Machine.

(このURLは Wayback Machine から除外されています。)

今まで、見たことも無い結果だった。
なんか、ぞわぞわぞわーって、した。

…まじか…。

何のための”インターネットアーカイブ”なんだ??

COVID-19 関連で、たくさんの”重要な情報”が消されて行っているらしい。もし、それらのほとんどの情報が Wayback Machine で検索できないようなら(わたしはジョセフ・メルコラ博士のサイトしか試してない)、何のための 『インターネットアーカイブ』 なんだろ。と真剣に思う。

アメリカの団体じゃん。ま、想定内だろ。

って、言う人もあるかもしれないけど…。

2021年8月7日 追記

Wayback Machine はすべてのサイトの情報を保存するわけじゃありまへん。認証をかけられたシークレットサイトとか、リンクをたどれないページは保存されません。

また、Wayback Machine がサイトの情報を保存する間隔は結構長い(数ヶ月単位)なので、一瞬で消えてしまったページは、保存されていない確率の方が高いです。
消えるかもしれない可能性のあるページで、保存しておきたいページは手動で保存することもできます。

Wayback Machine の使い方

日本の国立国会図書館では、Wayback Machine の詳しい使い方を紹介している。

Internet Archive “Wayback Machine” | 国立国会図書館 インターネット資料収集保存事業

そのほか、いろいろな国のウェブアーカイブ情報をリンクしている。

世界のウェブアーカイブ | 国立国会図書館 インターネット資料収集保存事業

  • Add this entry to Hatena Bookmark

Follow Me