インターネットアーカイブ
インターネットアーカイブ[注 1] (Internet Archive) は、WWW・マルチメディア資料のアーカイブ閲覧サービスとして有名なウェイバックマシン (Wayback Machine)[注 2]を運営しているアメリカの団体である。本部はカリフォルニア州サンフランシスコのリッチモンド地区に置かれている。
![]() | |
URL |
archive |
---|---|
言語 | 英語 |
タイプ | 電子図書館 |
運営者 | ブリュースター・ケール |
営利性 | 非営利 |
開始 | 1996年 |
![](http://upload.wikimedia.org/wikipedia/commons/thumb/c/c4/Internet_Archive_headquarters_exterior_February_2008.jpg/220px-Internet_Archive_headquarters_exterior_February_2008.jpg)
![](http://upload.wikimedia.org/wikipedia/commons/thumb/6/60/Christian_science_church122908_02.jpg/220px-Christian_science_church122908_02.jpg)
設立の理念
編集ウェイバックマシン
編集著作権
編集ウェイバックマシンは米国著作権法のフェアユース規定にもとづいてウェブアーカイブを構築している[7]。後述の「インドからのアクセス遮断」のようにフェアユースに該当するとは思えない情報(営利目的の情報など)の収集も行っているのが実態である。
著作権侵害によるインターネットアーカイブに対する訴訟
編集ウェイバックマシンは目的の性質上、フェアユースが成立しているが、2020年にアシェット、ハーパーコリンズ、ワイリー、ペンギン・ランダムハウスなどの出版社が著作権侵害によりインターネットアーカイブを提訴した[8][9]。
Recall サーチエンジン
編集またInternet Archiveのデータベース的側面としては、現在の特定URLを必要とする形以外のアクセス方法として、2003年9月、Internet Archiveに保存されたウェブページ全体を対象にした検索エンジン「Recall」のベータ版が公開された。検索した単語の頻度をグラフ化して表示する機能があり(2byte文字は未対応)、ネットワーク上の流行調査などに有益なものだったが、2004年9月中旬に停止した。これは「Recall」の開発者であったAnna Pattersonがプロジェクトから離れたためである。Internet Archiveのフォーラムでは新たな検索システムの構築を望む声が多くあがっており、動向が注目される。
アプリケーションプログラミングインタフェース
編集ウェイバックマシンはWebブラウザを使ったウェブアーカイブの閲覧だけでなく、アプリケーションプログラミングインタフェースも提供している[10]。2015年時点では、
- Wayback Availability JSON API
- Memento API
- Wayback CDX Server API
がある。
コレクション
編集オープンライブラリ
編集インターネットアーカイブはオープン・ライブラリの運営も行っている。ここではいくつかのスキャンしたパブリックドメイン書籍が容易に閲覧、印刷ができる形式で入手可能である。
動画像コレクション
編集- 『戦艦ポチョムキン』
- 『国民の創生』
- 『M』
- 『散り行く花』
- 『ヒズ・ガール・フライデー』
- 『愛のアルバム』
- 『復活の日』
- 『ナイト・オブ・ザ・リビングデッド』
- 『吸血鬼ノスフェラトゥ』
- 『プラン9・フロム・アウタースペース』
- 『リーファー・マッドネス』
- 『三十九夜』
- 『スタア誕生』
- 『ジェーン・エア』 Jane Eyre
en:Special:WhatLinksHere/Template:Internet_Archive_film (英語)を参照。
論争
編集サイエントロジーサイト
編集2002年後半に、インターネットアーカイブはサイエントロジーの批判サイトをいくつもウェイバックマシンから削除した[12]。ウェイバックマシンのエラーメッセージには、この削除は「サイトオーナーの要望による」との文言が載せられていたが[13]、後に明らかになったところによればサイエントロジー教会の弁護士が削除を要求したものであった。この削除要求の法的根拠は不明であり、実際のサイトオーナー自身が削除を要求したものではなかった[14]。
アーカイブ内のウェブページの証拠能力
編集グレイトフル・デッド
編集インドからのアクセス遮断
編集画像外部リンク | |
---|---|
[1] - インドの携帯電話通信会社であるバーティ・エアテルからインターネットアーカイブにアクセスしたときの画面。「あなたのリクエストしたURLは、インド政府の電気通信局からの命令に基づきブロックされています」と書かれている。 |
ホスティング環境
編集対応ブラウザ
編集閲覧するウェブブラウザについて、2019年8月頃からInternet Explorerで保存一覧を見ることができなくなっている。Google Chromeでは従来通り閲覧可能。
脚注
編集注釈
編集出典
編集関連項目
編集- Archive Team
- Heritrix - Internet Archiveのクローラ。
- リンク切れ(デッドリンク、死にリンク)
- クローラ(ロボット)
- 電子図書館
- デジタルアーカイブ - 実際のものを電子的に保存すること。
- ウェブ魚拓
- archive.is
外部リンク
編集- 公式ウェブサイト (英語)
- Internet Archive: Wayback Machine (英語)
- Internet Archive: Projects (英語)
- 公式ブログ (英語)
- Internet Archive Mirror (英語) - 新アレクサンドリア図書館にあるインターネットアーカイブ。
- Internet Archive “Wayback Machine” - ともに国際インターネット保存コンソーシアムに加盟している国立国会図書館による紹介。