インターネットアーカイブ

WWW・マルチメディア資料のアーカイブ閲覧サービスとして有名なウェイバックマシンを運営している団体
Internet Archiveから転送)

インターネットアーカイブ[注 1] (Internet Archive) は、WWWマルチメディア資料のアーカイブ閲覧サービスとして有名なウェイバックマシン (Wayback Machine)[注 2]を運営しているアメリカ団体である。本部はカリフォルニア州サンフランシスコのリッチモンド地区に置かれている。

インターネットアーカイブ
Internet Archive
URL archive.org ウィキデータを編集
言語 英語
タイプ 電子図書館
運営者 ブリュースター・ケール
営利性 非営利
開始 1996年 (1996)
旧インターネットアーカイブ本部(1996年 - 2009年11月)
新インターネットアーカイブ本部(2009年11月 - )

WWW

設立の理念

編集

1996使:

使  


ウェイバックマシン

編集
 
インターネットアーカイブ (新アレクサンドリア図書館

 (Wayback Machine)[2]使Web使使Save PageURL3

19962010WebWeb2013Save Page

200110020041202003121201210[3][3]2022107400[5]140[5][6]

HTML2010WebWebWebWebHTML1Webrobots.txt

 (WABAC machine)使

WebBlogWeb MagazineWeb Web

著作権

編集

ウェイバックマシンは米国著作権法フェアユース規定にもとづいてウェブアーカイブを構築している[7]。後述の「インドからのアクセス遮断」のようにフェアユースに該当するとは思えない情報(営利目的の情報など)の収集も行っているのが実態である。

著作権侵害によるインターネットアーカイブに対する訴訟

編集

ウェイバックマシンは目的の性質上、フェアユースが成立しているが、2020年にアシェット、ハーパーコリンズ、ワイリー、ペンギン・ランダムハウスなどの出版社が著作権侵害によりインターネットアーカイブを提訴した[8][9]

Recall サーチエンジン

編集

またInternet Archiveのデータベース的側面としては、現在の特定URLを必要とする形以外のアクセス方法として、2003年9月、Internet Archiveに保存されたウェブページ全体を対象にした検索エンジン「Recall」のベータ版が公開された。検索した単語の頻度をグラフ化して表示する機能があり(2byte文字は未対応)、ネットワーク上の流行調査などに有益なものだったが、2004年9月中旬に停止した。これは「Recall」の開発者であったAnna Pattersonがプロジェクトから離れたためである。Internet Archiveのフォーラムでは新たな検索システムの構築を望む声が多くあがっており、動向が注目される。

アプリケーションプログラミングインタフェース

編集

ウェイバックマシンはWebブラウザを使ったウェブアーカイブの閲覧だけでなく、アプリケーションプログラミングインタフェースも提供している[10]。2015年時点では、

  • Wayback Availability JSON API
  • Memento API
  • Wayback CDX Server API

がある。

コレクション

編集

311fugazi

202011, Adobe FlashRuffleFlash[11]

オープンライブラリ

編集

インターネットアーカイブはオープン・ライブラリの運営も行っている。ここではいくつかのスキャンしたパブリックドメイン書籍が容易に閲覧、印刷ができる形式で入手可能である。

動画像コレクション

編集



Skip ElsheimerA/V Geek

Election 2004 20042004Independent NewsWorld At War competition from 20012004

1,500:

en:Special:WhatLinksHere/Template:Internet_Archive_film (英語)を参照。

論争

編集

サイエントロジーサイト

編集

2002年後半に、インターネットアーカイブはサイエントロジーの批判サイトをいくつもウェイバックマシンから削除した[12]。ウェイバックマシンのエラーメッセージには、この削除は「サイトオーナーの要望による」との文言が載せられていたが[13]、後に明らかになったところによればサイエントロジー教会の弁護士が削除を要求したものであった。この削除要求の法的根拠は不明であり、実際のサイトオーナー自身が削除を要求したものではなかった[14]

アーカイブ内のウェブページの証拠能力

編集

200410SA  使TVP (TVP Polonia) 退[15]

グレイトフル・デッド

編集

2005113[16]20051130[17]:

Archive.org

1130稿[18]

インドからのアクセス遮断

編集
画像外部リンク
  [1] - インドの携帯電話通信会社であるバーティ・エアテルからインターネットアーカイブにアクセスしたときの画面。「あなたのリクエストしたURLは、インド政府の電気通信局からの命令に基づきブロックされています」と書かれている。

20178[19]22,500[19]82[19][20]

ホスティング環境

編集

2009HDD4800Linux2009Sun Fire X4500 63OSSolaris1011HDD483ZFSSun Modular Datacenter使[21]PetaboxLinuxPetabox[22]3

対応ブラウザ

編集

閲覧するウェブブラウザについて、2019年8月頃からInternet Explorerで保存一覧を見ることができなくなっている。Google Chromeでは従来通り閲覧可能。

脚注

編集

注釈

編集


(一)^ Internet ArchiveInternet Archive "Internet Archive" [1][2]

(二)^ ab使Wayback Machine[1]

(三)^ HTMLPDF[4]

出典

編集


(一)^ abInternet Archive Wayback Machine. .  (20161122). 201789

(二)^ International Internet Preservation Consortium (IIPC). .  (2013129). 201789

(三)^ 10,000,000,000,000,000 bytes archived!. Internet Archive Blogs. Internet Archive. 2019110

(四)^ Defining Web pages, Web sites and Web captures. Internet Archive Blogs. Internet Archive (20161023). 2023916

(五)^ abWayback Machine. web.archive.org (2022101). 20221018 Explore more than 742 billion web pages saved over time ( 7,420  Web )

(六)^ Wayback Machine. web.archive.org (202291). 20221018 Explore more than 728 billion web pages saved over time ( 7,280  Web )

(七)^ Internet Archive Wayback Machine. .  (20161122). 20179242017924

(八)^ Internet Archive - Engadget . Engadget JP. 2020622022127

(九)^  (202064). Internet ArchiveWatch. INTERNET Watch. 2022127

(十)^ Wayback Machine APIs. Internet Archive. 2019110

(11)^ Campbell, Ian Carlos (20201119). The Internet Archive is now preserving Flash games and animations. The Verge. 2020112020201119

(12)^ Net archive silences Scientology critic - CNET News. CBS Interactive.. 20127162019110

(13)^ Internet Archive Forums: exclusions from the Wayback Machine. Internet Archive. 2019110

(14)^ LawMeme - Sherman, Set the Wayback Machine for Scientology. Yale University. 20064242019110

(15)^ Gelman, Lauren (20041117). Internet Archives Web Page Snapshots Held Admissible as Evidence (). The Center for Internet and Society. 20221220

(16)^ Wrath of Deadheads stalls Web crackdown,  []

(17)^ Phil Lesh. PhilLesh.net - Hotline. 20122202019110

(18)^ Internet Archive Forums: Good News and an Apology: GD on the Internet Archive. Internet Archive. 2019110

(19)^ abcLeo Kelion (201789). Bollywood blocks the Internet Archive. BBC News (BBC). http://www.bbc.com/news/technology-40875528 2017924 

(20)^ The 'Internet Archive' was blocked on orders from Madras High Court. tech2 (Firstpost). (2017811). http://www.firstpost.com/tech/news-analysis/the-internet-archive-was-blocked-on-orders-from-madras-high-court-archive-questions-the-order-3919991.html 2017924 

(21)^ Sun puts Internet Archive in a box, but will it stay there?. Ars Technica. 2019110

(22)^ Internet Archive: Petabox. Internet Archive. 2019110

関連項目

編集

外部リンク

編集