ウェイバックマシン

出典: フリー百科事典『ウィキペディア(Wikipedia)』
ウェイバックマシン
Wayback Machine

スクリーンショット

URL web.archive.org ウィキデータを編集
言語 英語
タイプ アーカイブ
事業地域 世界中(中国とロシアを除く)
運営者 Internet Archive
登録 任意
開始 2001年10月24日 (22年前) (2001-10-24)[1][2]
現在の状態 運営中
プログラミング言語 Java, Python

Wayback MachineWorld Wide Web2001

[]


2001[3]three dimensional index[4][5]

Wayback Machine使WABACWABAC[6][7]1Peabody's Improbable HistoryWABAC使

51996 19962001[8]52001[9]10[10]

Linux[5][11]URL

[]


World Wide WebGopherUsenet[12]2005Archive-It.org[13]

[11]P[11]2010Worldwide Web Crawls[14][11]

[11]Worldwide Web Crawls[11]Wide Crawl Number 132015192016711[15][11]

[]


2200312TB( )PetaBox100TB20046[16][17]

2009Sun Open StorageSun Modular Datacenter[18]20093PB(3000TB)100TB(0.1PB)( )[19]

2011[20]320102008[21]20116PetaBox700TB(0.7PB)[22]

20131URL2,400[23]10URLSave a Page[24][25][26]

2014124,3509PB20TB(0.02PB)[10][27][28]

2016715PB[29]

2018925PB[30][31]

20201270PB[32]

202338000[33]

[]


20131020153163[34]208[35]

202287200

20231
ウェイバックマシンの成長[36][37]
ウェイバックマシンの年別 アーカイブページ数
2005

40,000,000,000
2008

85,000,000,000
2012

150,000,000,000
2013

373,000,000,000
2014

400,000,000,000
2015

452,000,000,000
2016

459,000,000,000
2017

279,000,000,000
2018

310,000,000,000
2019

345,000,000,000
2020

405,000,000,000
2021

514,000,000,000
2022

640,000,000,000

ウェブサイト除外規定[編集]


Robots Exclusion Standard (robots.txt)robots.txt使robots.txt[38][39][40]

Oakland Archive[]


Wayback2002Recommendations for Managing Removal Requests and Preserving Archival Integrity[41]Wayback[42]

2017Waybackrobots.txt20174robots.txt[43][44][45][46]

[]


200120133501990[10]

[47]

使[48]2014稿稿稿[48][49]2017Archive.orgreddit[50][51][52]

[]


20146[53]2018310[54]URL[55]

FlashJavaScriptHTML[56][55][14]

robots.txt[56]

[]

[]

Netbula LLC v. Chordiant Software Inc.[]

2009Netbula, LLC v. Chordiant Software Inc.ChordiantNetbulaNetbularobots.txtChordiant[57]

Netbula[58]Chordiant[57]

Netbula退ChordiantNetbularobots.txt[57]
[]

200410Telewizja Polska USA, Inc. v. Echostar Satellite, No. 02 C 3293, 65 Fed. R. Evid. Serv. 673 (N.D. Ill. October 15, 2004)Telewizja PolskaTVPTelewizja PolskaTelewizja PolskaTelewizja Polska退TVP[59][60]

特許法[編集]


[61]

[]


RESTful[62]

[]


[63]FAQ[64]

[]


Wayback Machine 

サイエントロジー[編集]


2002 [65][66] (en) [67]

Healthcare Advocates, Inc.[]


2003Harding Earley Follmer & FraileyHealthcare AdvocatesHealthcare Advocatesrobots.txt[68][69]

[]


20051219992004 profane-justice.org 10[70][71]2006120[72]2007213退[71]退[73]

2007425[70][74]

[]


Archive.org[75][76]HTTPS2015[77][78][48]

Library Freedom Project[48]

[79][80]

[81]

[82][83]

類似サービス[編集]

脚注[編集]



(一)^ WayBackMachine.org WHOIS, DNS, & Domain Info  DomainTools. WHOIS. 20205142016313

(二)^ InternetArchive.org WHOIS, DNS, & Domain Info  DomainTools. WHOIS. 20205122016313

(三)^ Notess, Greg R. (MarchApril 2002). The Wayback Machine: The Web's Archive. Online 26: 5961. 

(四)^ The Wayback Machine, Frequently Asked Questions, September 18, 2018, https://web.archive.org/web/20180918131957/https://archive.org/about/faqs.php#The_Wayback_Machine 2018918 

(五)^ ab"20,000 Hard Drives on a Mission | Internet Archive Blogs". blog.archive.org (). 2018102020181015

(六)^ Green, Heather (2002228). A Library as Big as the World. BusinessWeek. 20111220. https://web.archive.org/web/20111220074306/http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm 

(七)^ Tong, Judy (200298). Responsible Party  Brewster Kahle; A Library Of the Web, On the Web. New York Times. 2011220. https://web.archive.org/web/20110220181725/http://www.nytimes.com/2002/09/08/business/responsible-party-brewster-kahle-a-library-of-the-web-on-the-web.html 2011815 

(八)^ Cook, John (2001111). Web site takes you way back in Internet history. Seattle Post-Intelligencer. 2014812. https://web.archive.org/web/20140812205508/http://www.seattlepi.com/news/article/Web-site-takes-you-way-back-in-Internet-history-1070534.php 2011815 

(九)^ Wayback Goes Way Back on Web. Wired. (October 28, 2001). October 16, 2017. https://web.archive.org/web/20171016225914/https://www.wired.com/2001/10/wayback-goes-way-back-on-web/ 20171016. 

(十)^ abcArora, Sanjay K.; Li, Yin; Youtie, Jan; Shapira, Philip (May 5, 2015). Using the wayback machine to mine websites in the social sciences: A methodological resource (). Journal of the Association for Information Science and Technology 67 (8): 19041915. doi:10.1002/asi.23503. ISSN 2330-1635. 

(11)^ abcdefgKalev Leetaru (28 January 2016). "The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web". Forbes. 2017101620171016

(12)^ Kahle, Brewster. "Archiving the Internet". Scientific American  March 1997 Issue. 2012432011819

(13)^ Jeff Kaplan (27 October 2014). "Archive-It: Crawling the Web Together". Internet Archive Blogs. 2017101220171016

(14)^ ab"Worldwide Web Crawls". Internet Archive. 2017101920171016

(15)^ "Wide Crawl Number 13". Internet Archive. 2017101920171016

(16)^ "Internet Archive: Petabox". archive.org (). 20181025

(17)^ Kanellos, Michael (2005729). Big storage on the cheap. CNET News.com. 200743. https://web.archive.org/web/20070403030705/http://news.zdnet.com/2100-9584_22-5808754.html 2007729 

(18)^ "Internet Archive and Sun Microsystems Create Living History of the Internet". . 25 March 2009. 20093262009327

(19)^ Mearian, Lucas (2009319). Internet Archive to unveil massive Wayback Machine data center. Computerworld.com. 2009323. https://web.archive.org/web/20090323093002/http://www.computerworld.com/action/article.do?command=viewArticleBasic&taxonomyName=hardware&articleId=9130081&taxonomyId=12&intsrc=kc_top 2009322 

(20)^ "Updated Wayback Machine in Beta Testing". Archive.org. 20118232011819

(21)^ "Beta Wayback Machine, in forum". Archive.org. 20144172014416

(22)^ "Internet Archive Forums: 6th pair of racks go into service: over 2PB of data space used". archive.org (). 2016102420181025

(23)^ "Wayback Machine: Now with 240,000,000,000 URLs | Internet Archive Blogs". Blog.archive.org. 9 January 2013. 20144142014416

(24)^ Rossi, Alexis (25 October 2013). "Fixing Broken Links on the Internet". archive.org. San Francisco, CA, US: Collections Team, the Internet Archive. 20141172015325We have added the ability to archive a page instantly and get back a permanent URL for that page in the Wayback Machine. This service allows anyone  wikipedia editors, scholars, legal professionals, students, or home cooks like me  to create a stable URL to cite, share or bookmark any information they want to still have access to in the future.

(25)^ The VirusTotal Team (25 March 2015). "207.241.226.190 IP address information". virustotal.com. Dublin 2, Ireland: VirusTotal. 201471420153252015-03-25: Latest URLs hosted in this IP address detected by at least one URL scanner or malicious URL dataset. ... 2/62 2015-03-25 16:14:12 [complete URL redacted]/Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [complete URL redacted]/CBLightSetup.exe

(26)^ Advisory provided by Google (25 March 2015). "Safe Browsing Diagnostic page for archive.org". google.com/safebrowsing. Mountain View, CA, US: Google. 20154620153252015-03-25: Part of this site was listed for suspicious activity 138 time(s) over the past 90 days. ... What happened when Google visited this site? ... Of the 42410 pages we tested on the site over the past 90 days, 450 page(s) resulted in malicious software being downloaded and installed without user consent. The last time Google visited this site was on 2015-03-25, and the last time suspicious content was found on this site was on 2015-03-25. ... Malicious software includes 169 trojan(s), 126 virus, 43 backdoor(s).

(27)^ "Internet Archive Frequently Asked Questions". 200910212015117

(28)^ "Internet Archive Frequently Asked Questions". 18 December 2014. 2014121820181213

(29)^ "Can the manipulation of big data change the way the world thinks?". The National. 20171122017514

(30)^ Crockett, Zachary (2018928). Inside Wayback Machine, the internets time capsule (). The Hustle. 2018102. https://web.archive.org/web/20181002145800/https://thehustle.co/inside-wayback-machine-internet-archive 20181026 

(31)^ Heffernan, Virginia (2018918). Things Break and Decay on the InternetThat's a Good Thing (). WIRED. 2018925. https://web.archive.org/web/20180925130510/https://www.wired.com/story/wired25-virginia-heffernan-internet-archive-wayback-machine/ 20181026 

(32)^ Donate to the Internet Archive: Digital Library of Free & Borrowable Books, Movies, Music & Wayback Machine ().  adafruit. 20201222020122

(33)^ Wayback Machine. web.archive.org. 202334

(34)^ "Archive.org Site Info". Alexa Internet. 2013102820131029

(35)^ "Archive.org Site Overview". Alexa Internet. 201549201549

(36)^ michelle (9 May 2014). "Wayback Machine Hits 400,000,000,000!". Internet Archive. 20148262015325

(37)^ "web.archive.org 2015213". Internet Archive. 20152132015325

(38)^ Some sites are not available because of Robots.txt or other exclusions Archived April 15, 2011, at the Wayback Machine.

(39)^ How can I remove my site's pages from the Wayback Machine? Archived April 17, 2014, at the Wayback Machine.

(40)^ Cox, Joseph (2018522). The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers. 2018523. https://archive.is/20180522192132/https://motherboard.vice.com/en_us/article/nekzzq/wayback-machine-deleting-evidence-flexispy 2018523 

(41)^ "Recommendations for Managing Removal Requests And Preserving Archival Integrity". University of California. 14 December 2002. 20179182017914

(42)^ "Retroactive robots.txt removal of past crawls AKA Oakland Archive Policy". Internet Archive. 7 July 2014. 201710102017914

(43)^ Mark Graham (17 April 2017). "Robots.txt meant for search engines don't work well for web archives". Internet Archive Blogs. 20174172017416

(44)^ "Archivierung des Internets: Internet Archive ignoriert künftig robots.txt" (). heise online. 20174272017514

(45)^ "Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren  Golem.de" (). 20176192017514

(46)^ "Internet Archive will ignore robots.txt files to keep historical record accurate". Digital Trends. 24 April 2017. 20175162017514

(47)^ Sampath Kumar, B.T.; Prithviraj, K.R. (October 21, 2014). Bringing life to dead: Role of Wayback Machine in retrieving vanished URLs (). Journal of Information Science 41 (1): 7181. doi:10.1177/0165551514552752. ISSN 0165-5515. 

(48)^ abcd"Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed". 2017162017514

(49)^ "What the Web Said Yesterday". The New Yorker. 20151252017514

(50)^ "The March for Science began with this person's 'throwaway line' on Reddit". Washington Post. 20174232017423

(51)^ "Are scientists going to march on Washington?". The Washington Post. 20171312017131

(52)^ Foley, Katherine Ellen. "The global March for Science started with a single Reddit thread". Quartz. 20174242017423

(53)^ "Internet Archive Frequently Asked Questions". Internet Archive. 2 April 2014. 20144220181123

(54)^ "Internet Archive Frequently Asked Questions". archive.org (). 20181123

(55)^ abBates, Mary Ellen (2002). The Wayback Machine. Online 26: 80. 

(56)^ ab"Internet Archive Frequently Asked Questions". archive.org (). 201342020181018

(57)^ abcLloyd, Howard (October 2009). "Order to Disable Robots.txt" (PDF). 2011513 (PDF)20091015

(58)^ Cortes, Antonio (October 2009). "Motion Opposing Removal of Robots.txt". 2010102720091015

(59)^ Gelman, Lauren (17 November 2004). "Internet Archive's Web Page Snapshots Held Admissible as Evidence". Packets. 2(3). 2011430200714

(60)^ Howell, Beryl A. (February 2006). "Proving Web History: How to use the Internet Archive" (PDF). Journal of Internet Law: 39. 201075 (PDF)200886

(61)^ Wynn W. Coggins (Fall 2002). "Prior Art in the Field of Business Method Patents  When is an Electronic Document a Printed Publication for Prior Art Purposes?". USPTO. 20129212020720

(62)^ "Debunking the Wayback Machine". 20106292020720

(63)^ Bahr, Martin (2002). "The Wayback Machine und Google Cache - eine Verletzung deutschen Urheberrechts?". JurPC (). doi:10.7328/jurpcb/20021719. 20098232020720

(64)^ "Internet Archive FAQ". Archive.org. 20144172014416

(65)^ Bowman, Lisa M (2002924). Net archive silences Scientology critic. CNET News.com. 2012515. https://web.archive.org/web/20120515210932/http://news.cnet.com/2100-1023-959236.html 200714 

(66)^ Jeff (23 September 2002). "exclusions from the Wayback Machine" (Blog). Wayback Machine Forum. Internet Archive. 2007211200714 Author and Date indicate initiation of forum thread.

(67)^ Miller, Ernest. "Sherman, Set the Wayback Machine for Scientology". LawMeme. Yale Law School. 20121116 (Blog)200714

(68)^ Dye, Jessica (2005). Website Sued for Controversial Trip into Internet Past. EContent. 28 (11): 89. 

(69)^ Bangeman, Eric (August 31, 2006). Internet Archive Settles Suit Over Wayback Machine. Ars technica. November 5, 2007. https://web.archive.org/web/20071105205430/http://arstechnica.com/news.ars/post/20060831-7634.html 20071129. 

(70)^ abInternet Archive v. Shell, 505 F.Supp.2d 755 at justia.com, 1:2006cv01726 (Colorado District Court August 31, 2006) ('April 25, 2007 Settlement agreement announced.' Filing 65, 2007-04-30: '...therefore ORDERED that this matter shall be DISMISSED WITH PREJUDICE...'). 

(71)^ abBabcock, Lewis T., Chief Judge (13 February 2007). "Internet Archive v. Shell Civil Action No. 06cv01726LTBCBS" (PDF). 2014125 (PDF)20153251) Internet Archive's motion to dismiss Shell's counterclaim for conversion and civil theft (Second Cause of Action) is GRANTED, 2) Internet Archive's motion to dismiss Shell's counterclaim for breach of contract (Third Cause of Action) is DENIED; 3) Internet Archive's motion to dismiss Shell's counterclaim for Racketeering under RICO and COCCA (Fourth Cause of Action) is GRANTED.

(72)^ Claburn, Thomas (2007316). Colorado Woman Sues To Hold Web Crawlers To Contracts. New York, NY, US: InformationWeek, UBM Tech, UBM LLC. 201494. https://web.archive.org/web/20140904170742/http://www.informationweek.com/colorado-woman-sues-to-hold-web-crawlers-to-contracts/d/d-id/1053075 2015325. "Computers can enter into contracts on behalf of people. The Uniform Electronic Transactions Act (UETA) says that a 'contract may be formed by the interaction of electronic agents of the parties, even if no individual was aware of or reviewed the electronic agents' actions or the resulting terms and agreements.'" 

(73)^ Samson, Martin H., Phillips Nizer LLP (2007). "Internet Archive v. Suzanne Shell". internetlibrary.com. Internet Library of Law and Court Decisions. 2014832015325More importantly, held the court, Internet Archive's mere copying of Shell's site, and display thereof in its database, did not constitute the requisite exercise of dominion and control over defendant's property. Importantly, noted the court, the defendant at all times owned and operated her own site. Said the Court: 'Shell has failed to allege facts showing that Internet Archive exercised dominion or control over her website, since Shell's complaint states explicitly that she continued to own and operate the website while it was archived on the Wayback machine. Shell identifies no authority supporting the notion that copying documents is by itself enough of a deprivation of use to support conversion. Conversely, numerous circuits have determined that it is not.'

(74)^ brewster (25 April 2007). "Internet Archive and Suzanne Shell Settle Lawsuit". archive.org. Denver, CO, USA: Internet Archive. 20101252015325Both parties sincerely regret any turmoil that the lawsuit may have caused for the other. Neither Internet Archive nor Ms Shell condones any conduct which may have caused harm to either party arising out of the public attention to this lawsuit. The parties have not engaged in such conduct and request that the public response to the amicable resolution of this litigation be consistent with their wishes that no further harm or turmoil be caused to either party.

(75)^ Conger, Kate. "Backing up the history of the internet in Canada to save it from Trump". TechCrunch. 201612272017514

(76)^ "Where to find what's disappeared online, and a whole lot more: the Internet Archive". Public Radio International. 20173282017514

(77)^ Chirgwin, Richard. "There's no Wayback in Russia: Putin blocks Archive.org". 20161072017514

(78)^ "Russia won't go Wayback, blocks the Internet Archive". Digital Trends. 26 June 2015. 20164172017514

(79)^ "Help Us Keep the Archive Free, Accessible, and Reader Private | Internet Archive Blogs". 20175212017514

(80)^ Herb, Ulrich. "Die Trump-Angst grassiert" (). heise online. 20161272017514

(81)^ LaFrance, Adrienne. "The Internet's Dark Ages". The Atlantic. 2017572017514

(82)^ LaFrance, Adrienne. "The Human Fear of Total Knowledge". The Atlantic. 20161222017514

(83)^ "The Entire Internet Will Be Archived In Canada to Protect It From Trump" (). Motherboard. 20175162017514

関連項目[編集]

外部リンク[編集]