It looks like you're offline.




Donate   
Change Website Language


Čeština (cs)

Deutsch (de)

English (en)

Español (es)

Français (fr)

Hrvatski (hr)

Italiano (it)

Português (pt)

ि (hi)

Sardu (sc)

 (te)

Українська (uk)

 (zh)

 





Open Library logo



My Books



Browse  Menu  


Subjects  

Trending  

Library Explorer  

Lists  

Collections  

K-12 Student Library  

Book Talks  

Random Book  

Advanced Search  


















Log In

Sign Up
 

additional options menu



My Open Library  

   

Browse  

Subjects  

Trending  

Library Explorer  

Lists  

Collections  

K-12 Student Library  

Book Talks  

Random Book  

Advanced Search  

Contribute  

Add a Book  

Recent Community Edits  

Resources  

Help & Support  

Developer Center  

Librarians Portal  





My Books



Browse  Menu  


Subjects  

Trending  

Library Explorer  

Lists  

Collections  

K-12 Student Library  

Book Talks  

Random Book  

Advanced Search  











Last edited by raybb

May 22, 2024 | History
 

Edit  

Open Library Data Dumps




Open Library provides dumps of all its data, generated every month. All of the dumps are formatted as tab separated files with the following columns:


type - type of record (/type/edition, /type/work etc.)
 

key - unique key of the record. (/books/OL1M etc.)
 

revision - revision number of the record
 

last_modified - last modified timestamp
 

JSON - the complete record in JSON format  

Dumps



editions dump (~ 9.2G)
 

works dump (~ 2.9G)
 

authors dump (~ 0.5G)
 

all types dump (~ 12.4G): includes editions, works, authors, redirects, etc.
 

complete dump (~ 29.6G): also includes past revisions of all the records in Open Library
 

ratings dump (~ 5M): with columns: "Work Key, Edition Key (optional), Rating, Date"
 

reading log dump (~ 65M): with columns "Work Key, Edition Key (optional), Shelf, Date"
 

redirects dump (~ 50M)
 

deletes dump (~ ?M)
 

lists dump (~ ?M)
 

other dump (~ ?M)  


For past dumps, see: https://archive.org/details/ol_exports?sort=-publicdate

Downloading the dumps take too long? Checkout the link above and download via torrent for higher speeds!

Format of JSON records


A JSON schema for the various types is located at https://github.com/internetarchive/openlibrary-client/tree/master/olclient/schemata


Author Records: JSON serialization of a type/author
 

Edition Records: JSON serialization of a type/edition
 

Work Records: JSON serialization of a type/work  

Using Open Library Data Dumps


Please see this great guide by contributor on the LibrariesHacked github about how to load Open Library's data dumps into postgres to make it more useful and queriable:
 https://github.com/LibrariesHacked/openlibrary-search

GraphQL


DiFronzo on github has produced a graphql proxy to search books using work, edition and ISBN with Open Library API. Deployed with Deno and GraphQL:

https://github.com/DiFronzo/OpenLibrary-GraphQL
 DiFronzo/OpenLibrary-GraphQL

OL Covers Dump


We do not yet have rolling monthly dumps of our book covers, despite a shared desire for its existence. Some historical cover dumps may be explored here:
 https://archive.org/details/ol_data?tab=collection&query=identifier%3Acovers&sort=-addeddate



History  



Created December 14, 2011

28 revisions
 

May 22, 2024 Edited by raybb Edited without comment.
May 22, 2024 Edited by raybb covers url sorted by date added
May 22, 2024 Edited by raybb Edited without comment.
May 22, 2024 Edited by raybb placeolder for redirects and other
December 14, 2011 Created by Anand Chitipothu Documented Open Library Data Dumps







Open Library



Vision

Volunteer

Partner With Us

Careers

Blog

Terms of Service

Donate
 


Discover



Home

Books

Authors

Subjects

Collections

Advanced Search

Return to Top
 


Develop



Developer Center

API Documentation

Bulk Data Dumps

Writing Bots
 


Help



Help Center

Report A Problem

Suggesting Edits

Add a Book

Release Notes
 

Change Website Language



Čeština (cs)

Deutsch (de)

English (en)

Español (es)

Français (fr)

Hrvatski (hr)

Italiano (it)

Português (pt)

ि (hi)

Sardu (sc)

 (te)

Українська (uk)

 (zh)

 




Open Library is an initiative of the Internet Archive, a 501(c)(3) non-profit, building a digital library of Internet sites and other cultural artifacts in digital form. Other projects include the Wayback Machine, archive.org and archive-it.org  

version dc05746