Das
Internet Archive
in
San Francisco
ist ein
gemeinnutziges
Projekt, das 1996 von
Brewster Kahle
gegrundet wurde und seit 2007 den offiziellen Status einer Bibliothek hat. Gestartet wurde es als reines
Webarchiv
, bei dem man mit der sogenannten
Wayback Machine
archivierte
Websites
betrachten kann. Schon von 1999 an wurde es um weitere Archive erweitert, so dass es nunmehr eine
digitale Bibliothek
ist, die bedeutende Sammlungen von Texten und Buchern, Audiodateien, Videos, Bildern und Software umfasst. Das Internet Archive hat sich die
Langzeitarchivierung
digitaler Daten in frei zuganglicher Form zur Aufgabe gemacht und legt dabei auch Wert auf Zugangsmoglichkeiten fur blinde oder anders eingeschrankte Nutzer.
Neben der Funktion als Archiv versteht sich das Internet Archive auch als
Aktivist
fur ein offenes und freies Internet sowie den Erhalt und die Verbreitung
gemeinfreier
Werke.
[1]
Brewster Kahle grundete das Internet Archive im Mai 1996 als
Non-Profit-Organisation
nach Paragraph
501(c)(3)
des
US-amerikanischen Einkommensteuerrechts
. Es erhielt gleich zu Beginn eine große Datenlieferung von
Alexa Internet
. Es speichert im Rahmen der
Web-Archivierung
sogenannte
Mementos
, d. h.
Momentaufnahmen
von
Webseiten
und
Usenet
-Beitragen.
[2]
Von 1999 an wurde durch die Aufnahme der
Prelinger Archives
und spater weiterer Sammlungen das Ziel auf eine umfassende frei zugangliche Bibliothek erweitert.
Ende 2023 umfasste das Internet Archive eine Sammlung von:
- 46,1 Millionen Buchern und Texten,
- 11 Millionen Videos und Filmen,
- 14 Millionen Audiodateien,
- 1 Million
Computerprogrammen
und
- 4,8 Millionen Bilddateien.
Das Webarchiv der
Wayback Machine
enthalt inzwischen mehr als 839 Milliarden Webseiten.
[2]
Fur 2021 berichtete das Projekt, dass die Daten in vier
Rechenzentren
auf 28.000
Festplatten
gespeichert wurden. Ein
Spiegelserver
der Daten von San Francisco befindet sich unter anderem in der agyptischen
Bibliotheca Alexandrina
. Im Dezember 2021 erreichte die Sammlung eine Große von uber 212
Petabytes
.
[3]
Eine weitere Kopie ist in
Amsterdam
,
Niederlande
seit Juni 2004 (ursprungliche Speicherkapazitat 100 TB) in Betrieb.
[3]
Das Archiv ist vom US-Bundesstaat
Kalifornien
seit Anfang Mai 2007 offiziell als Bibliothek anerkannt.
[4]
Seit den
Wahlen vom 8. November 2016
plant das Internetarchiv nach Aussage auf seiner Website, eine permanent aktualisierte Kopie in
Kanada
zu hinterlegen.
[5]
Anlasslich des 25. Jahrestags seines Bestehens veroffentlichte das Internet Archive am 30. September 2021 die ?Wayforward Machine“; eine
dystopische
Website, welche ein stark
zensiertes Internet
im Jahre 2046 darstellt.
[6]
Eine Reihe amerikanischer Verlage haben 2020 das gemeinnutzige Internet Archive verklagt. Sie verlangten fur 127 mutmaßliche
Urheberrechtsverletzungen
etwa 19 Millionen US-Dollar, was etwa dem Jahresbudget des Internet Archives entspricht. Das Archiv wehrt sich mit einem Antrag auf Beendigung dieser existenzbedrohenden Klage. Die
Electronic Frontier Foundation
(EFF) verteidigt das Internet Archive und kritisiert, die Klage der Verlage ziele darauf ab, das Ausleihen in Bibliotheken zu kriminalisieren.
[7]
Das Audioarchiv enthalt uber 15 Millionen
Tonaufnahmen
(Stand: Juni 2023).
[8]
Diese reichen von Horfunksendungen und
Radio-Features
uber
Horbucher
,
Dichterlesungen
, Live-
Konzertmitschnitten
bis hin zu Musik, die von Benutzern hochgeladen wurde. Das Archiv kann auch genutzt werden, um
Podcasts
zu veroffentlichen.
[9]
Das Archiv enthalt auch eine Vielzahl von digitalisierten alten
Schellackplatten
aus der ersten Halfte des 20. Jahrhunderts. Deswegen wurde das Internet Archive 2023 von der Musikindustrie auf Schadensersatz von bis zu 412 Millionen US-Dollar verklagt.
[10]
Das Bildarchiv umfasste im Marz 2023
[11]
mehr als 4,8 Millionen Dateien. Dabei handelt es sich um Abbildungen von
Kunstwerken
, beispielsweise eine Sammlung von Werken aus dem
Metropolitan Museum of Art
mit uber 100.000 Eintragen, Abbildungen von historischen Landkarten,
astronomische Aufnahmen
der
NASA
,
Schallplattencover
sowie auch frei verfugbare Aufnahmen von
Privatpersonen
.
Die
Library of Congress
hat im Dezember 2006 sechs Ausnahmen des US-Copyright-Gesetzes
Digital Millennium Copyright Act
gewahrt.
[12]
Das Internet Archive darf somit Computer-
Software
oder
‑Spiele
, welche zu
Abandonware
[13]
wurden, mit der Absicht der Erhaltung speichern, wenn die Originalhardware, ‑formate oder ‑technik veraltet sind. 2013 begann das Internet Archive damit, Spieleklassiker als spielbares
Webbrowser
-
Streaming
via
M.E.S.S.
-Emulation anzubieten,
[14]
z. B. das
Atari-2600
-Videospiel
E.T. the Extra-Terrestrial
.
[15]
Vom 23. Dezember 2014 an werden zu Lehr- und Forschungszwecken
[16]
mithilfe von
DOSBox
-Emulation im Browser tausende von klassischen
DOS
-Computerspielen und -programmen prasentiert.
[17]
[18]
[19]
[20]
Bisher wurden 1.061.000 Software-Titel archiviert,
[21]
darunter 15.900 PC-Spiele (Stand: Dezember 2023).
[22]
In dem
Million Book Project
werden durch das Internet Archive Bucher, die durch das Ablaufen des
Copyrights
(US-amerikanisches
Urheberrecht
) oder aus anderen Grunden
gemeinfrei
geworden sind, digitalisiert und zum Herunterladen zur Verfugung gestellt. Die
Digitalisate
sind Teil der
Open Library
. Inzwischen sind mehr als 46 Millionen Bucher und Texte archiviert (Stand: Dezember 2023).
Es werden mehrere Scan-Center (2009 insgesamt zwolf) unterhalten, zum Beispiel in
Richmond
. Gescannt wird per Auftrag, berechnet werden pro Seite 14
US-Cent
(Stand 2023).
[23]
Die Auftraggeber, meist Bibliotheken, erhalten das Digitalisat, eine per
OCR
erzeugte Textdatei, eine
persistente
Internetadresse sowie die Moglichkeit, die Digitalisate auf den Servern des Internet Archivs zu speichern.
[24]
Weiterhin bestehen Kooperationsvereinbarungen mit selbst digitalisierenden Bibliotheken fur einzelne Dienste, wie OCR und redundantes Hosting.
Um die Glaubwurdigkeit von referenzierten Zitaten aus Buchern in der
Wikipedia
zu verbessern, gibt es seit 2019 eine Kooperation zwischen der Wikipedia und dem
Internet-Archiv
. Es wurde damit begonnen, den Quellenangaben in Wikipedia-Artikeln digitale Scans der zitierten Bucher anzufugen.
[25]
Auf jeweils zwei Seiten wird die fragliche Passage dargestellt. Ein Beispiel hierfur ist das Zitat Nummer 163 (Stand 26. Oktober 2022) im Artikel uber Martin Luther King in der englischsprachigen Wikipedia.
[26]
Im September 2020 stellte das Internet Archive eine Initiative zur Archivierung und Bereitstellung von
Open-Access
-Publikationen unter dem Namen ?Internet Archive Scholar“ vor.
[27]
Die Aufnahme der
Prelinger Archives
[28]
im Jahr 1999 war die erste uber die Webarchivierung hinausgehende Erweiterung des Internet Archives. Es enthalt Millionen Videos und
Filme
, die unter freier Lizenz oder Public Domain stehen. Es wird hier auch an einem Archiv fur
Fernsehsendungen
gearbeitet.
Unter der Rubrik ?Video“ bietet das Internet Archive uber 11 Millionen Videos (Stand: Dezember 2023) an. Die Unterrubrik ?Movies“ enthalt uber 88.000 Videodateien, darunter zahlreiche alte Filmklassiker.
Trailer
und Kurzfilme gehoren ebenso zum Angebot wie diverse
Propagandafilme
aus der Zeit des
Zweiten Weltkrieges
.
[29]
Die mehr als 3.500
Stummfilme
beinhalten unter anderem 443 Filme in der Rubrik ?Silent Hall of Fame“ mit fruhen Werken von
Charlie Chaplin
oder
Buster Keaton
, aber auch deutschen Regisseuren wie
Robert Wiene
(vertreten u. a. mit
Das Cabinet des Dr. Caligari
von 1920).
Erganzt wird das Spielfilmangebot durch fruhe Dokumentarfilme, die z. B. die Ankunft europaischer Einwanderer 1909 auf
Ellis Island
zeigen (von
Billy Bitzer
).
[30]
In der separat gelisteten Kollektion von
Georges Melies
sind naturlich dessen bekannte Genre-Klassiker vertreten, wie der 16-minutige Stummfilm
Die Reise zum Mond
von 1902.
[31]
Neben
Experimentalfilmen
namhafter Regisseure wie
Ingmar Bergman
(z. B.
Persona
,
1966) gibt es auch Klassiker vom Großmeister
Alfred Hitchcock
, der u. a. mit
Im Schatten des Zweifels
(1946) vertreten ist.
Der Spanier
Segundo de Chomon
hat ebenfalls eine eigene Rubrik, ebenso wie der deutsche Experimentalfilmer
Lutz Mommartz
und der
Osterreicher
Johann Schwarzer
. Unterschiedliche
Genres
werden bedient, es gibt sowohl Historisches als auch eine Rubrik mit fast 300
Filmkomodien
[32]
und uber 450
Science-Fiction
- und
Horrorfilme
, wie z. B.
Nosferatu ? Eine Symphonie des Grauens
von
Friedrich Wilhelm Murnau
(1922),
[33]
neben seltenen Grindhouse- und
Exploitationfilmen
[34]
wie
Sex Madness
(1938), oder
Begotten
(
E. Elias Merhige
, 1989) sowie
Cyberpunkwerken
wie
Tetsuo: The Iron Man
des Japaners
Shin’ya Tsukamoto
.
Der
Film Noir
ist mit 700 abrufbaren Beitragen vertreten, einschließlich
Straße der Versuchung
von
Fritz Lang
(1946) und
Der dritte Mann
von
Carol Reed
(1949).
[35]
Außerdem gibt es uber 8.900 Filme und Videos aus dem Themenbereich
Sport
,
[36]
6.700 animierte Filme und Kurzfilme,
[37]
sowie uber 18.300 Inhalte aus den Themenbereichen Kunst und Musik
[38]
und uber 136.000 visuelle Beitrage zu
Religion
und
Spiritualitat
.
[39]
Die
Wayback Machine
(?Take Me Back“) ist ein
Onlinedienst
, mit dem man die gespeicherten Webseiten in verschiedenen Versionen abrufen kann. Die zu speichernden Seiten wurden ursprunglich uber den Dienst
Alexa Internet
? seit 1999 ein Tochterunternehmen von
Amazon.com
? ausgewahlt, bis dieser Dienst am 1. Mai 2022 eingestellt wurde.
[40]
Alle bei Wayback Machine hinterlegten
URLs
werden regelmaßig aufgerufen und archiviert. Man kann eine noch nicht gespeicherte Internet-Ressource auch von Hand, durch Suchen nach der Seite und anschließendes Bestatigen der Aufnahme, aufnehmen lassen (Dateiinhalte, z. B.
JPG
-Bilder, werden ohne vorherige Nachfrage gespeichert). Der Gesamtumfang betrug im November 2009 etwa 150 Milliarden Seiten und wuchs bis Juli 2023 auf uber 821 Milliarden Seiten an.
Mit
Archive-It
wurde 2006 ein weiteres Webarchiv-Service fur individuelle Webarchivierung bereitgestellt. Hierbei haben Institutionen und Einzelpersonen die Moglichkeit, digitale Sicherungen ihrer Sammlungen anzulegen und die Freigabe der Daten selbst festzulegen. Archive-It verfugt uber 400 Partner aus 16 Staaten weltweit, wobei sich diese vor allem aus Universitaten, staatlichen Archiven, Museen und Kunstbibliotheken, offentlichen Bibliotheken sowie weiteren
offentlich-rechtlichen
Institutionen und
NGOs
zusammensetzen. Archive-It bietet fur teilnehmende Partner eine
Volltextsuche
auf ihre Inhalte, aber auch die Moglichkeit, mit Metadaten angereicherte strukturierte Datensatze fur Forscher zu exportieren.
[41]
Das Internet Archive finanziert sich durch Spenden und Zuwendungen diverser Stiftungen, Institute und Vereinigungen aus den Bereichen Bildung, Forschung, Wissenschaften etc. Im April 2019 wurden vom Internet Archive folgende Geldgeber angegeben:
Andrew W. Mellon Foundation
,
Council on Library and Information Resources
,
United Nations Democracy Fund
,
Federal Communications Commission
Universal Service Program for Schools and Libraries (E-Rate)
,
Institute of Museum and Library Services (IMLS)
,
Knight Foundation
,
Laura and John Arnold Foundation
,
National Endowment for the Humanities
(Office of Digital Humanities)
,
National Science Foundation
,
The Peter and Carmen Lucia Buck Foundation
,
The Philadelphia Foundation
,
Rita Allen Foundation
.
[2]
- Alexis Rossi:
Foderale Vielfalt ? globale Vernetzung: Strategien der Bundeslander fur das kulturelle Erbe in der digitalen Welt
. Hrsg.: Ellen Euler, Stiftung Preußischer Kulturbesitz (=
Kulturelles Erbe in der digitalen Welt
). 1. Auflage. Hamburg University Press, Verlag der Staats- und Universitatsbibliothek Hamburg Carl von Ossietzky, Hamburg 2016,
ISBN 978-3-943423-34-1
, Internet Archive,
S.
224?237
(
d-nb.info
[PDF;
6,1
MB
] Alternativ;
ISBN 978-3-943423-35-8
[
E-Book
];
ISBN 978-3-943423-36-5
[PDF]).
- ↑
Internet Archive, Prelinger Archives, and Project Gutenberg Literary Archive Foundation.
In:
cyber.harvard.edu.
Harvard University
,
abgerufen am 27. Februar 2021
(englisch).
- ↑
a
b
c
About the Internet Archive.
In:
archive.org.
Internet Archive,
abgerufen am 31. Dezember 2023
(englisch).
- ↑
a
b
Petabox.
In:
archive.org.
Abgerufen am 31. Dezember 2023
(englisch).
- ↑
Internet Archive officially a library.
Internet Archive forum. In:
archive.org.
25. Juni 2007,
abgerufen im Jahr 2021
(englisch).
- ↑
Brewster Kahle:
Help Us Keep the Archive Free, Accessible, and Reader Private.
Internet Archive Blogs. In:
archive.org.
29. November 2016,
abgerufen am 21. April 2017
(englisch).
- ↑
Imagine the future of the Internet.
In:
wayforward.archive.org.
Abgerufen am 1. Oktober 2022
(englisch).
- ↑
Markus Reuter:
Urheberrecht: Internet Archive wehrt sich gegen Millionenklage.
In:
netzpolitik.org.
Netzpolitik.org e. V.
, 14. Juli 2022,
abgerufen am 25. September 2022
(deutsch).
- ↑
Audio Archive.
In:
archive.org.
Abgerufen am 11. Juli 2023
(englisch).
- ↑
Max Dalton:
How to Host Podcast MP3 on Archive.org
. In:
TurboFuture
. 15. April 2023 (englisch,
turbofuture.com
[abgerufen am 3. Oktober 2023]).
- ↑
Thomas Rudl, Wegen 100 Jahre alter Schallplatten: Musikindustrie verklagt Internet Archive
, Netzpolitik.org vom 16. August 2023
- ↑
Image.
In:
archive.org.
Abgerufen am 31. Dezember 2023
(englisch).
- ↑
Internet Archive wins copyright reprieve.
In:
theregister.co.uk.
The Register, 1. Dezember 2006,
abgerufen am 23. Marz 2021
(englisch).
- ↑
Ross Miller:
US Copyright Office grants abandonware rights.
In:
joystiq.com.
Archiviert vom
Original
am
23. Marz 2009
;
abgerufen am 7. Februar 2013
(englisch).
- ↑
Tilman Baumgarte:
Timothy Leary, der Games-Entwicklerl.
In:
zeit.de.
Zeit Online
, 14. November 2013,
abgerufen am 14. November 2013
: ?Wie erhalt man historische Computerspiele? Das Internet-Archive streamt Dutzende Klassiker, in New York werden Games von Timothy Leary fur die Forschung aufgearbeitet ? Weil das Internet Archive die Spiele ?streamt‘, man sie also nicht auf den eigenen Rechner ladt, verletzt man auch das Urheberrecht nicht, wenn man die Programme benutzt.“
- ↑
Adi Robertson:
The Internet Archive puts Atari games and obsolete software directly in your browser.
In:
The Verge
.
25. Oktober 2013,
abgerufen am 29. Oktober 2013
(englisch).
- ↑
Internet Archive’s Terms of Use, Privacy Policy, and Copyright Policy.
archive.org, 31. Dezember 2014,
abgerufen am 8. Januar 2015
(englisch): ?Access to the Archive’s Collections is provided at no cost to you and is granted for scholarship and research purposes only.“
- ↑
Abby Ohlheiser:
You can now play nearly 2,400 MS-DOS video games in your browser.
In:
The Washington Post
.
5. Januar 2015,
abgerufen am 8. Januar 2015
(englisch).
- ↑
Jason Scott:
Each New Boot a Miracle.
ASCII by Jason Scott. In:
ascii.textfiles.com.
23. Dezember 2014,
abgerufen am 25. September 2022
(amerikanisches Englisch).
- ↑
Internet Archive Search: collection:softwarelibrary_msdos.
In:
archive.org.
Abgerufen am 25. September 2022
(englisch).
- ↑
Kris Graft:
Saving video game history begins right now.
In:
Game Developer
.
5. Marz 2015,
abgerufen am 7. Februar 2024
(englisch).
- ↑
The Internet Archive Software Collection.
In:
archive.org.
Abgerufen am 31. Dezember 2023
(englisch).
- ↑
Classic PC Games.
In:
archive.org.
Abgerufen am 31. Dezember 2023
(englisch).
- ↑
Scanning Services.
In:
archive.org.
Abgerufen am 30. Dezember 2023
.
- ↑
Christoph Drosser:
Das digitale Alexandria
. In:
Die Zeit
.
Nr.
4/2008
, 17. Januar 2008,
ISSN
0044-2070
(
Archivierte Kopie.
(
Memento
vom 23. Januar 2008 im
Internet Archive
) [abgerufen am 3. Oktober 2023]).
- ↑
Philipp Bovermann:
Enzyklopadie ? Fotobeweis.
Gescannte Buchseiten sollen Wikipedia verlasslicher machen. In:
sueddeutsche.de.
Suddeutsche Zeitung, 10. November 2019,
abgerufen am 14. November 2019
.
- ↑
Drew D. Hansen:
The Dream: Martin Luther King Jr. and the Speech that Inspired a Nation
. 2. Auflage. EccoPress, New York 2005,
ISBN 0-06-008477-4
,
S.
98
(englisch,
archive.org
– Alternativ;
ISBN 978-0-06-185649-5
[E-Book]).
; Vergleiche Artikel
Martin Luther King Jr.
,
Beleg 163
in der englischen Wikipedia, Stand 26. Oktober 2022, 12:17:49.
- ↑
How the Internet Archive is Ensuring Permanent Access to Open Access Journal Articles.
In:
blog.archive.org.
15. September 2020,
abgerufen am 24. Oktober 2020
(englisch).
- ↑
Tim Brookes:
Prelinger Archives: Thousands Of Old Films To Watch, Remix & Use In Your Own Projects (Stuff to Watch).
In:
makeuseof.com.
30. Juli 2012,
abgerufen am 29. Oktober 2016
(englisch).
- ↑
Moving Image Archive.
In:
archive.org.
Abgerufen am 23. Dezember 2023
(englisch).
- ↑
Silent Hall of Fame : Free Movies : Free Download, Borrow and Streaming : Internet Archive.
In:
archive.org.
Abgerufen am 11. Juli 2023
(englisch).
- ↑
The Georges Melies Collection : Free Movies : Free Download, Borrow and Streaming : Internet Archive.
In:
archive.org.
Abgerufen am 25. September 2022
(englisch).
- ↑
Comedy Films
Internet Archive, aufgerufen am 21. Februar 2022
- ↑
Sci-Fi / Horror
Internet Archive, aufgerufen am 21. Februar 2022
- ↑
Picfixer Feature Film Collection : Free Movies : Free Download, Borrow and Streaming : Internet Archive.
In:
archive.org.
Abgerufen am 25. September 2022
(englisch).
- ↑
Film Noir : Free Movies : Free Download, Borrow and Streaming : Internet Archive.
In:
archive.org.
Abgerufen am 25. September 2022
(englisch).
- ↑
Sports Videos : Free Movies : Free Download, Borrow and Streaming : Internet Archive.
In:
archive.org.
Abgerufen am 11. Juli 2023
(englisch).
- ↑
Animation & Cartoons : Free Movies : Free Download, Borrow and Streaming : Internet Archive.
In:
archive.org.
Abgerufen am 11. Juli 2023
(englisch).
- ↑
Arts & Music : Free Movies : Free Download, Borrow and Streaming : Internet Archive.
In:
archive.org.
Abgerufen am 31. Dezember 2023
(englisch).
- ↑
Spirituality & Religion : Free Movies : Free Download, Borrow and Streaming : Internet Archive.
In:
archive.org.
Abgerufen am 11. Juli 2023
(englisch).
- ↑
James Vincent:
Amazon is retiring Alexa ? no, not that one.
In:
theverge.com.
The Verge
,
abgerufen am 27. April 2024
(englisch).
- ↑
About Archive-It.
In:
archive-it.org.
Abgerufen am 23. Marz 2021
(englisch).
37.782305555556
-122.47156944444
Koordinaten:
37° 46′ 56,3″
N
,
122° 28′ 17,6″
W