Ist es euch auch schon mal passiert? Ihr sucht nach einer gewissen Information, welche ihr vor nicht all zu langer Zeit noch auf einer Internetseite gefunden habt? Nun hat sie der Betreiber gelöscht oder die Seite existiert vielleicht gar nicht mehr?

Hier könnte archive.org weiterhelfen. Es handelt sich um eine non-profit Organisation, welche es sich zur Aufgabe gemacht regelmäßig Backups des Internets anzufertigen! Die Seite wird in den U.S.A. gehostet und vor kurzem zu einer offiziellen Bibliothek (vom Staat Kalifornien) ernannt

Technisch gesehen verwendet archive.org Crawler, welche – ähnlich wie Suchmaschinen – Internetseiten durchsuchen und anschließend in einer riesigen Datenbank speichern. So ist die heute sehr populäre Nachrichtenseite Spiegel.de 1998 kaum noch wieder zuerkennen. Selbst Wikipedia ähnelt 2002 einer formlosen Linksammlung. So mancher wird heute noch an seinen für 730 DM ersteigerten DVD Player bei Ebay denken, wenn er im nächsten Supermarkt das neue 30 Euro Angebot sieht.

Aber nicht nur die web Giganten werden bei archive.org gelistet. Eine virtuelle Zeitreise ins Jahr 2001 zur 20.000 Einwohnerstadt Rhede im Münsterland ist jederzeit möglich.

Doch so ganz ohne Kritik kann auch nicht von dieser Seite berichtet werden. Immerhin werden die Daten ohne Kenntnis des Seitenbetreibers gesammelt und gespeichert. So mancher wird schon geschockt auf sein „unmögliches Design“ oder seine Rechtschreibfehler zurückgeblickt haben ;)
Als Betreiber mit Zugriff auf die Verzeichnisstruktur des Webservers gibt es jedoch eine Möglichkeit die Inhalte, auch rückwirkend, zu löschen. Dies ist über die auch bei Suchmaschinen verwendete robots.txt möglich. Die Tagesschau hat diese Option genutzt.
Aber bei archive.org werden auch komplette Foren inklusive Threads und einzelnen Antworten gespeichert. Hier hat der Benutzer in der Regel nicht mehr die Möglichkeit die Inhalte nachträglich zu entfernen. Einträge, die aufgrund anstößiger Inhalte im Nachhinein vom Administrator gelöscht wurden, tauchen hier und da in diversen Archiven des Dienstes auf.

Irgendwie sind Internetseiten aber auch ein Stück Geschichte. Und es wäre schade, wenn nachkommende Generationen nicht mehr nachvollziehen könnten, wie das Internet heute aussieht.

Die Einlieferung der Seiteninhalte verbindlich über den Staat zu regeln finde ich hingegen etwas übertrieben. Wäre irgendwie merkwürdig, wie in dem Artikel angesprochen nur Betreiber .de Domains ihre Inhalte bei der Deutschen Nationalbibliothek einliefern müssten.

Habt ihr bei archive.org auch ein Stück eurer Internetgeschichte gefunden? Wurdet ihr auch schon für alle Ewigkeiten abgespeichert? :) Über Erfahrungen und Kommentare würde ich mich sehr freuen.

3 Antworten zu “Zeitmaschine im Internet”

  1. Dave sagt:

    Habe schon einige Seiten über archive.org betrachtet, aber ob meine eingene alte dort ist weiss ich nicht…

  2. Dürrbi sagt:

    Oh ja lang ists her… aber meine ersten Gehversuche sind leider nicht archiviert - nur ein paar Versionen nach 2001 (z.B. die folgende vom 20.05.2001)
    –>

  3. Dürrbi sagt:

    (Ups meine Email-Adresse im vorherigen Kommentar ist vertippt…)

Hinterlasse einen Kommentar