Wayback Machine
Stand: 21.07.2022
Eine sogenannte Wayback Machine ist ein Internetportal, über das Nutzer auf ältere Versionen von Webseiten zugreifen können. Das Portal gehört der US-amerikanischen Non-Profit-Organisation Internet Archive. Die Wayback Machine speichert in regelmäßigen Abständen den Inhalt verschiedener Internetseiten und generiert so eine Historie mit diversen Versionen und Zuständen. Auf diese Weise sammelt das Portal auch Unmengen an Daten. Die Wayback Machine steht unter anderem wegen diverser Verstöße gegen geltendes Urheberrecht in der Kritik.
Anwendungsgebiet und Hintergrund
Mithilfe des Portals Wayback Machine soll vor allem Forschern, Wissenschaftlern und Historikern der Zugang zu einem digitalen Archiv ermöglicht werden. Internet Archive sammelt dafür nicht nur Daten über archivierte Webseiten, sondern auch Texte, Audio, bewegte Bilder und Software. So werden Webseiten mitsamt ihrer vollständigen Inhalte gespeichert. Die Daten werden dabei mithilfe eines Crawlers gesammelt.
Die Organisation Internet Archive verwendet die Datenbank des Internet-Unternehmens Alexa. Alexa ist ein Tochterunternehmen von Amazon, welches weltweit Zugriffsdaten über Webseiten sammelt.
Kritik an der Wayback Machine
Die umfassende Speicherung von Webseiten und ihrem Content ist umstritten. Bei der Abspeicherung kann es je nach geltendem Gesetz zu Verstößen gegen das Urheberrecht kommen, denn der eingesetzte Crawler indexiert und erfasst zunächst alle Webseiten und Inhalte. Besonders in Hinblick auf die deutsche Rechtslage stellt die Archivierung eine Vervielfältigung urheberrechtlich geschützter Werke dar und verstößt somit durch das Urheberrecht.
Um eine Löschung der gespeicherten Daten zu erwirken, müssen Webseitenbetreiber eine Anfrage an die Betreiber stellen. Doch auch wenn der Löschung der Webseite stattgegeben wird, bleibt der entsprechende Content in der Datenbank gespeichert. Das stellt vor allem Foren und soziale Netzwerke vor eine Herausforderungen, da Nutzer ihre Beiträge nicht mehr entfernen lassen können, auch wenn sie ihrer aktuellen Position nicht mehr entsprechen.
Viele Webseitenbetreiber versuchen sich über eine entsprechende Konfiguration der robots.txt-Datei zu schützen. Diese Datei legt fest, welche Bereiche einer Domain indexiert werden sollen und welche nicht, um so die Arbeit der Suchmaschinen zu erleichtern. Jedoch verkündete der Betreiber der Wayback Machine im April 2017, dass der Crawler zukünftig immer weniger Rücksicht auf die Konfigurationen für die Suchmaschinen in der robots.txt-Datei nehmen wird, um der Unternehmensvision einer wirklichkeitsgetreuen Abbildung des Internet zu entsprechen. So werden beispielsweise auch US-amerikanische Regierungsseiten indexiert und gespeichert, obwohl dies in der robots.txt-Datei untersagt wird.
Bedeutung für SEO
Im Rahmen der Suchmaschinenoptimierung (SEO) hingegen könnte die Wayback Machine einen Vorteil darstellen: Im Falle einer Penalty aufgrund unlauterer Methoden zu Verbesserung des PageRanks auf der Search Engine Result Page (SERP) können Webseitenbetreiber die Ursache für die Abstrafung durch das Vergleicher des Quellcodes mit der älteren Version einer Seite leichter nachvollziehen. So lassen sich auch andere Fehlerquellen leichter identifizieren und optimieren.
Auch in Hinblick auf das Linkmanagement kann der Zugriff auf ältere Versionen und Zustände einer Webseite hilfreich sein, denn Webseitenbetreiber können fehlerhafte oder tote Links leichter identifizieren. Auch im Falle von Dublicate Content hat der Inhaber einer Webseite die Möglichkeit, die in der Wayback Machine gespeicherte Version der Webseite als Beweis für die Herkunft des Contents anzuführen.
Ist Wayback Machine legal?
Ja, Wayback Machine ist legal. Sie fällt unter die Kategorie der fairen Nutzung. Fair Use ist eine Bestimmung des amerikanischen Urheberrechts, die eine begrenzte Vervielfältigung von urheberrechtlich geschütztem Material zum Zweck von Kommentaren, Kritik, Nachrichtenberichterstattung, Unterricht, Wissenschaft oder Forschung erlaubt.
Wie funktioniert Wayback Machine?
Der Internet-Archivierungsdienst namens Wayback Machine ist eine digitale Bibliothek, die Kopien von Websites und Webseiten speichert. Sie wurde 2001 vom Internet Archive gegründet, einer gemeinnützigen digitalen Bibliothek mit dem erklärten Ziel des universellen Zugangs zu allem Wissen.
Die Wayback Machine macht in regelmäßigen Abständen Schnappschüsse von Websites, die dann in der Bibliothek gespeichert werden. Wenn Sie eine Website besuchen, die in der Wayback Machine archiviert ist, können Sie sehen, wie sie zu verschiedenen Zeitpunkten in der Vergangenheit aussah. Sie können die Wayback Machine auch verwenden, um ältere Versionen von Websites zu durchsuchen.
Damm 17,
38100 Braunschweig