Wer im Internet unterwegs ist, wird von Zeit zu Zeit immer mal wieder mit Fehlerseiten und Statuscodes konfrontiert. Ein Statuscode ist eine Antwort des Servers auf die Anfrage eines Clients (also dem Browser des Nutzers). Mit diesem Code teilt der Server mit, ob die gewünschte Anfrage erfolgreich war oder ob ein Problem aufgetreten ist. Grundsätzlich werden die dreistelligen Statuscodes in Klassen unterteilt, wobei die erste Ziffer für die jeweilige Status-Klasse steht. Wichtige Status Codes für SEOs finden sich vor allem in den Klassen 2, 3 und 4. Aber was bedeuten sie überhaupt? Wo liegen die Fehlerquellen für Webmaster, wie lassen sich Redirect-Umleitungen einstellen und prüfen? Ein klarer Überblick von Studio1® für alle Webmaster, SEO-Beauftragte, Blogger und sonst irgendwie Neugierige. :-)
Die wichtigsten HTTP Statuscodes, die jeder Webmaster kennen sollte
Falls Sie sich fragen, warum wir die Klassen im Folgenden nicht ihrer numerischen Reihenfolge nach erklären: Das hat einfach mit der Relevanz zu tun. Denn der Webcrawler einer Suchmaschine identifiziert anhand des Statuscodes, ob die aufgerufene URL verfügbar – also Code 200 – oder nicht verfügbar ist – also Code 404.
Die 300er Reihe steht für den speziellen Anwendungsfall einer Umleitung, die 500er für Probleme des Servers (für die weder der User noch der Webmaster etwas kann). Hier also die Übersicht:
Die 200 – Alles ok
Wenn die Bearbeitung der Anfrage zwischen Server und Client (Browser) erfolgreich war und die gewünschten Dokumente, Informationen oder Inhalte verfügbar sind, wird der Code 200 übermittelt. Dies ist der häufigste Statuscode, weil er den Normalfall repräsentiert, also wenn alles gefunden wurde. Die Suche nach der URL und somit die Anfrage war also erfolgreich und die Webseite erscheint – der Statuscode hingegen nicht. Er zeigt lediglich dem Server im HTTP (Hypertext Transfer Protocoll) an, dass die Webseite existiert, also kann er die angeforderten Daten an den Client übertragen. Für den User wird der Code also nicht sichtbar, sondern lediglich in der Antwort an den Client mitgeliefert.
Die 400er – Client Fehler oder: (Für dich erstmal) nicht verfügbar
Die meisten User kennen das: Sie möchten eine Seite aufrufen und auf einmal springt ihnen eine rote 404 entgegen, grafisch meistens nicht besonders hübsch, sondern mit einem Stoppschild oder dergleichen versehen. Fehler der Klasse 4 werden vom Client (also dem Browser) gesendet, wenn er keine vernünftige Antwort vom Server erhält. HTTP 404 Fehler (NOT FOUND)haben viele Gründe und bedeuten zum Beispiel, dass die Webseite oder auch nur bestimmte Inhalte nicht mehr an ihrem alten Speicherort sind. Hier haben die Webmaster nicht richtig aufgepasst und die Links beispielsweise noch nicht angepasst (wir sprechen hier von toten Links). Es kann aber auch sein, dass der User sich vertippt hat und eine Seite anfordert, die gar nicht existiert. Vielleicht kommt Ihnen auch der Statuscode 401 (UNAUTHORIZED) bekannt vor, dieser hat aber nur die Bedeutung, dass Sie sich autorisieren müssen, um entsprechenden Zugriff zu erhalten. Nicht sehr häufig, aber dennoch erwähnenswert ist die 410 (GONE). Dieser Statuscode bedeutet, dass die Seite einfach nicht mehr existiert.
Die 300er – Eine Umleitung ist keineswegs ein Fehler
Es gibt viele Anwendungsfälle für eine Umleitung, ob es nun eine temporäre oder dauerhafte ist. So oder so sollten Webmaster wissen, wie diese technisch umzusetzen ist, denn ansonsten gibt es unerwünschte HTTP 404 Fehler. In der Regel führen 404-Meldungen zu einer hohen Absprungrate und lassen die Seite für den User insgesamt irrelevant werden. Und das wollen wir ja nicht ;-)
So wird der HTTP-Statuscode 301 (MOVED PERMANENTLY) verwendet, wenn die Seite dauerhaft umgezogen ist, also wenn sie fortan unter einer anderen URL erreichbar ist. Die Umleitung ist aber wichtig, damit der so genannte Link Juice (zu deutsch: die Linkstärke) der alten URL nicht verloren geht. Eine Seite beginnt mit dem Zeitpunkt ihrer Onlineschaltung, bei Google gecrawlt zu werden, das heißt es werden beispielsweise alle Backlinks erfasst, also Links von anderen Seiten auf die eigene. Das ist für die (technische) Reputation sehr wichtig. Wer die URL(s) – meistens bei der Änderung der Linkstruktur oder Navigation – ändert, sollte also unbedingt eine 301-Redirect-Umleitung einrichten, um den kostbar gewonnen Saft nicht zu verschütten ;-)
Wenn beispielsweise ein Umzug auf einen neuen Server stattfindet, wird der HTTP-Statuscode 302 (FOUND, MOVED PERMANENTLY) verwendet. Nur temporär ist die Seite also unter einer anderen URL zu finden, die Webcrawler der Suchmaschinen beziehen sich aber auch während der Übergangszeit auf den alten Speicherort. Auf diese Weise sammeln Sie weiter Link Juice, weil die ursprüngliche URL nach wie vor gültig ist.
Die 500er – Server Fehler oder wenn die Hände gebunden sind
Das Gelingen der Anfrage kann nicht immer garantiert werden, denn natürlich kann es auch mal sein, dass der Server Probleme bereitet und ausfällt. Dies kann auch durch ganz alltägliche Dinge wie ein Gewitter geschehen, das einen Stromausfall verursacht. Das ist natürlich sehr selten, soll aber zeigen, dass Anfragen auch dann nicht beantwortet werden können, wenn weder der User noch der Webmaster einen Fehler begangen hat. Hier werden vor allem zwei HTTP-Statuscodes verwendet: Der HTTP-Statuscode 500 (INTERNAL SERVER ERROR) ist das Sammelbecken für alle möglichen Fehler des Servers, durch die die URL nicht erreicht wird. Hier sollten Webmaster überprüfen, ob es Probleme mit der htaccess-Datei gibt – eine Konfigurationsdatei für den Webserver, die vor allem bei Umleitungen entsprechend angepasst werden muss.
Der Statuscode 503 (SERVICE UNAVAILABLE) wird verwendet, wenn der Server vorübergehend nicht erreichbar ist, das kann bei Wartungsarbeiten sein oder auch, wenn er überlastet ist.
404 Error und andere Crawlingfehler: Wichtige Auswirkungen und Hilfsmittel
Vorab: Wie lassen sich die Status Codes der Webseite prüfen und überwachen, um Crawlingfehler zu vermeiden? Hier gibt es eine große Anzahl an verschiedenen Online-Tools. Am besten HTTP request check googeln oder Browser-Erweiterungen wie beispielsweise dieses Add-On für Mozilla nutzen. Mit diesen Tools erhalten Sie auch eine ausführliche Beschreibung des Fehlers (wenn Sie mit ebendieser nichts anfangen können, dann sind Sie bei unserem IT-Team und dem Support jedenfalls an der richtigen Stelle ;-) Das wichtigste Hilfsmittel ist und bleibt aber:
Die Google Search Console – Unabdingbar für jeden Webseitenbetreiber
Wir empfehlen unseren Kunden (auch aus vielen anderen Gründen) einen eigenen Google Account einzurichten, denn mit diesem kann auch die Google Search Console eingerichtet werden, die viele hilfreiche Funktionen zur Verfügung stellt. Unter dem Reiter "Crawling > Crawling-Fehler“ lassen sich alle fehlerhaften Einstellungen einsehen. Wenn Sie alles richtig gemacht haben, sieht es so aus:
In der Search Console finden sich aber auch alle Informationen über die internen und externen Verlinkungen der URLs. So können Sie die HTTP Status Codes einsehen und die wirklich wichtigen, verlinkten 404-Seiten erkennen und mit Umleitungen zugleich anpassen, das sieht dann so aus:
Oben im Menü sind dann auch die verschiedenen Devices, also Desktop oder Smartphone, anwählbar. So erhalten Sie alle 404 Error-Varianten für das jeweilige Gerät. Mit einem Klick sehen Sie auch, von welchen Seiten aus die Fehlerseite verlinkt wird. Dies kann beispielsweise sein, wenn im Blog auf eine Unterseite verlinkt wird, die es – bzw. deren URL – es aber nicht mehr gibt. Das würde dann alles hier angezeigt.
Auswirkungen fehlerhafter Einstellungen und Anpassungen
Wenn Sie hier nicht regelmäßig prüfen und Fehler unentdeckt lassen, hat das Auswirkungen auf das Crawling, die Reputation und damit auf die Indexierung Ihrer Seite. Außerdem ist es für die Nutzer auch jedes Mal unerfreulich, wenn die Antwort des Servers nicht zur Suchanfrage passt. In diesem Sinne:
Wie lassen sich 404-Fehler vermeiden?
Wenn es die alte Seite nicht mehr gibt bzw. wenn sich deren URL geändert hat (von non-www auf www), dann müssen Sie aus oben beschriebenen Gründen zwingend eine 301-Redirect-Umleitung einstellen. Hier gibt es verschiedene Möglichkeiten: Bestimmte Hostinganbieter machen es ihren Kunden einfach und geben ihnen die Möglichkeit, im Kundenmenü die Einstellungen zur Umleitung ganz einfach vorzunehmen. In diesem Fall wird der Code automatisch generiert. Andernfalls:
Einrichtung einer 301-Redirect Umleitung mittels .htaccess
Achtung, jetzt geht es an das Eingemachte: Die htaccess-Datei ist eine Konfigurationsdatei, die unter anderem regelt, wie der Server sich bei Anfragen verhalten soll. Diese befindet sich im Root der Seite, also im Hauptverzeichnis meistens in der obersten Ebene. Für diesen Weg der Umleitungs-Einstellung ist der Apache Webserver mit aktivierten mod_rewrite Module eine klare Voraussetzung. Da Apache aber der populärste Webserver ist, haben eigentlich alle gängigen Webhoster diesen standardmäßig im Einsatz. Auch ist das benötigte mod_rewrite Module in den meisten Fällen bereits aktiviert und eine .htaccess-Datei bei den meisten Tarif-Verträgen vorhanden. Folgender Quellcode sollte dann in die .htaccess-Datei eingefügt werden:
Durch den ersten Befehl wird das mod_rewrite Modul des Apache Webservers angesprochen. In der zweiten Code-Zeile wird der richtige Pfad zu der Seite angegeben, welche weitergeleitet werden soll. Nach einem Leerzeichen wird in die gleiche Zeile die Ziel-URL geschrieben, auf die Sie den User umleiten möchten. An das Ende der Zeile muss dann noch der „Redirect 301“ eingetragen werden, um den entsprechenden HTTP-Statuscode festzulegen. Dies ist eine Variante, wie eine Weiterleitung eingerichtet werden kann. Je nach Anwendungsfall gibt es noch viele weitere Möglichkeiten. Wenn Sie hier Unterstützung brauchen, steht Ihnen unser IT-Team aber immer gern zur Seite.
Mit 404-Seiten Werbung machen?
Wenn Sie als Webseiten-Anbieter keine 404-Seite eingerichtet haben, gibt der Browser eine entsprechende automatisierte Seite aus mit einem Text wie "Diese Seite ist leider nicht erreichbar. Meinten Sie ... ?" Da User immer wieder Tippfehler machen, ist es aber sehr ratsam, eine eigene 404-Seite einzurichten, die sich dann aber unbedingt nach dem CI und dem Branding des Unternehmens richten muss, ja, die sogar sehr lustig und kreativ sein kann! Vor allem große Unternehmen, Blogs aus dem IT-Bereich oder kreative Freiberufler haben es schon verstanden, mit diesen Seiten für Kurzweil zu sorgen oder zum Lachen zu bringen – und somit gezeigt zu haben, dass sie auch auf Details Wert legen. Eine lustige Sammlung von 404-Seiten finden Sie hier. Wem das aber nicht professionell genug ist oder wer nicht als Ulknudel dastehen will, kann bei Tippfehlern auch einfach auf die Startseite weiterleiten oder eben – zum Beispiel als Onlineshopbetreiber auf den Bestseller unter den Produkten. Die Seite kann also durchaus als Werbeplattform genutzt werden. Wichtig ist, dass trotzdem der 404 Status Code ausgegeben wird.