Ein systematischer Diagnose-Workflow — von der Search Console bis zur robots.txt
Das Problem hinter fehlender Sichtbarkeit
Eine Seite kann technisch einwandfrei gebaut, inhaltlich stark und korrekt verlinkt sein — und trotzdem in keinem Suchergebnis auftauchen. Der Grund ist fast immer derselbe: Google hat die Seite entweder nicht gecrawlt oder bewusst nicht in den Index aufgenommen.
Crawling und Indexierung sind zwei getrennte Schritte. Der Googlebot besucht eine Seite, liest sie – und entscheidet dann, ob sie indexierungswürdig ist. Nur Seiten im Index erscheinen in den Suchergebnissen.
Dieser Artikel beschreibt einen strukturierten Diagnose-Workflow: von den einfachsten Ursachen bis zu technischen Spezialfällen. Das Ziel ist nicht, alle möglichen Szenarien aufzulisten, sondern einen klaren Pfad von der Frage „Warum erscheint diese Seite nicht?” zur Antwort zu finden.
Der Diagnose-Workflow
Schritt 1: Search Console als Einstiegspunkt
Der Abdeckungsbericht (Coverage Report) unter Index → Seiten zeigt den Status aller bekannten URLs. Die vier relevanten Zustände:
- Gültig — Seite ist indexiert
- Gültig mit Warnung — indexiert, aber mit einem potenziellen Problem
- Ausgeschlossen — bewusst nicht indexiert (z. B. durch noindex, Canonical, Duplikat)
- Fehler — nicht indexiert wegen eines technischen Problems (z. B. 404, 5xx)
Der häufigste Befund ist „Ausgeschlossen” — und hier steckt meistens die eigentliche Ursache.
Schritt 2: URL Inspection Tool für einzelne Seiten
Das URL Inspection Tool zeigt für jede konkrete URL:
- Wann Google zuletzt gecrawlt hat
- Ob die Seite als indexierbar eingestuft wird
- Welche Canonical-URL Google erkannt hat
- Ob eine robots.txt-Regel den Crawl blockiert
- Den gerenderten HTML-Stand (wichtig bei JavaScript-heavy-Seiten)
Schritt 3: robots.txt und Meta-Robots
Zwei unabhängige Mechanismen blockieren Crawling und Indexierung:
robots.txt steuert den Zugriff des Crawlers:
# Typischer Fehler: wichtige Seiten versehentlich geblockt
Disallow: /leistungen/
Meta-Robots-Tag steuert die Indexierung einer bereits gecrawlten Seite:
<meta name="robots" content="noindex, follow">
Ein noindex-Tag verhindert die Aufnahme in den Index — auch wenn die Seite gecrawlt werden darf. Entwickler setzen diesen Tag manchmal für Staging-Umgebungen und vergessen, ihn vor dem Launch zu entfernen – das passiert häufiger als erwartet.
Schritt 4: Canonical und Duplikate
Wenn mehrere URLs identischen oder sehr ähnlichen Inhalt ausliefern, wählt Google selbst eine kanonische Version — die muss nicht zwingend die bevorzugte sein.
Typische Szenarien:
https://example.com/seite/undhttps://example.com/seite(mit und ohne Trailing Slash) werden als Duplikate erkannt- Parametrisierte URLs wie
?utm_source=...erzeugen unbeabsichtigt Duplikate - Ein falsch gesetzter Canonical verweist auf eine andere URL und schließt die eigentliche Seite aus
Im URL Inspection Tool ist unter „Kanonische URL von Google” erkennbar, welche Seite Google als Originalversion betrachtet.
Schritt 5: Inhaltsqualität als Indexierungssignal
Google bewertet Seiten nicht nur technisch. Seiten mit sehr wenig Inhalt, stark ähnlichem Text zu anderen Seiten auf derselben Domain oder ohne erkennbaren Nutzen für Suchende werden zwar gecrawlt, aber nicht indexiert.
Was als „zu wenig Inhalt” gilt, ist nicht absolut definiert — eine kurze Kontaktseite mit drei Sätzen kann indexiert sein, während eine generisch befüllte Leistungsseite ausgeschlossen wird. Entscheidend ist der redaktionelle Mehrwert, nicht die Wortanzahl.
Für einen detaillierteren Blick auf Inhaltsqualität im SEO-Kontext ist der Artikel E-E-A-T und was KI-Content damit macht weiterführend.
Schritt 6: Sitemap und interne Verlinkung
Der Googlebot folgt Links. Seiten, auf die keine andere Seite verlinkt, werden seltener oder gar nicht gecrawlt — unabhängig davon, ob sie in der Sitemap stehen.
Eine XML-Sitemap unterstützt die Indexierung, ersetzt aber keine interne Verlinkung. Beide Kanäle sollten funktionieren:
- Sitemap in der Search Console eingereicht und fehlerfrei
- Alle wichtigen Seiten intern mindestens einmal verlinkt
Monitoring dauerhaft einrichten
Indexierungsprobleme entstehen nicht immer beim Launch — sie entstehen auch durch Updates, Migrationen oder unbeabsichtigte Änderungen an der Konfiguration. Ein regelmäßiges Monitoring sollte:
- Den Coverage Report wöchentlich auf neue Fehler prüfen
- Bei größeren Änderungen (Relaunch, Umstrukturierung) sofort die betroffenen URLs im URL Inspection Tool prüfen
- robots.txt nach Updates kontrollieren
- Canonical-Konfiguration bei Seitentypen mit Parametern regelmäßig validieren
Ein technischer SEO-Audit deckt diese Punkte systematisch auf. Die konkrete Vorgehensweise ist unter SEO-Audit Rostock beschrieben.