Google-Indexierung: Warum Seiten unsichtbar bleiben

Das Problem hinter fehlender Sichtbarkeit

Eine Seite kann technisch einwandfrei gebaut, inhaltlich stark und korrekt verlinkt sein — und trotzdem in keinem Suchergebnis auftauchen. Der Grund ist fast immer derselbe: Google hat die Seite entweder nicht gecrawlt oder bewusst nicht in den Index aufgenommen.

Crawling und Indexierung sind zwei getrennte Schritte. Der Googlebot besucht eine Seite, liest sie – und entscheidet dann, ob sie indexierungswürdig ist. Nur Seiten im Index erscheinen in den Suchergebnissen.

Dieser Artikel beschreibt einen strukturierten Diagnose-Workflow: von den einfachsten Ursachen bis zu technischen Spezialfällen. Das Ziel ist nicht, alle möglichen Szenarien aufzulisten, sondern einen klaren Pfad von der Frage „Warum erscheint diese Seite nicht?” zur Antwort zu finden.

Der Diagnose-Workflow

Search Console — Coverage Report prüfen Statusmeldungen: Valid, Excluded, Error. Hier beginnt jede Diagnose.

URL Inspection Tool — Einzelseite analysieren Letzter Crawl, Indexierbarkeit, Canonical, robots.txt-Status direkt abrufbar.

robots.txt und Meta-Robots prüfen Blockierungen durch Disallow-Regeln oder noindex-Tags — häufigste Ursache.

Canonical und Duplikate klären Verweist der Canonical auf eine andere URL? Gibt es Inhaltsduplikate?

Inhaltsqualität bewerten Thin Content, Seiten ohne erkennbaren Mehrwert werden von Google ausgeschlossen.

Sitemap und interne Verlinkung kontrollieren Orphan Pages — Seiten ohne eingehende Links — werden seltener gecrawlt.

Indexierung manuell anstoßen Im URL Inspection Tool: "Indexierung beantragen" nach einer Korrektur.

Schritt 1: Search Console als Einstiegspunkt

Der Abdeckungsbericht (Coverage Report) unter Index → Seiten zeigt den Status aller bekannten URLs. Die vier relevanten Zustände:

Gültig — Seite ist indexiert
Gültig mit Warnung — indexiert, aber mit einem potenziellen Problem
Ausgeschlossen — bewusst nicht indexiert (z. B. durch noindex, Canonical, Duplikat)
Fehler — nicht indexiert wegen eines technischen Problems (z. B. 404, 5xx)

Der häufigste Befund ist „Ausgeschlossen” — und hier steckt meistens die eigentliche Ursache.

Schritt 2: URL Inspection Tool für einzelne Seiten

Das URL Inspection Tool zeigt für jede konkrete URL:

Wann Google zuletzt gecrawlt hat
Ob die Seite als indexierbar eingestuft wird
Welche Canonical-URL Google erkannt hat
Ob eine robots.txt-Regel den Crawl blockiert
Den gerenderten HTML-Stand (wichtig bei JavaScript-heavy-Seiten)

Schritt 3: robots.txt und Meta-Robots

Zwei unabhängige Mechanismen blockieren Crawling und Indexierung:

robots.txt steuert den Zugriff des Crawlers:

# Typischer Fehler: wichtige Seiten versehentlich geblockt
Disallow: /leistungen/

Meta-Robots-Tag steuert die Indexierung einer bereits gecrawlten Seite:

<meta name="robots" content="noindex, follow">

Ein noindex-Tag verhindert die Aufnahme in den Index — auch wenn die Seite gecrawlt werden darf. Entwickler setzen diesen Tag manchmal für Staging-Umgebungen und vergessen, ihn vor dem Launch zu entfernen – das passiert häufiger als erwartet.

Schritt 4: Canonical und Duplikate

Wenn mehrere URLs identischen oder sehr ähnlichen Inhalt ausliefern, wählt Google selbst eine kanonische Version — die muss nicht zwingend die bevorzugte sein.

Typische Szenarien:

https://example.com/seite/ und https://example.com/seite (mit und ohne Trailing Slash) werden als Duplikate erkannt
Parametrisierte URLs wie ?utm_source=... erzeugen unbeabsichtigt Duplikate
Ein falsch gesetzter Canonical verweist auf eine andere URL und schließt die eigentliche Seite aus

Im URL Inspection Tool ist unter „Kanonische URL von Google” erkennbar, welche Seite Google als Originalversion betrachtet.

Schritt 5: Inhaltsqualität als Indexierungssignal

Google bewertet Seiten nicht nur technisch. Seiten mit sehr wenig Inhalt, stark ähnlichem Text zu anderen Seiten auf derselben Domain oder ohne erkennbaren Nutzen für Suchende werden zwar gecrawlt, aber nicht indexiert.

Was als „zu wenig Inhalt” gilt, ist nicht absolut definiert — eine kurze Kontaktseite mit drei Sätzen kann indexiert sein, während eine generisch befüllte Leistungsseite ausgeschlossen wird. Entscheidend ist der redaktionelle Mehrwert, nicht die Wortanzahl.

Für einen detaillierteren Blick auf Inhaltsqualität im SEO-Kontext ist der Artikel E-E-A-T und was KI-Content damit macht weiterführend.

Schritt 6: Sitemap und interne Verlinkung

Der Googlebot folgt Links. Seiten, auf die keine andere Seite verlinkt, werden seltener oder gar nicht gecrawlt — unabhängig davon, ob sie in der Sitemap stehen.

Eine XML-Sitemap unterstützt die Indexierung, ersetzt aber keine interne Verlinkung. Beide Kanäle sollten funktionieren:

Sitemap in der Search Console eingereicht und fehlerfrei
Alle wichtigen Seiten intern mindestens einmal verlinkt

Monitoring dauerhaft einrichten

Indexierungsprobleme entstehen nicht immer beim Launch — sie entstehen auch durch Updates, Migrationen oder unbeabsichtigte Änderungen an der Konfiguration. Ein regelmäßiges Monitoring sollte:

Den Coverage Report wöchentlich auf neue Fehler prüfen
Bei größeren Änderungen (Relaunch, Umstrukturierung) sofort die betroffenen URLs im URL Inspection Tool prüfen
robots.txt nach Updates kontrollieren
Canonical-Konfiguration bei Seitentypen mit Parametern regelmäßig validieren

Ein technischer SEO-Audit deckt diese Punkte systematisch auf. Die konkrete Vorgehensweise ist unter SEO-Audit Rostock beschrieben.