Klassische Suchmaschinen-Bots und KI-Bots haben grundlegend verschiedene Ziele – und brauchen verschiedene Strategien
SerieBots & KI-Sichtbarkeit
Teil 1 von 4
Das alte mentale Modell funktioniert nicht mehr
Für viele Jahre war die Antwort auf die Frage “Welche Bots sollen auf meine Website?” einfach: Google erlauben, Bing erlauben, den Rest sorgfältig prüfen oder pauschal blockieren. Dieses Modell hatte eine klare Logik. Suchmaschinen-Bots liefern Traffic zurück. Alles andere kostet Bandbreite, ohne Gegenwert.
Diese Logik ist nicht falsch – sie ist nur unvollständig geworden.
Seit 2023 gibt es eine neue Kategorie von Crawlern: KI-Bots. GPTBot von OpenAI, ClaudeBot von Anthropic, PerplexityBot, Bingbot mit AI-Funktion. Sie crawlen das Web, aber nicht, um Suchergebnisse zu befüllen. Sie folgen einer fundamental anderen Logik – mit anderen Zielen, anderen Implikationen und anderen Erfolgsmetriken.
Wer das nicht trennt, optimiert für eine Welt, die es so nicht mehr gibt.
Zwei Crawler-Typen im Vergleich
Der schnellste Weg, den Unterschied zu verstehen, ist ein direkter Vergleich der wichtigsten Bots:
| Bot | Betreiber | Ziel | Ergebnis für Nutzer | Traffic zurück? |
|---|---|---|---|---|
| Googlebot | Suchindex befüllen | Liste von Links | Ja – Klicks | |
| Bingbot | Microsoft | Suchindex befüllen | Liste von Links | Ja – Klicks |
| GPTBot | OpenAI | KI-Training | Besseres Modell | Nein |
| OAI-SearchBot | OpenAI | ChatGPT Browse | Direkte Antwort | Selten – Zitation |
| ClaudeBot | Anthropic | KI-Training + Claude.ai | Besseres Modell | Nein |
| PerplexityBot | Perplexity | Echtzeit-Antworten | Direkte Antwort mit Quellen | Selten – Zitation |
| Google-Extended | Gemini Training | Besseres Modell | Nein | |
| Applebot-Extended | Apple | Apple Intelligence | Apple-Produkte | Nein |
Die Tabelle zeigt das grundlegende Problem: Nur Googlebot und Bingbot liefern Traffic im klassischen Sinne zurück. Alle anderen KI-Bots verarbeiten Inhalte, ohne dass Nutzer auf eine Seite weitergeleitet werden – oder nur selten, als Zitation.
Klassische Bots: Der bekannte Kreislauf
Googlebot, Bingbot, und verwandte Crawler folgen einer bekannten Schleife: Sie crawlen Inhalte, übergeben sie an den Index, und die Suchmaschine entscheidet, für welche Suchanfragen welche Seiten erscheinen. Wenn ein Nutzer googelt, bekommt er eine Liste von Links. Er klickt auf einen Link. Traffic fließt zurück.
Das ist das Grundprinzip, das seit 25 Jahren funktioniert. Seiten, die Googlebot zugelassen haben und gut optimiert sind, erhalten Besucher.
Googles AI Overviews (früher SGE) und ähnliche Formate verwischen die Grenzen etwas – KI-generierte Zusammenfassungen erscheinen direkt in der Suchergebnisseite, ohne dass Nutzer klicken müssen. Studien zeigen, dass Suchanfragen mit AI Overviews bis zu 34% weniger Klicks generieren als klassische Ergebnisse. Das klassische Modell erodiert – aber es gilt noch.
Dieses System bleibt Pflichtprogramm. Wer Googlebot blockiert, verschwindet aus den Suchergebnissen.
KI-Bots: Eine andere Logik
GPTBot, ClaudeBot, PerplexityBot und ähnliche Crawler haben ein anderes Ziel. Sie crawlen das Web für zwei Zwecke:
Trainingsdaten. Inhalte werden gesammelt, um Sprachmodelle zu trainieren oder weiterzuentwickeln. Dabei geht es um Sprachqualität, thematische Breite, Faktendichte. GPTBot und ClaudeBot fallen hauptsächlich in diese Kategorie. Sie saugen Inhalte auf – und geben nichts direkt zurück.
Antwortgenerierung. Einige Systeme – besonders Perplexity und die Browse-Funktionen von ChatGPT und Claude – crawlen aktiv, um aktuelle Antworten zu generieren. Nutzer stellen eine Frage, das System durchsucht das Web in Echtzeit und synthetisiert eine Antwort. Dabei werden Quellen zitiert – aber Nutzer klicken selten.
Wie KI-Bots crawlen – und was sie suchen
Klassische Suchmaschinen-Bots crawlen breit und tief: alle Seiten, alle Unterseiten, alle verlinkten Ressourcen. Ziel ist Vollständigkeit für den Index.
KI-Bots crawlen anders. Sie bevorzugen:
- Inhaltsdichte Seiten – lange Artikel, Erklärungen, Anleitungen. Seiten mit wenig Text werden schnell wieder verlassen.
- Klare Struktur – Überschriften, Listen, Absätze. Was für Menschen gut lesbar ist, ist für LLMs gut verarbeitbar.
- Faktenreicher Content – Zahlen, Namen, Zusammenhänge. LLMs lernen aus Inhalten, die präzise und verifizierbar sind.
- Autorität und Zitierbarkeit – Inhalte, die selbst zitiert werden, landen eher in Trainingsdaten und werden eher als Quelle verwendet.
Das hat eine direkte Konsequenz: Oberflächliche SEO-Texte, die für Keywords optimiert aber inhaltlich dünn sind, sind für KI-Bots wertlos. Hochwertige, tiefe Inhalte – die im klassischen SEO nicht immer die höchsten Rankings erzielen – sind für LLM-Sichtbarkeit deutlich relevanter.
Der zentrale Unterschied: Transaktion vs. Extraktion
Bei Suchmaschinen ist der Mechanismus transaktional: Inhalte werden indexiert, Nutzer suchen, Traffic fließt. Messung ist einfach: Rankings, Klicks, Impressions.
Bei KI-Bots ist der Mechanismus extraktiv: Inhalte werden verarbeitet, KI-Systeme generieren Antworten, Quellen werden gelegentlich zitiert – oder auch nicht. Nutzer sehen die Antwort, klicken oft keinen Link.
Das bedeutet konkret:
- Eine Seite kann als hochwertige Quelle in ChatGPT zitiert werden, ohne einen einzigen Klick zu generieren
- Eine Seite kann für Millionen Anfragen relevant sein, ohne dass Google Analytics das registriert
- Klassische SEO-Metriken – Rankings, organischer Traffic, Click-through-Rate – erfassen diese Dimension nicht
- Brand-Awareness entsteht durch Zitation, auch ohne messbaren Traffic
Wie man heute messen kann, ob man zitiert wird
Weil es kein natives Tracking gibt, behilft man sich mit manuellen Methoden:
Direkte Befragung von KI-Systemen. Anfragen wie “Was sind die besten Quellen zu [Thema]?” oder “Erkläre [Thema] und nenne Quellen” geben Hinweise. Das ist nicht skalierbar, aber ein erster Orientierungspunkt.
Brand-Monitoring in KI-Outputs. Tools wie Profound oder Otterly beginnen, KI-Antworten auf Markenerwähnungen zu überwachen. Der Markt ist noch jung, aber die Richtung ist klar.
Referrer-Analyse. Perplexity und einige andere KI-Systeme senden teilweise erkennbare Referrer-Header. In Google Analytics oder ähnlichen Tools lässt sich nach perplexity.ai und ähnlichen Domains filtern.
Crawler-Logs. Server-Logs zeigen, welche Bots wann was gecrawlt haben. Das gibt keinen Hinweis auf Zitation, aber auf Interesse.
Kein Ansatz ist vollständig. Der Stand 2026 ist: KI-Sichtbarkeit lässt sich grob beobachten, aber nicht präzise messen. Das wird sich ändern – aber wer jetzt keine Basisdaten aufbaut, hat später keinen Vergleichswert.
Warum beides separat gedacht werden muss
Das Problem mit dem alten mentalen Modell ist nicht, dass es falsch war – es ist, dass es unvollständig ist. Die Frage “Soll ich KI-Bots erlauben?” lässt sich nicht mit demselben Framework beantworten wie “Soll ich Googlebot erlauben?”.
Klassische SEO-Bots brauchen Zugang zu Inhalten, um Traffic zurückzuliefern. Die Strategie ist klar: Zugang gewähren, Inhalte optimieren, Rankings beobachten.
KI-Bots folgen einem anderen Kalkül:
- Wer sie blockiert, schützt seinen Content vor Verarbeitung – verliert aber die Chance, als Quelle zitiert zu werden
- Wer sie pauschal erlaubt, akzeptiert, dass Inhalte verarbeitet werden – erhält dafür möglicherweise Sichtbarkeit in KI-Antworten
- Wer sie selektiv managt, unterscheidet zwischen Trainings-Bots und Antwort-Bots, zwischen verifizierten und unverifizierten Crawlern
Die technische Grundlage für selektives Management ist robots.txt – kombiniert mit dem neueren llms.txt-Format, das speziell für KI-Systeme gedacht ist. Für Astro-Projekte gibt es dafür astro-crawler-policy: ein Build-Zeit-Plugin, das robots.txt und llms.txt aus einer typisierten Konfiguration generiert – mit Presets, einer Bot-Registry und Audit-Warnungen. Mehr dazu in Teil 3 der Serie.
Welche Strategie sinnvoll ist, hängt vom Kontext ab:
- Content-Publisher mit Werbemodell sind stärker bedroht durch Zero-Click – KI-Antworten ersetzen Seitenbesuche, die Einnahmen generieren würden
- B2B-Anbieter mit Experteninhalten profitieren von KI-Sichtbarkeit – Zitationen erzeugen Vertrauen, auch ohne direkten Traffic
- E-Commerce hat wenig von KI-Crawling für Produktseiten – hier bleibt klassisches SEO dominant
- Fachpublikationen und Agenturen mit tiefen, citable Inhalten haben gute Ausgangsbedingungen für LLM-SEO
Was als nächstes kommt
Diese Serie behandelt die wichtigsten Dimensionen des Themas in vier Teilen:
- Teil 2 vergleicht Blockieren, selektiv erlauben und aktiv optimieren – mit konkreten Trade-offs pro Geschäftsmodell
- Teil 3 erklärt die technische Umsetzung: robots.txt, Cloudflare Bot Management und was der Unterschied zwischen Deklaration und Durchsetzung ist
- Teil 4 geht auf LLM-SEO ein: Was Content tun muss, damit er nicht nur gecrawlt, sondern als Quelle zitiert wird
Das Ziel ist nicht eine universelle Antwort – sondern das Framework, mit dem die richtige Antwort für den jeweiligen Kontext ableitbar ist.