Zum Inhalt springen
CASOON

Video SEO: Structured Data und visuelle Suche richtig einsetzen

VideoObject-Schema, Thumbnails und Transkripte – wie Videos in der Google-Suche sichtbar werden

10 Minuten
Video SEO: Structured Data und visuelle Suche richtig einsetzen
#SEO #Video #Schema.org #Webentwicklung

Warum Video SEO anders funktioniert als Text-SEO

Für Text-Inhalte wertet Google den Inhalt direkt aus — Crawler lesen HTML, verstehen Überschriften, bewerten Relevanz. Bei Videos ist das anders: Google kann den Videoinhalt nicht direkt lesen. Es greift auf Metadaten, Transkripte, Thumbnails und Seiten-Kontext zurück, um zu verstehen, worum es in einem Video geht.

Das hat eine praktische Konsequenz: Ein inhaltlich exzellentes Video, das auf einer Seite ohne strukturierte Daten, ohne Beschreibung und ohne Transkript eingebettet ist, erscheint in der Google-Videosuche kaum — nicht weil das Video schlecht ist, sondern weil Google keine Grundlage hat, es einzuordnen.

Video SEO ist damit zu einem erheblichen Teil Metadaten-Management — und das ist handwerklich erlernbar.

Was Google bei Videos tatsächlich auswertet

Bevor strukturierte Daten eingebaut werden, lohnt es sich zu verstehen, welche Signale Google bei Videos priorisiert:

Sichtbarkeit auf der Seite: Google erkennt ein Video als primären Inhalt einer Seite, wenn es above-the-fold platziert ist und mindestens ein Drittel der Seitenbreite einnimmt. Videos, die tief unten auf langen Seiten versteckt sind, werden seltener in der Videosuche gelistet.

Thumbnail: Google benötigt ein zugängliches Thumbnail-Bild, das nicht hinter einem Login oder einer Paywall liegt. Ohne Thumbnail keine Darstellung in Video-Rich-Results.

Strukturierte Daten: VideoObject-Schema ist das direkteste Signal an Google — es nennt Titel, Beschreibung, Dauer, Upload-Datum und den Thumbnail-Link explizit.

Transkript und umgebender Text: Google nutzt den Text auf der Seite — einschließlich Transkripten — um den thematischen Kontext des Videos zu verstehen.

Ladezeit: Videos, die die Seitenladezeit massiv erhöhen, können die Ranking-Basis der Seite schwächen. Lazy Loading für Video-Embeds ist kein optionaler Komfort, sondern eine Performance-Notwendigkeit.

VideoObject-Schema: Alle Pflichtfelder richtig befüllen

VideoObject ist der Schema.org-Typ für Videos. Google nutzt ihn für Video-Rich-Results in der regulären Suche und in der Google-Videosuche.

{
  "@context": "https://schema.org",
  "@type": "VideoObject",
  "name": "Wie funktioniert ein CDN? Erklärung in 5 Minuten",
  "description": "Content Delivery Networks verteilen Website-Inhalte auf Server weltweit, um Ladezeiten zu reduzieren. Dieses Video erklärt die Funktionsweise, Vorteile und typische Einsatzbereiche eines CDN anhand konkreter Beispiele.",
  "thumbnailUrl": "https://example.com/thumbnails/cdn-erklaerung-thumbnail.jpg",
  "uploadDate": "2026-03-15",
  "duration": "PT5M23S",
  "contentUrl": "https://example.com/videos/cdn-erklaerung.mp4",
  "embedUrl": "https://www.youtube.com/embed/abc123xyz",
  "publisher": {
    "@type": "Organization",
    "name": "CASOON",
    "logo": {
      "@type": "ImageObject",
      "url": "https://casoon.de/logo.png"
    }
  },
  "transcript": "Ein Content Delivery Network, kurz CDN, ist ein Netzwerk aus Servern, die über verschiedene geografische Standorte verteilt sind...",
  "hasPart": [
    {
      "@type": "Clip",
      "name": "Was ist ein CDN?",
      "startOffset": 0,
      "endOffset": 90,
      "url": "https://example.com/videos/cdn-erklaerung#t=0"
    },
    {
      "@type": "Clip",
      "name": "Wie funktioniert Caching im CDN?",
      "startOffset": 91,
      "endOffset": 210,
      "url": "https://example.com/videos/cdn-erklaerung#t=91"
    }
  ]
}

Pflichtfelder vs. empfohlene Felder

Google unterscheidet für Video Rich Results zwischen Pflichtfeldern und empfohlenen Feldern:

Pflichtfelder: name, description, thumbnailUrl, uploadDate

Empfohlen: contentUrl oder embedUrl (mindestens eines davon), duration, hasPart (für Key Moments)

Wertvolle Extras: transcript, publisher, regionsAllowed, expires

Das transcript-Feld ist offiziell kein Pflichtfeld, aber praktisch eines der wichtigsten: Google nutzt es direkt für das inhaltliche Verständnis des Videos und für Key Moment Clips in den Suchergebnissen.

Umsetzung in einer Astro-Seite

In statischen Projekten sollte das VideoObject nicht manuell in mehreren Stellen gepflegt werden. Besser ist ein kleines Datenobjekt, aus dem sowohl sichtbarer Inhalt als auch JSON-LD entstehen:

---
const video = {
  title: 'Wie funktioniert ein CDN? Erklärung in 5 Minuten',
  description:
    'Content Delivery Networks verteilen Website-Inhalte auf Server weltweit, um Ladezeiten zu reduzieren.',
  thumbnail: 'https://example.com/thumbnails/cdn-erklaerung.webp',
  uploadDate: '2026-03-15',
  duration: 'PT5M23S',
  embedUrl: 'https://www.youtube.com/embed/abc123xyz',
};

const jsonLd = {
  '@context': 'https://schema.org',
  '@type': 'VideoObject',
  name: video.title,
  description: video.description,
  thumbnailUrl: video.thumbnail,
  uploadDate: video.uploadDate,
  duration: video.duration,
  embedUrl: video.embedUrl,
};
---

<script type="application/ld+json" set:html={JSON.stringify(jsonLd)} />
<iframe src={video.embedUrl} title={video.title} loading="lazy"></iframe>

Der Vorteil: Titel, Beschreibung und Thumbnail driften nicht auseinander. Genau solche kleinen Inkonsistenzen sind in der Praxis eine häufige Ursache für Rich-Result-Probleme.

Die Hosting-Entscheidung: YouTube vs. Self-hosted

Das ist die Frage, bei der in der Praxis die meisten falschen Annahmen bestehen.

KriteriumYouTubeSelf-hosted
SEO-SichtbarkeitSehr hoch — YouTube ist die zweitgrößte SuchmaschineGeringer — Google bevorzugt YouTube in Video-Rich-Results
Kontrolle über MetadatenYouTube-Interface, eingeschränktVollständig via VideoObject-Schema
Traffic-DestinationNutzer landen auf YouTube, nicht auf der eigenen SeiteNutzer bleiben auf der eigenen Seite
KostenKostenlosCDN-Kosten für Hosting und Bandbreite
Thumbnail-KontrolleYouTube-generiert + Custom-Upload möglichVollständige Kontrolle
Performance-ImpactEmbed verursacht Third-Party-RequestsEigene Video-Infrastruktur nötig
Key MomentsAutomatisch von YouTube, erweiterbar via ChaptersNur via hasPart im VideoObject-Schema

Wann Self-hosted trotzdem sinnvoll ist

Für manche Anwendungsfälle ist Self-hosting die bessere Wahl — nicht wegen SEO, sondern wegen Kontrolle:

  • Wenn Wettbewerber-Anzeigen neben dem eigenen Video vermieden werden sollen
  • Wenn präzises Tracking (Abspieldauer, Abbruchpunkte) für Conversion-Optimierung notwendig ist
  • Wenn das Video hinter einem Login oder als Teil eines Kurssystems ausgeliefert wird
  • Wenn die YouTube-Einbettung DSGVO-relevant ist und Consent-Management aufwändig wäre

In diesen Fällen lohnt sich der Mehraufwand im VideoObject-Schema — und die Erwartung an die organische Video-Sichtbarkeit muss entsprechend angepasst werden.

Transkripte als SEO-Asset: Mehr als eine Barrierefreiheits-Maßnahme

Transkripte werden oft als Barrierefreiheits-Feature behandelt — technisch notwendig, aber SEO-irrelevant. Das ist ein Fehler. Transkripte sind textuelle Inhalte, die Google vollständig indexiert.

Transkript auf der Seite integrieren

Das Transkript sollte nicht nur im VideoObject-Schema als Feld stehen, sondern auch als sichtbarer Seiteninhalt eingebaut sein. Zwei Möglichkeiten:

Als ausklappbarer Bereich unterhalb des Videos:

<details>
  <summary>Vollständiges Transkript lesen</summary>
  <div class="transcript-content">
    <p>
      <strong>00:00</strong> — Ein Content Delivery Network, kurz CDN, ist ein Netzwerk 
      aus Servern, die über verschiedene geografische Standorte verteilt sind.
    </p>
    <p>
      <strong>00:15</strong> — Wenn ein Nutzer in München Ihre Website aufruft, liefert 
      nicht Ihr Hauptserver in Frankfurt die Inhalte, sondern ein CDN-Knoten in München.
    </p>
  </div>
</details>

Als strukturierter Abschnitt nach dem Video:

Wenn das Video den zentralen Inhalt einer Seite darstellt, kann das Transkript als vollständiger Textartikel unterhalb erscheinen. Das dupliziert den Inhalt technisch — ist aber kein Duplikats-Problem, solange die Seite eine eigene URL hat und das Transkript als primäre Textquelle gilt.

Transkript als Basis für weitere Inhalte

Ein vollständiges Transkript liefert Rohtext für weitere SEO-Assets: Zusammenfassungen als eigenständige Abschnitte, Definitionen wichtiger Begriffe als Paragraph-Snippet-Kandidaten, Zitate als Blockquotes. Das ist keine Duplicate-Content-Problematik — der Kontext ist ein anderer als das Transkript selbst.

Messung in der Search Console: Video-Impressions finden

Die Google Search Console zeigt Video-Performance im Performance-Report — aber nicht standardmäßig. Der Filter muss manuell gesetzt werden.

Workflow:

  1. Search Console öffnen → Performance → Suchergebnisse
  2. Filter „Suche: Videos” aktivieren (über das Filter-Dropdown „Alle” → „Video”)
  3. Alternativ: „Such-Typ: Video” direkt im Berichtsfilter wählen

Dieser Filter zeigt Impressionen und Klicks, die ausschließlich aus der Google-Videosuche stammen — getrennt von der regulären Web-Suche. Wenn hier keine Daten erscheinen, hat Google entweder kein VideoObject-Schema gefunden, keinen Zugang zum Thumbnail oder das Video noch nicht als primären Seiteninhalt eingestuft.

Was die Daten zeigen:

  • Impressionen: Wie oft das Video in Video-Suchergebnissen erschienen ist
  • Klicks: Wie oft darauf geklickt wurde
  • Durchschnittliche Position: Position in der Videosuche

Fehler im Rich Results Test identifizieren

Wenn Video-Impressionen ausbleiben, lohnt der Blick in das Rich-Results-Tool von Google. Häufige Fehler:

  • thumbnailUrl zeigt auf eine URL, die keinen gültigen Bildpfad zurückgibt (404 oder Redirect)
  • uploadDate im falschen Format (muss ISO 8601 sein: 2026-03-15, nicht 15.03.2026)
  • contentUrl und embedUrl fehlen beide — Google kann das Video nicht lokalisieren
  • JSON-LD ist syntaktisch fehlerhaft (fehlendes Komma, nicht geschlossene Klammer)

Diese Fehler führen dazu, dass das Schema zwar vorhanden ist, aber von Google nicht ausgewertet wird. Der Rich Results Test zeigt genau, welches Feld ein Problem hat.

Visuelle Suche: Google Lens und Thumbnails

Ein wachsender Bereich, der in Video-SEO oft übersehen wird: Google Lens und die visuelle Suche. Thumbnails von Videos erscheinen nicht nur in der Videosuche, sondern können auch in Bildsuchen und bei Google Lens-Anfragen auftauchen — wenn sie eigenständig informativ sind.

Was das in der Praxis bedeutet: Ein Thumbnail, das nur aus dem Gesicht eines Sprechers und einem Titel-Text besteht, hat in der visuellen Suche wenig Relevanz. Ein Thumbnail, das das Kernergebnis des Videos visual darstellt — ein Diagramm, ein Vorher-Nachher-Vergleich, eine Chart — erhöht sowohl die CTR im Video-Suchergebnis als auch die Auffindbarkeit über visuelle Suche.

Für die Verbindung zwischen Featured Snippets und Video-Rich-Results — insbesondere wie Sprachassistenten Video-Inhalte verwenden — liefert der Artikel Voice Search SEO: Wie strukturierte Daten die Sprachsuche dominieren weitere Perspektiven.

Thumbnails als SEO-Faktor: Was oft unterschätzt wird

Das Thumbnail ist das erste, was ein Nutzer in Video-Rich-Results sieht — vor Titel, vor Beschreibung. Es entscheidet über die Klickrate, bevor der Inhalt eine Chance hat. Und es ist ein direktes Signal an Google, das im VideoObject-Schema als thumbnailUrl hinterlegt sein muss.

Google hat klare Anforderungen an Thumbnails für Video-Rich-Results:

  • Mindestgröße: 1280×720 Pixel im 16:9-Verhältnis
  • Format: JPG, PNG oder WebP
  • Öffentlich zugänglich: keine Authentifizierung, kein Redirect
  • Inhaltlich relevant: Das Thumbnail sollte den Video-Inhalt repräsentieren, nicht irreführend sein

Häufiger Fehler: Das Thumbnail im VideoObject-Schema verweist auf eine URL, die nicht korrekt aufgelöst wird — beispielsweise weil CDN-Pfade sich nach einem Relaunch geändert haben oder das Bild nur hinter einem Cookie-Banner erreichbar ist. Google validiert die Thumbnail-URL beim Crawlen. Wenn sie nicht auflösbar ist, erscheint kein Video-Rich-Result.

Automatische vs. manuelle Thumbnails bei YouTube

Bei YouTube-Videos wird automatisch ein Thumbnail generiert — üblicherweise aus dem Mittelpunkt des Videos. Das führt in der Praxis selten zu einem optimal informierenden Bild. YouTube erlaubt das Hochladen eines Custom-Thumbnails für verifizierte Accounts. Dieses Custom-Thumbnail sollte immer eingesetzt werden — es ist einer der wenigen direkten Einflussparameter auf die Klickrate in der Suche.

Wie Video-Inhalte und Text-Inhalte sich gegenseitig stärken

Ein häufiges Missverständnis: Video und Text konkurrieren um denselben Inhalt. In der Praxis ist das Gegenteil der Fall. Seiten mit eingebettetem Video und vollständigem Textinhalt ranken für mehr Keywords als reine Video- oder reine Text-Seiten.

Der Grund: Google bewertet Seiten nach Nutzwert. Ein Video, das ein komplexes Thema erklärt, und ein Artikel, der dasselbe Thema schriftlich durchgeht, sprechen unterschiedliche Nutzerpräferenzen an. Seiten, die beides bieten, erfüllen mehr Suchabsichten gleichzeitig.

Die Kombination funktioniert am besten, wenn das Transkript nicht einfach als Rohtextblock eingefügt wird, sondern redaktionell aufbereitet ist — mit Überschriften, Callouts und internen Verlinkungen. Das Transkript als Basis, der Artikel als eigener Inhalt.

Wie strukturierte Inhalte im Zusammenspiel mit Featured Snippets funktionieren, beschreibt der Artikel Featured Snippets: Wie man Position 0 systematisch gewinnt — die dort beschriebenen Prinzipien gelten für Video-Seiten genauso wie für reine Text-Seiten.

Key Moments: Zeitstempel als Suchergebnis-Feature

Key Moments sind Zeitstempel-Clips, die direkt in den Google-Suchergebnissen erscheinen und es Nutzern ermöglichen, zu einem bestimmten Abschnitt eines Videos zu springen. Sie erscheinen als visuelle Kapitelübersicht unterhalb des Video-Snippets.

Google generiert Key Moments auf zwei Wegen:

Automatisch über YouTube-Kapitel: Wer in YouTube-Videobeschreibungen Zeitstempel im Format 00:00 Abschnittsname einträgt, aktiviert YouTube-Kapitel. Google übernimmt diese Kapitel direkt als Key Moments in den Suchergebnissen — ohne weiteres Markup.

Manuell via hasPart im VideoObject-Schema: Bei self-hosted Videos oder wenn die YouTube-Kapitel nicht ausreichen, lassen sich Key Moments über das hasPart-Feld im VideoObject-Schema explizit definieren (wie im JSON-LD-Beispiel oben gezeigt). startOffset und endOffset werden in Sekunden angegeben.

Key Moments erhöhen die Klickrate deutlich, weil Nutzer den für sie relevanten Abschnitt direkt ansteuern können, ohne das ganze Video zu starten. Das gilt besonders für längere Tutorials und Erklärvideos.

Video SEO ist kein Einmalaufwand

VideoObject-Schema einzubauen ist der Einstieg, nicht das Ende. Videos, die ranken sollen, müssen regelmäßig beobachtet werden: Erscheinen sie in Video-Rich-Results? Werden Key Moments von Google erkannt? Fällt die Klickrate trotz hoher Impressionen ab — ein Zeichen, dass das Thumbnail optimiert werden sollte?

Der systematische Ansatz ist derselbe wie bei Text-SEO: Implementieren, messen, anpassen. Strukturierte Daten beschleunigen den Prozess, weil sie Google explizite Signale geben — aber sie ersetzen nicht den Inhalt. Ein Video, das Nutzern keine echte Antwort gibt, wird trotz perfektem Schema keine dauerhaften Rankings aufbauen.