RAG in der Praxis: Wie Agenturen ihr Wissen endlich nutzbar machen

Warum generische KI-Nutzung nicht reicht

Die meisten Teams nutzen KI wie einen besseren Google-Ersatz: Frage rein, Antwort raus. Nützlich – aber weit unter dem Potenzial.

Der eigentliche Hebel entsteht erst, wenn KI mit dem eigenen Wissen arbeitet. Mit den Dokumenten, Daten und Entscheidungen, die im Unternehmen tatsächlich existieren.

Hier vier konkrete Szenarien, die zeigen, wie das in der Praxis aussieht.

Szenario 1 – SEO-Wissenscontainer

Das Problem

SEO-Arbeit erzeugt große Datenmengen: Search Console Exporte, Keyword-Recherchen, Wettbewerbsanalysen, Kundenbriefings, Audit-Reports. Diese Daten liegen in verschiedenen Formaten an verschiedenen Orten. Wer eine strategische Frage beantworten will, muss erst 20 Minuten suchen.

Die RAG-Lösung

Alle SEO-relevanten Dokumente eines Kunden oder Projekts werden in eine gemeinsame Wissensbasis geladen:

Search Console CSV-Exporte
Keyword-Recherchen aus Sistrix, Ahrefs oder SEMrush
Wettbewerbsanalysen
Content-Audits
Kundenbriefings und Zieldefinitionen

Das Ergebnis

Statt Daten manuell zu korrelieren, stellt man Fragen:

„Welche Keywords haben wir im letzten Quartal verloren, die thematisch zu unserem neuen Produktbereich passen?”
„Wo überschneiden sich die Top-Rankings unserer drei Hauptwettbewerber mit unseren schwächsten Seiten?”
„Erstelle einen Content-Plan basierend auf den Keyword-Gaps und dem Kundenbriefing.”

Der Unterschied: Man geht nicht mehr von Keywords aus, sondern von Zusammenhängen in den eigenen Daten. Das ist im Kern ein internes SEO-KI-System – nicht als Produkt gekauft, sondern aus eigenen Daten aufgebaut.

Umsetzung

Datenquellen sammeln Search Console Export, Keyword-Recherchen, Wettbewerbsanalysen, Kundenbriefings

RAG-Wissensbasis aufbauen Alle Quellen in einer Vektordatenbank zusammenführen

Fragen stellen und Strategien generieren KI beantwortet Fragen auf Basis der eigenen Daten

Setup (einmalig): Datenquellen aggregieren, Vektordatenbank aufbauen, Quellenstruktur definieren.

Betrieb (laufend): Wöchentliche Imports aktueller Search Console Daten, gezielte Abfragen bei strategischen Entscheidungen.

Stufe 1: Alle Dokumente in ein NotebookLM-Notebook laden. Funktioniert für einzelne Projekte sofort.

Stufe 2: Python-Script, das wöchentlich Search Console Daten exportiert und in die Vektordatenbank lädt. Automatisierte Anomalie-Erkennung.

Szenario 2 – Kundenprojekte als Wissenscluster

Das Problem

In Agenturen ist Projektwissen verteilt: Briefings in E-Mails, Designs in Figma, technische Spezifikationen in Confluence, Entscheidungen in Slack-Threads. Wissen geht verloren, sobald jemand das Projekt verlässt oder Threads untergehen. Wenn ein neuer Kollege übernimmt, dauert das Onboarding Tage.

Die RAG-Lösung

Pro Kundenprojekt wird ein Wissenscluster aufgebaut:

Briefing-Dokumente
Meeting-Protokolle
Technische Entscheidungen (ADRs)
Design-Feedback und Iterationshistorie
Vertragsdetails und Scope-Definitionen

Das Ergebnis

„Was waren die drei Hauptgründe für die Entscheidung gegen Next.js in diesem Projekt?”
„Fasse die Designänderungen der letzten zwei Sprints zusammen.”
„Welche offenen Punkte aus dem letzten Kundencall sind noch nicht umgesetzt?”

Kein Suchen mehr in fünf verschiedenen Tools. Eine Frage, eine konsolidierte Antwort mit Quellenangabe. Historische Entscheidungen werden nachvollziehbar – inklusive Begründung. Das ist ein echter Agentur-Painpoint, der sich damit direkt adressieren lässt.

Umsetzung

Stufe 1: Ein NotebookLM-Notebook pro Kunde. Meeting-Notizen, Briefings und wichtige E-Mails hochladen. Minimal-Aufwand, sofortiger Nutzen.

Stufe 2: Automatisierte Pipeline, die Confluence-Seiten und Notion-Datenbanken synchronisiert. Slack-Threads können über die API exportiert werden.

Szenario 3 – Technische Dokumentation als Wissensbasis

Das Problem

Entwickler verbringen einen erheblichen Teil ihrer Zeit mit dem Lesen von Dokumentation. API-Docs, Framework-Guides, interne Spezifikationen, GitHub-Readmes. Jedes Mal: Tab öffnen, Ctrl+F, scrollen, den relevanten Abschnitt finden, verstehen, anwenden.

Die RAG-Lösung

Alle relevanten technischen Dokumente werden indiziert (über Embeddings in einer Vektordatenbank) und abfragbar gemacht:

Framework-Dokumentation (Astro, Svelte, React)
Interne API-Spezifikationen
Architecture Decision Records (ADRs)
GitHub-Readmes der genutzten Libraries
Eigene Code-Kommentare und README-Dateien

Das Ergebnis

Statt Dokumentation zu lesen, wird sie befragt:

„Wie konfiguriere ich Content Collections in Astro 5 mit dem Loader-Pattern?”
„Welche Breaking Changes gibt es zwischen Svelte 4 und 5, die unsere Komponenten betreffen?”
„Zeige mir alle Stellen in unserer API-Dokumentation, die sich auf Authentifizierung beziehen.”

Die Antworten basieren auf den tatsächlichen Docs – nicht auf dem, was das Modell aus dem Training kennt. Besonders wertvoll bei Legacy-Projekten oder wenn mehrere Frameworks gleichzeitig im Einsatz sind.

Umsetzung

Stufe 1: Relevante Docs als PDF oder Markdown in NotebookLM laden. Besonders nützlich bei Migration auf neue Framework-Versionen.

Stufe 2: Ein lokales RAG-System, das automatisch die Docs der verwendeten npm-Pakete indiziert. Denkbar als VS-Code-Extension oder CLI-Tool.

# Beispiel: Docs eines npm-Pakets automatisch laden
import subprocess
import json

def get_package_docs(package_name):
    """Lädt README und Docs eines npm-Pakets."""
    result = subprocess.run(
        ["npm", "view", package_name, "readme"],
        capture_output=True, text=True
    )
    return result.stdout

Szenario 4 – Strukturiertes Lernen und Weiterbildung

Das Problem

Neue Technologien, Frameworks, Konzepte – die Lernkurve in der Softwareentwicklung ist steil. Tutorials auf YouTube sind lang. Dokumentationen sind umfangreich. Bücher sind komplett. Aber die Zeit ist begrenzt.

Die RAG-Lösung

Lernmaterial wird in eine persönliche Wissensbasis geladen:

Buchkapitel zu einem Thema
Konferenz-Transkripte
Fachartikel und Whitepapers
Eigene Notizen und Zusammenfassungen

Das Ergebnis

Statt passiv Inhalte zu konsumieren, arbeitet man aktiv mit seinen Quellen. Lernen wird interaktiv statt linear:

„Erkläre mir das Observer-Pattern anhand der Beispiele aus meinen drei Quellen.”
„Vergleiche die Ansätze zu State Management, die in meinen Quellen beschrieben werden.”
„Erstelle ein Quiz zu den Kernkonzepten von Kapitel 3-5.”

Das ist kein Ersatz fürs Lernen. Aber es ist ein Beschleuniger, der hilft, große Mengen Material strukturiert zu erschließen – und das eigene Verständnis aktiv zu testen.

Umsetzung

Stufe 1: NotebookLM. Buchkapitel als PDF hochladen, dazu eigene Zusammenfassungen. Audio-Overviews als Podcast-Alternative zum Lesen.

Gemeinsame Muster

Alle vier Szenarien folgen dem gleichen Grundprinzip:

Kuratieren: Relevante Dokumente bewusst zusammenstellen
Strukturieren: In ein RAG-fähiges Format bringen
Abfragen: In natürlicher Sprache mit dem Wissen arbeiten
Iterieren: Wissensbasis kontinuierlich erweitern und pflegen

Der Unterschied zur generischen KI-Nutzung: Man arbeitet nicht mit dem Wissen der Welt, sondern mit dem eigenen Wissen. Das ist spezifischer, aktueller und direkt handlungsrelevant.

Typische Fehler

Grenzen von RAG

RAG ist kein Allheilmittel. Ein paar Einschränkungen, die man kennen sollte:

Garbage in, garbage out. Die Qualität der Antworten hängt direkt von der Qualität der Dokumente ab. Unstrukturierte, veraltete oder widersprüchliche Quellen ergeben unstrukturierte, veraltete oder widersprüchliche Antworten.

Kein echtes Verstehen. RAG sucht relevante Textpassagen und gibt sie dem Modell als Kontext. Das Modell formuliert daraus eine Antwort – aber es „versteht” die Dokumente nicht in dem Sinne, wie ein Mensch ein Thema durchdenkt. Implizites Wissen, das nirgendwo dokumentiert ist, bleibt unsichtbar.

Kuratierungsaufwand. Eine gute Wissensbasis braucht Pflege. Wer alte Dokumente nicht entfernt oder aktualisiert, schleppt veraltetem Kontext mit.

Das sind keine Gründe, RAG nicht einzusetzen. Aber es sind Gründe, es mit klaren Erwartungen einzusetzen.

Datenschutz: Was in NotebookLM nichts zu suchen hat

NotebookLM ist in diesem Artikel exemplarisch – als schnellster Einstieg, um das Konzept zu verstehen und sofort einen ersten Mehrwert zu spüren. Es ist kein Produktivsystem.

Konkret: NotebookLM ist ein Google-Dienst, gehostet in den USA. Wer dort Dokumente hochlädt, gibt sie in eine US-Cloud – mit allen datenschutzrechtlichen Konsequenzen. Für öffentlich verfügbare Framework-Docs oder eigene, nicht-sensible Notizen ist das unkritisch. Für Kundendaten, Verträge, personenbezogene Informationen oder NDA-geschützte Inhalte gilt das nicht.

Meine Empfehlung für den produktiven Einsatz: Mistral.

Nicht wegen des Hypes, sondern weil Mistral mehrere DSGVO-relevante Fragen per Design klärt: EU-Unternehmensstandort (Paris), Self-Hosting der Open-Weight-Modelle auf eigener Infrastruktur, keine Datenweitergabe an US-Dienste. Wer RAG mit echten Kundendaten betreiben will, bekommt damit eine Lösung, bei der die Datenschutzarchitektur von Anfang an stimmt – nicht nachträglich geflickt.

Wie RAG konkret mit Mistral funktioniert – Embeddings, Bibliotheken, Self-Hosted-Setup – behandle ich in der Mistral & Vibe CLI-Serie. Artikel zu RAG mit Mistral und zum datenschutzkonformen Deployment sind bereits in Vorbereitung.

Wer tiefer einsteigen will, wie man KI-Tools datenschutzkonform einsetzt:

KI nutzen ohne Datenrisiko – so arbeitest du als Entwickler sauber – Cloud-KI produktiv einsetzen, ohne Kundendaten oder Code zu gefährden
EU-konforme KI im Mittelstand: 3 Architektur-Optionen ohne Buzzword-Bingo – Self-Hosted, Hybrid oder EU-Cloud im nüchternen Vergleich
„Die Daten sind sicher.” – Copilot, Cowork und die Realität im Microsoft-Tenant – Was passiert, wenn eine KI plötzlich alle bestehenden Rechte effizient nutzt

Wo anfangen?

Die Empfehlung ist immer dieselbe: Klein starten, schnell validieren.

Gute erste Kandidaten:

Ein SEO-Projekt mit vielen verstreuten Daten
Ein laufendes Kundenprojekt mit komplexer Entscheidungshistorie
Eine aktuelle Migration auf ein neues Framework

Nimm ein konkretes Problem. Lade die relevanten Dokumente in NotebookLM – das reicht für den ersten Test mit unkritischen Inhalten. Stelle die Fragen, die du sonst manuell recherchieren würdest. Wenn der Mehrwert spürbar ist, ist der nächste Schritt die Migration auf Mistral für den produktiven Betrieb.

Der häufigste Fehler: Ein „KI-Wissenssystem” als Großprojekt planen, statt mit einem Notebook und zehn PDFs zu starten.

Im nächsten Artikel gehen wir einen Schritt zurück und stellen eine kritische Frage: Reduziert RAG wirklich Halluzinationen – oder verschiebt es das Problem nur?