Warum Knowledge-Container wichtiger werden als Prompts

Die Prompt-Engineering-Illusion

2023 war das Jahr des Prompt Engineering. Jeder hatte Tipps: „Schreib dem Modell, es sei ein Experte.” „Nutze Chain-of-Thought.” „Füge Beispiele hinzu.” LinkedIn war voll mit „Top 10 Prompts, die dein Business verändern.” Prompt-Engineer-Jobs wurden mit sechsstelligen Gehältern ausgeschrieben.

Prompt Engineering ist nicht nutzlos. Aber es wird massiv überschätzt. Und inzwischen gibt es handfeste Evidenz dafür.

Im März 2024 veröffentlichten Rick Battle und Teja Gollapudi von VMware eine Studie, die das Fundament erschütterte: Sie testeten drei Open-Source-Modelle mit jeweils 60 verschiedenen Prompt-Kombinationen an Mathematikaufgaben auf Grundschulniveau. Das Ergebnis war ernüchternd: Chain-of-Thought half manchmal und schadete manchmal. Die Konsistenz war erschreckend gering. Automatisch generierte Prompts schlugen menschlich optimierte in fast jedem Fall – und die Auto-Prompts waren „so bizarr, dass kein Mensch je auf sie gekommen wäre”. Battles Schlussfolgerung: Kein Mensch sollte Prompts noch manuell optimieren.

Das Paper hieß „The Unreasonable Effectiveness of Eccentric Automatic Prompts” und es markierte den Anfang vom Ende einer Illusion.

Warum Prompts eine Oberflächenlösung sind

Ein Prompt ist eine Anweisung an ein Modell. Er steuert, wie das Modell antwortet – Ton, Format, Perspektive, Detailtiefe. Was er nicht steuert: womit das Modell antwortet.

Ein perfekt formulierter Prompt an ein Modell ohne relevanten Kontext liefert eine perfekt formulierte Antwort auf Basis von Trainingsdaten. Das kann gut sein. Oder komplett daneben. Prompt Engineering ist wie einem Koch zu sagen, er soll das Gericht elegant anrichten. Context Engineering ist, ihm die richtigen Zutaten zu geben.

Moderne Frontier-Modelle verstärken diesen Effekt. Claude, GPT-5 und Gemini 3 sind deutlich robuster gegenüber Prompt-Variationen als ihre Vorgänger. Sie inferieren Intent aus minimalem Kontext, tolerieren Tippfehler und fragen bei Unklarheiten nach. Die Sensitivität gegenüber der exakten Formulierung sinkt – die Sensitivität gegenüber der Qualität des Kontexts steigt.

Die Prompt-Engineering-Ära hat sich sauber in zwei Bereiche aufgespalten: Casual Prompting, das jeder kann, weil Modelle besser darin geworden sind, Absichten zu verstehen. Und Production Context Engineering – eine echte Ingenieurdisziplin.

Der Aufstieg von Context Engineering

Im Juni 2025 passierte ein Benennungswechsel, der mehr als Semantik war.

Walden Yan, Ingenieur bei Cognition AI (den Machern von Devin, dem autonomen Coding-Agent), beschrieb Context Engineering als „das nächste Level von Prompt Engineering – die Kunst, Kontext automatisch in einem dynamischen System bereitzustellen”. Er nannte es „effektiv der wichtigste Job von Ingenieuren, die KI-Agenten bauen”.

Zwei prominente Stimmen griffen das sofort auf:

Tobi Lutke (Shopify CEO): „Ich mag den Begriff Context Engineering deutlich lieber als Prompt Engineering. Er beschreibt die Kernkompetenz besser: die Kunst, dem LLM allen Kontext bereitzustellen, den es braucht, damit die Aufgabe lösbar wird.”

Andrej Karpathy: „+1 für Context Engineering statt Prompt Engineering. Leute assoziieren Prompts mit kurzen Aufgabenbeschreibungen im Alltag. Aber in jeder industrietauglichen LLM-Anwendung ist Context Engineering die delikate Kunst und Wissenschaft, das Kontextfenster mit genau den richtigen Informationen für den nächsten Schritt zu füllen.”

Karpathys Analogie ist präzise: Ein LLM ist wie eine CPU. Das Kontextfenster ist der Arbeitsspeicher. Context Engineering bedeutet, diesen Arbeitsspeicher dynamisch mit dem Richtigen zu füllen – Anweisungen, Daten, Beispiele, Werkzeuge, Gesprächsverlauf. Prompt Engineering ist eine Teilmenge davon, nicht umgekehrt.

Harrison Chase (LangChain CEO) formulierte die Definition für den Produktionskontext: „Dynamische Systeme bauen, die die richtigen Informationen und Werkzeuge im richtigen Format bereitstellen, damit das LLM die Aufgabe plausibel lösen kann.”

Gartner hat 2025 einen dedizierten Artikel veröffentlicht, der Context Engineering als Ablösung von Prompt Engineering für den Enterprise-Erfolg mit KI positioniert. Unternehmen, die in robuste Kontextarchitekturen investieren, berichten von 50 Prozent schnelleren Antwortzeiten und 40 Prozent höherer Ausgabequalität.

Knowledge-Container als strategisches Asset

Ein Knowledge-Container ist eine kuratierte, strukturierte Sammlung von Wissen, die einem KI-System als Kontext dient. Nicht eine lose Dokumentensammlung, sondern ein bewusst zusammengestelltes Paket.

Was kein Knowledge-Container ist

Die Abgrenzung ist wichtig, weil der Begriff sonst inflationär wird:

Ein Google Drive voller PDFs ist kein Knowledge-Container. Es ist eine Datenablage.
Eine Vektordatenbank ohne Kuratierung ist kein Knowledge-Container. Es ist ein Index über Chaos.
Ein Chat-Verlauf ist temporärer Kontext, kein Container.
Ein Confluence-Space, in den seit 18 Monaten niemand geschaut hat, ist kein Container. Er ist eine Altlast.

Eigenschaften guter Knowledge-Container

Eigenschaft	Beschreibung
Kuratiert	Bewusst ausgewählt, nicht alles hochgeladen
Aktuell	Regelmäßig gepflegt und aktualisiert
Strukturiert	Konsistente Formate, klare Hierarchien
Abgegrenzt	Klarer Scope, keine Vermischung von Domänen
Versioniert	Nachvollziehbar, welche Version welche Ergebnisse liefert

Was gute Container konkret enthalten

Ein Container ist kein Dokumentenfriedhof. Er enthält vier Schichten:

Primärdaten – Analytics, Search Console, CRM-Exporte, Finanzkennzahlen. Das Rohmaterial, aus dem Entscheidungen abgeleitet werden.
Regeln – SEO-Guidelines, Brand Voice, Coding-Standards, Compliance-Vorgaben. Die Leitplanken, innerhalb derer die KI operiert.
Beispiele – Gute und schlechte Outputs, Templates, Referenztexte. Sie kalibrieren die Qualität.
Ziele – Business-Kontext, OKRs, Kundenziele, Projektziele. Sie steuern die Richtung.

Beispiel: SEO-Container vs. Prompt

Ohne Container (nur Prompt):

Du bist ein SEO-Experte. Analysiere die Website example.com
und erstelle eine Content-Strategie für Q3. Berücksichtige
aktuelle Trends und Best Practices.

Das Modell antwortet mit generischem SEO-Wissen aus dem Training. Möglicherweise veraltet. Definitiv nicht spezifisch.

Mit Container (kuratierter Kontext):

Der Container enthält: aktuelle Rankings, Search Console Daten, Wettbewerbsanalyse, bisherige Content-Strategie, Kundenziele. Der Prompt kann simpel sein:

Erstelle eine Content-Strategie für Q3 basierend auf den
bereitgestellten Daten.

Die Qualität der Antwort hängt jetzt nicht mehr am Prompt, sondern am Container. Und der Container kann gepflegt, erweitert und wiederverwendet werden.

Die Zahlen: Kontext schlägt Prompt – messbar

Die Verschiebung ist nicht theoretisch. Es gibt konkrete Benchmarks – sortiert nach dem, was zählt.

Qualität

Lettria hat GraphRAG gegen klassisches vektor-basiertes RAG über vier Domänen hinweg getestet – Finanzen, Gesundheit, Industrie und Recht. Gleiche Prompts, unterschiedliche Kontextarchitektur.

Klassisches RAG 50,8 % korrekte Antworten

Graph RAG 80 % korrekte Antworten

Im Industriesektor war der Unterschied noch drastischer: 46,9 Prozent mit Vektor-RAG, 90,6 Prozent mit GraphRAG – eine Verdopplung der Genauigkeit. Gleicher Prompt. Besserer Kontext. Das ist der ganze Unterschied.

Der LangChain-Report „State of Agent Engineering” (1.340 Befragte, Ende 2025) bestätigt das Muster: 57 Prozent der Unternehmen haben KI-Agenten in Produktion. Aber 32 Prozent der großen Unternehmen nennen „Qualität” als größte Hürde bei der Skalierung. Die meisten Qualitätsprobleme werden nicht auf Modell-Fähigkeiten zurückgeführt, sondern auf schlechtes Kontextmanagement.

Geschwindigkeit

LinkedIn konnte die Support-Auflösungszeiten um 28,6 Prozent reduzieren – durch besseren Kontext, nicht durch bessere Prompts. Die Retrieval-Präzision verbessert sich um 15 bis 30 Prozent durch Hybrid Search und Reranking – alles Optimierungen auf der Kontextebene.

ROI

RAG-Projekte erwirtschaften im Schnitt 3,70 Dollar für jeden investierten Dollar. Der Markt reagiert entsprechend: Das Volumen für KI-gestütztes Wissensmanagement wächst mit 46,7 Prozent jährlich – von 7,7 Milliarden Dollar (2025) auf 11,2 Milliarden Dollar (2026). Der RAG-Markt selbst wächst mit 49 Prozent jährlich und soll bis 2030 ein Volumen von 11 Milliarden Dollar erreichen.

RAG-Architekturen 2026: Der Stand der Technik

Standard-RAG – „hole die Top-k Chunks, packe sie in den Kontext” – gilt 2026 als veraltet. Die Landschaft hat sich in spezialisierte Architekturen aufgefächert.

RAG-Architekturen 2026

RAG-Systeme

Agentic RAG

Orchestration Layer

Planner (Sub-Task Dekomposition)

Retriever + Reranker

Tool Agent

Reasoner (Reflexion + Korrektur)

Graph RAG

Knowledge Graph Layer

Multi-Hop Reasoning

Beziehungsbasierte Abfragen

Corrective RAG (CRAG)

Retrieval Evaluator

Dynamische Websuche als Fallback

Hybrid RAG (Produktions-Standard)

Vektorsuche + BM25 Keyword-Suche

Metadata Filtering

Cross-Encoder Reranking

Agentic RAG ist das dominante Muster in Produktion. Autonome Agenten planen, suchen, bewerten, korrigieren und reflektieren in Schleifen – statt einmal zu suchen und blind zu generieren. LangGraph ist das häufigste Orchestrierungswerkzeug.

Ein konkretes Beispiel macht das greifbar:

Anfrage: „Warum sind unsere Conversions im März gefallen?”

Planner Zerlegt die Frage in Teilaufgaben

Retriever Zieht Analytics-Daten und Kampagnenänderungen

Tool Agent Vergleicht Traffic-Quellen, prüft Landingpages

Reasoner Validiert Hypothesen, korrigiert sich selbst

Der Agent sucht nicht einmal und generiert blind. Er plant, holt Daten aus mehreren Quellen, vergleicht, bildet Hypothesen – und korrigiert sich, wenn die erste Hypothese nicht aufgeht. Das ist der Unterschied zwischen „Top-5-Chunks in den Prompt packen” und einem System, das tatsächlich recherchiert.

Graph RAG fügt eine Wissensgraph-Schicht hinzu, die Multi-Hop-Reasoning über verbundene Entitäten ermöglicht. Abfragen wie „Welche Compliance-Risiken bestehen über alle unsere Lieferantenverträge hinweg?” werden mit vollständiger Nachvollziehbarkeit beantwortet.

Corrective RAG (CRAG) führt einen leichtgewichtigen Evaluator ein, der die Qualität abgerufener Dokumente prüft. Sind die Ergebnisse unzureichend oder widersprüchlich, schaltet das System dynamisch auf Websuche um.

Hybrid RAG ist der Produktionsstandard geworden: Vektorähnlichkeitssuche kombiniert mit Keyword-basiertem BM25, plus Reranker und Metadaten-Filterung. Die Teams, die erwartet hatten, dass Vektoren „einfach funktionieren”, haben am Ende lexikalische Suche, Filterung und handoptimierte Regeln nachgerüstet.

Eine Unterscheidung ist hier wichtig: Knowledge-Container und Retrieval lösen unterschiedliche Probleme. Der Container entscheidet, was überhaupt gefunden werden kann. Das Retrieval entscheidet, wie es geholt wird. Das beste Retrieval-System hilft nicht, wenn der Container Müll enthält.

Knowledge-Container in der Praxis: Entwicklertools

Die greifbarsten Beispiele für Knowledge-Container sind nicht in Enterprise-Systemen, sondern in Entwicklertools. Jedes relevante KI-Coding-Tool hat inzwischen einen Mechanismus für persistenten, strukturierten Kontext.

Tool	Kontextdatei	Funktion
Claude Code	`CLAUDE.md`	Projektarchitektur, Konventionen, Workflow-Regeln
Cursor	`.cursorrules`	Persistenter Kontext, weniger expressiv
GitHub Copilot	`.github/copilot-instructions.md`	Repository-spezifische Anweisungen
Windsurf	`.windsurfrules`	Ähnlich wie Cursor

Diese Dateien sind Knowledge-Container in Reinform: kuratiert, strukturiert, versioniert, domänenbegrenzt. Sie werden nicht bei jeder Interaktion neu geschrieben, sondern gepflegt und erweitert. Die KI wird besser, weil der Kontext besser wird – nicht weil jemand den Prompt optimiert.

AGENTS.md: Der universelle Standard

Im August 2025 veröffentlichte OpenAI AGENTS.md als universellen Standard für KI-Projekt-Kontext. Seitdem ist er von über 60.000 Open-Source-Projekten übernommen worden und wird von Cursor, Devin, Gemini CLI, GitHub Copilot und VS Code unterstützt.

Im Dezember 2025 wurde AGENTS.md zusammen mit dem Model Context Protocol (MCP) an die Linux Foundation übergeben – über die neu gegründete Agentic AI Foundation, mitgegründet von Anthropic, Block und OpenAI. Der Schritt ist bemerkenswert: Drei Wettbewerber einigen sich auf einen Standard für Kontextbereitstellung. Das zeigt, wie zentral das Problem ist.

MCP: Das USB-C für KI

Das Model Context Protocol (MCP), ursprünglich von Anthropic im November 2024 angekündigt, ist zum De-facto-Standard geworden, über den KI-Systeme auf externe Datenquellen zugreifen. Im März 2025 übernahm OpenAI MCP für den Agents SDK und ChatGPT Desktop. Im April 2025 bestätigte Google DeepMind MCP-Support für Gemini. Anfang 2026 existieren über 10.000 aktive öffentliche MCP-Server.

MCP ist der technische Unterbau für Knowledge-Container im großen Maßstab: Statt Wissen in das Kontextfenster zu kopieren, verbindet MCP das Modell direkt mit der Datenquelle – strukturiert, standardisiert, mit klaren Schnittstellen.

Shopify als Blaupause

Shopify unter Tobi Lutke ist das am häufigsten zitierte Beispiel für organisationale KI-Adoption. Und der Ansatz illustriert die Verschiebung von Prompts zu Kontext perfekt.

Im April 2025 verschickte Lutke ein internes Memo: „Der reflexartige Einsatz von KI ist ab jetzt Grunderwartung.” Teams müssen nachweisen, warum KI eine Aufgabe nicht erledigen kann, bevor sie zusätzliche Mitarbeiter anfordern. KI-Kompetenz fließt in Performance-Reviews und Einstellungsgespräche ein.

Die Infrastruktur dahinter: Shopify betreibt über 24 interne MCP-Server, die KI-Tools mit strukturiertem Unternehmenswissen versorgen. Alle Mitarbeiter haben Zugang zu GitHub Copilot, Cursor und Claude Code. Der Fokus liegt nicht auf Prompt-Training, sondern auf Wissensinfrastruktur.

Lutkes Framing ist explizit: Die Kernkompetenz ist „allen Kontext bereitzustellen” – nicht „den perfekten Prompt zu schreiben”.

Karpathys Gegenmodell: Struktur statt Pipeline

Andrej Karpathy demonstriert einen radikal anderen Ansatz: ein persönliches Wiki aus circa 100 Artikeln mit rund 400.000 Wörtern. Ein LLM kompiliert, verlinkt und validiert die Inhalte in strukturiertem Markdown.

Das Bemerkenswerte: Keine Vektordatenbank, keine RAG-Pipeline, kein Embedding-Modell. Nur gut strukturierter Kontext. Jede Aussage lässt sich auf eine konkrete Markdown-Datei zurückführen – keine Blackbox, keine Halluzinationsquelle.

Die Einschränkung muss klar sein: Das funktioniert bis zu einer bestimmten Komplexität. Bei 100 Artikeln und 400.000 Wörtern passt der relevante Kontext ins Fenster. Bei 10.000 Dokumenten oder einem Enterprise-Wissenskorpus braucht man Retrieval – dann reicht Struktur allein nicht mehr. Aber das Prinzip bleibt: Je besser der Container strukturiert ist, desto weniger Retrieval-Magie braucht man drum herum.

Minimal Setup: Morgen anfangen, ohne Infrastruktur

Wer jetzt denkt „klingt gut, aber wo fange ich an?” – die Einstiegshürde ist niedriger als erwartet. Man braucht keine Vektordatenbank, keinen MCP-Server, kein Enterprise-Tool. Man braucht Markdown und Disziplin.

Die Grundstruktur

knowledge/
├── ziele.md          # Business-Kontext, OKRs, Kundenziele
├── regeln.md         # Guidelines, Standards, Constraints
├── daten/
│   ├── analytics.md  # Aktuelle Kennzahlen, Trends
│   └── wettbewerb.md # Marktanalyse, Positionierung
├── beispiele/
│   ├── gut.md        # Referenz-Outputs, die funktioniert haben
│   └── schlecht.md   # Anti-Patterns, typische Fehler
└── changelog.md      # Was hat sich wann geändert

Die Regeln

Eine Markdown-Datei pro Thema, nicht pro Dokument
Klare Sections: Ziel, Kontext, Regeln, Beispiele
Keine Duplikate – eine Quelle der Wahrheit pro Thema
Versionierung im Repository (Git)
Regelmäßig reviewen: Was ist veraltet? Was fehlt?

Das klingt trivial. Aber die meisten Teams scheitern nicht an der Technik, sondern daran, dass sie nie anfangen, ihr Wissen zu strukturieren. Ein Ordner mit fünf gut gepflegten Markdown-Dateien ist mehr wert als eine Vektordatenbank über tausend ungepflegte Confluence-Seiten.

Risiken und Trade-offs

Der Artikel wäre unvollständig ohne die Schattenseiten. Context Engineering ist kein Selbstläufer.

Overfitting auf internen Kontext. Ein System, das ausschließlich internes Wissen sieht, entwickelt blinde Flecken. Es bestätigt Annahmen, statt sie zu hinterfragen. Marktveränderungen, neue Wettbewerber, veränderte Kundenbedürfnisse – all das liegt außerhalb des Containers.

Veraltete Container liefern falsche Antworten. Das ist das gefährlichste Problem. Ein Container mit veralteten Daten erzeugt Antworten, die plausibel klingen und inhaltlich falsch sind. Schlimmer als keine Antwort, weil das Vertrauen in die Quelle hoch ist.

Pflegeaufwand wird unterschätzt. Ein Container ist kein Set-and-Forget-System. Er braucht regelmäßige Reviews, Updates und Bereinigung. Wer das nicht einplant, baut eine Wissensruine.

Konflikte zwischen Quellen. Wenn der Container widersprüchliche Informationen enthält – etwa ein veraltetes Strategiedokument neben aktuellen Marktdaten – muss das Modell entscheiden, welche Quelle sticht. Ohne klare Priorisierung produziert das inkonsistente Ergebnisse.

Stanford-Forschung bestätigt: Selbst fortgeschrittene RAG-Tools haben in spezialisierten Domänen (Recht) noch Fehlerraten von 17 bis 33 Prozent. Besser als ohne RAG, aber weit entfernt von fehlerfrei.

Drei Verschiebungen

1. Von der Einzelfrage zum Wissensraum

Prompt Engineering optimiert einzelne Interaktionen. Knowledge-Container schaffen einen persistenten Wissensraum, in dem jede Interaktion besser wird – weil der Kontext besser wird.

2. Von der Formulierungskunst zur Datenstrategie

Die Frage verschiebt sich von „Wie formuliere ich die perfekte Frage?” zu „Welche Daten stelle ich dem System zur Verfügung?” Das ist eine grundlegend andere Kompetenz. Die Studie von Battle und Gollapudi zeigt: Selbst automatisch generierte, bizarre Prompts übertreffen menschliche Optimierung. Die Variable, die zählt, ist nicht die Formulierung – es sind die Daten.

3. Von einmalig zu kumulativ

Ein guter Prompt funktioniert einmal. Ein guter Knowledge-Container wird mit jeder Nutzung wertvoller – durch Feedback, neue Dokumente und verfeinerte Struktur.

2023 80 % Prompt-Qualität, 20 % Kontext-Qualität

2026 20 % Prompt-Qualität, 80 % Kontext-Qualität

Was das für verschiedene Rollen bedeutet

Für Führungskräfte

Die strategische Frage ist nicht: „Welches KI-Tool kaufen wir?” Sondern: „Wie strukturieren wir unser Unternehmenswissen, damit KI-Systeme damit arbeiten können?” Das ist eine Infrastrukturentscheidung, keine Toolfrage.

Die Zahlen untermauern die Dringlichkeit: Fortune-500-Unternehmen verlieren laut IDC jährlich rund 31,5 Milliarden Dollar durch mangelhafte Wissensteilung. Mitarbeiter verschwenden 1,8 Stunden pro Tag mit der Suche nach Informationen – das entspricht einem fünften Mitarbeiter, der ausschließlich sucht statt zu arbeiten. KI-gestützte Wissenssysteme reduzieren die Suchzeit laut McKinsey um bis zu 35 Prozent.

Für Entwickler

Technische Dokumentation, ADRs, API-Specs – alles, was gut strukturiert und aktuell ist, wird zum Rohstoff für KI-gestützte Entwicklung. Die Investition in gute Dokumentation zahlt sich jetzt doppelt aus.

Die Entwicklertools zeigen den Weg: Eine gepflegte CLAUDE.md oder AGENTS.md im Repository verändert die Qualität der KI-Ausgabe grundlegend. Nicht durch bessere Prompts, sondern durch besseren Kontext.

Für Content-Teams

Content-Strategie wird zur Wissensstrategie. Wer seine Inhalte so strukturiert, dass sie nicht nur für Menschen lesbar sind, sondern auch für KI-Systeme nutzbar, baut einen nachhaltigen Vorteil auf.

80 Prozent der Unternehmen, die KI-Modelle entwickeln, setzen auf RAG als primäre Methode – nur 20 Prozent auf Fine-Tuning. Die Qualität des Retrieval-Inputs entscheidet über die Qualität des Outputs. Wer kontrolliert, was abgerufen wird, kontrolliert die Antwort.

Für Agenturen

Agenturen verkaufen heute oft Output – SEO-Audits, Content, Kampagnen. In einer KI-gestützten Arbeitswelt verschiebt sich das: Der eigentliche Wert liegt im kuratierten Kontext. Wer über Jahre Wissen über Kunden, Branchen und Methoden aufgebaut hat, sitzt auf einem ungenutzten Asset. In Knowledge-Containern strukturiert, wird dieses Wissen direkt produktiv – nicht als „wir haben viel Erfahrung”, sondern als maschinenlesbarer Kontext, der jede KI-Interaktion verbessert.

Die provokante Version: Agenturen, die heute Output verkaufen, werden morgen kuratierten Kontext verkaufen. Wer seine Wissensbasis früh strukturiert, hat den Vorsprung.

Wissensarchitektur als neue Disziplin

Was entsteht, ist eine neue Disziplin: Wissensarchitektur für KI-Systeme. Sie kombiniert:

Informationsarchitektur (Wie strukturiere ich Wissen?)
Datenmanagement (Wie halte ich es aktuell?)
Domain-Expertise (Was ist relevant?)
KI-Verständnis (Wie verarbeitet das Modell den Kontext?)

Das ist weder reines IT noch reines Business. Es ist eine Brückenfunktion – und Unternehmen, die sie früh etablieren, werden einen messbaren Vorteil haben.

Gartner prognostiziert, dass 80 Prozent der Unternehmen bis Ende 2026 generative KI einsetzen werden – gegenüber weniger als 5 Prozent in 2023. Der Engpass wird nicht die Verfügbarkeit von Modellen sein, sondern die Verfügbarkeit von strukturiertem Wissen. Wer seine Wissensbasis heute aufbaut, hat morgen den Kontextvorteil.

Warum Prompt Engineering nicht verschwindet

Fairerweise: Prompts bleiben relevant. Sie steuern Ausgabeformat, Perspektive, Detailgrad. Ein guter Prompt macht aus einem guten Kontext eine bessere Antwort. Aber ein guter Prompt macht aus keinem Kontext keine gute Antwort.

Die Disziplin verschwindet nicht – sie wird absorbiert. Prompt Engineering wird zu einem Teilaspekt von Context Engineering. So wie CSS nicht verschwunden ist, als Design Systems aufkamen – es wurde eingebettet in eine größere Architektur.

Einordnung

Die Prompt-Engineering-Welle war nützlich. Sie hat Menschen beigebracht, bewusster mit KI-Systemen zu kommunizieren. Aber sie war auch ein Ablenkungsmanöver: Der Fokus auf die Formulierung der Frage hat verdeckt, dass die Qualität der Antwort vor allem von der Qualität des Kontexts abhängt.

Die Belege sind eindeutig: Lettrias Benchmark zeigt 30 Prozentpunkte Verbesserung durch besseren Kontext bei gleichen Prompts. Der LangChain-Report zeigt, dass Qualitätsprobleme in Produktion auf Kontextmanagement zurückgehen, nicht auf Modell-Fähigkeiten. Und die Werkzeuge – von CLAUDE.md über AGENTS.md bis MCP – zeigen, wohin die Branche konvergiert: persistenter, strukturierter, kuratierter Kontext als Fundament.

Wer heute in Prompt-Optimierung investiert, optimiert Symptome. Wer in Wissensstruktur investiert, baut Infrastruktur.

Im letzten Artikel dieser Serie schauen wir unter die Haube: Was passiert technisch bei RAG – erklärt ohne Buzzwords und Marketing-Sprache.