70 % nutzen KI – 90 % messen keine Wirkung

Fast zwei Drittel der Unternehmen setzen KI bereits aktiv ein – und trotzdem berichten neun von zehn Führungskräften, dass sich dadurch weder Produktivität noch Beschäftigung messbar verändert haben. Dieser Befund aus einer der bislang größten Befragungsstudien klingt nach einem Paradox. Er ist keines. Er beschreibt sehr präzise, was passiert, wenn eine Technologie eingeführt wird, ohne das System zu verändern, in das sie eingebaut wird.

Was die Studie misst – und was nicht

Das NBER Working Paper „Firm Data on AI” (Yotzov, Bloom & Meyer, 2026) befragte knapp 6.000 Führungskräfte in den USA, Großbritannien, Deutschland und Australien. 69 % der Unternehmen nutzen KI aktiv; rund 90 % berichten über keinen messbaren Einfluss auf Beschäftigung oder Produktivität in den vergangenen drei Jahren.

Bevor diese Zahlen interpretiert werden, lohnt ein Blick auf die Methodik: Die Studie basiert auf Managerbefragungen – subjektive Einschätzungen zu Nutzung und wahrgenommenem Effekt. Es ist eine deskriptive Querschnittsanalyse, keine experimentelle Studie. Kausalität lässt sich daraus nicht sauber ableiten.

Das schränkt die Aussagekraft in mehrere Richtungen ein. Unternehmen, die 2022 bis 2024 berichten, ihre Produktivität habe sich nicht verändert, berichten in einem Umfeld, das von Inflation, Energiekrise und Zinsanstieg geprägt war. Diese Faktoren werden nicht isoliert – sie liegen im Hintergrundrauschen jeder Antwort. Ein Unternehmen, das durch KI intern +3 % gewinnt, aber durch externe Schocks –3 % verliert, landet statistisch bei null. Die Studie sieht: keinen Effekt.

Hinzu kommt ein Zeitfenster-Problem. KI ist als relevantes Produktivitätswerkzeug in den meisten Unternehmen erst seit 12 bis 24 Monaten real. Prozessanpassungen dauern länger. Das Messfenster ist zu groß für die Einführungsphase und zu klein für Transformation. Viele der befragten Unternehmen befanden sich noch in der Lernkurve.

Was die Studie trotzdem zuverlässig zeigt: KI ist breit angekommen, aber meist oberflächlich genutzt – durchschnittlich 1,5 Stunden pro Woche, bei einem Viertel der Firmen gar nicht.

Lokale Effizienz ohne Systemwirkung

Der eigentliche Mechanismus hinter dem 90%-Befund ist gut verstanden – er kommt nur in den meisten Kommentaren zu kurz.

Unternehmen sehen oft lokale Verbesserungen: Ein Mitarbeitender schreibt E-Mails schneller. Ein Entwickler generiert Code-Snippets. Marketing produziert mehr Content. Der Output steigt punktuell. Aber gleichzeitig steigt der Abstimmungsaufwand, die Qualität schwankt stärker, und die nachgelagerten Prozesse bleiben unverändert.

Das ist ein bekanntes Muster aus der Systemtheorie: Die Optimierung einzelner Knoten verschlechtert oft das Gesamtsystem. Wer einen Teil eines Prozesses beschleunigt, ohne den Rest anzupassen, schafft Stau an der nächsten Engstelle. Produktivität ist eine Systemeigenschaft – sie entsteht nicht durch die Summe lokaler Verbesserungen.

Das erklärt, warum Führungskräfte sagen: „Wir nutzen KI – aber es bringt nichts messbar.” Sie haben recht. Es bringt auf der Ebene, auf der gemessen wird, tatsächlich nichts.

Das Messproblem

Ein zweiter, oft übersehener Faktor: Produktivität wird in vielen Unternehmen an Stellen gemessen, wo KI nicht direkt wirkt.

Typische Messfehler: Output statt Outcome (mehr Texte sind nicht automatisch bessere Conversion), Teammetriken statt Prozessmetriken, kurzfristige KPIs statt Durchlaufzeit. Ein Support-Team, das KI einsetzt und schneller antwortet, aber mehr Rückfragen erzeugt, hat keine sinkende Gesamtbearbeitungszeit – nur eine verschobene.

KI verlagert Arbeit. Sie eliminiert sie nicht automatisch. Selbst dann, wenn reale Effizienzgewinne entstehen, bleiben sie statistisch unsichtbar, weil die Messung am falschen Punkt ansetzt.

Drei versteckte Kostenarten

Wenn KI in bestehende Prozesse eingebaut wird ohne diese zu verändern, entstehen drei neue Kostenarten, die den Effizienzgewinn regelmäßig kompensieren:

Verifikationskosten. KI-Outputs müssen geprüft werden – auf Halluzinationen, Faktenfehler, Stilabweichungen. Je weniger Mitarbeitende verstehen, wie ein Modell zu einem Ergebnis kommt, desto aufwendiger wird diese Prüfung.

Koordinationskosten. Mehr Output erzeugt mehr Abstimmungsbedarf. Wer zehnmal schneller Entwürfe produziert, muss zehnmal mehr abstimmen, freigeben, einordnen.

Kontextkosten. Prompts müssen geschrieben, gepflegt und nachjustiert werden. Briefings für KI-gestützte Aufgaben ersetzen keine Briefings – sie kommen obendrauf, bis Prozesse standardisiert sind.

Wenn diese drei Kostenarten nicht aktiv durch Prozessveränderung reduziert werden, passiert genau das, was die NBER-Studie misst: null Effekt, obwohl KI genutzt wird.

Bis zu 40 % der potenziellen KI-Produktivitätsgewinne gehen laut einer Auswertung durch mangelhafte Kompetenzen verloren. Mitarbeitende verbringen im Schnitt anderthalb Wochen pro Jahr damit, Fehler aus KI-Outputs zu bereinigen. 54 % fühlen sich für die Arbeit mit KI unzureichend geschult.

Drei Ebenen der Integration

Der Unterschied zwischen Nutzung und Integration lässt sich auf drei Ebenen beschreiben:

Ebene 1: Tool-Nutzung – ChatGPT, Copilot, Perplexity. Individuelle Nutzung, keine Standardisierung, keine definierten Übergaben. Das ist der Status quo in den meisten Unternehmen. Kein messbarer Effekt.

Ebene 2: Workflow-Integration – KI ist Teil eines definierten Prozesses. Klare Übergaben (Draft → Review → Final), standardisierte Prompts, klare Qualitätsgrenzen. Erste messbare Effekte entstehen.

Ebene 3: Prozess-Redesign – Hier entstehen die 4 % aus der EIB-Studie. Aufgaben werden neu geschnitten, Rollen verändern sich, Prozessschritte entfallen komplett. Statt „Text schreiben – reviewen – veröffentlichen” wird zu: „KI generiert Varianten – Mensch kuratiert und entscheidet – direkt testen.” Der Schreibschritt als eigenständige Aufgabe existiert nicht mehr.

Der EIB Investment Survey 2025/2026 zeigt kausal, dass dieser dritte Schritt die entscheidende Bedingung ist – zusammen mit Investitionen in Dateninfrastruktur (+2,4 Prozentpunkte) und systematischer Weiterbildung (derzeit nur 27 % der Unternehmen).

Der Lag-Effekt

Es gibt einen weiteren Grund, die NBER-Zahlen nicht als Endurteil zu lesen: Zwischen der Einführung einer Technologie und ihrem Produktivitätseffekt liegen historisch oft Jahre oder Jahrzehnte.

Elektrizität wurde Ende des 19. Jahrhunderts eingeführt. Der Produktivitätsboom kam erst, als Fabriken nicht mehr um Dampfmaschinen herum gebaut wurden, sondern um das neue Prinzip dezentraler Energie. IT wurde in den 1970ern und 1980ern breit eingeführt. Der messbare Anstieg kam in den 1990ern, als ERP-Systeme Prozesse neu organisierten und das Internet Informationsflüsse veränderte.

Das Solow-Paradox – Produktivität überall sichtbar außer in der Statistik – löste sich jeweils nicht durch bessere Technologie, sondern durch organisatorische Anpassung. KI befindet sich heute an dieser Stelle. Die Technologie ist angekommen. Die Organisation ist noch nicht.

Das relativiert die NBER-Zahlen sinnvoll, ohne sie zu entkräften: Sie sind ein Snapshot eines Systems im Umbau, nicht ein Beweis für fehlende Wirkung.

Kein KI-Problem, sondern ein Organisationsproblem

Unternehmen haben kein KI-Problem. Sie haben ein Organisationsproblem – und KI macht es sichtbar.

Typische Engpässe: keine klaren Verantwortlichkeiten für KI-Prozesse, keine standardisierten Workflows, keine Zeit für echtes Task-Redesign, konservative Nutzung aus Angst vor Fehlentscheidungen. Großunternehmen sind deshalb oft langsamer als kleine Teams, die ohne Legacy-Strukturen experimentieren können – aber seltener skalieren, weil Skalierung wiederum Strukturen braucht.

Drei Fragen zeigen, ob KI in einem Prozess wirklich integriert ist oder nur additiv genutzt wird:

Welche Aufgabe entfällt durch KI komplett?
Wo wird weniger geprüft als vorher – nicht mehr?
Welche Rolle hat sich konkret verändert?

Wenn auf keine dieser Fragen eine klare Antwort existiert, ist KI mit hoher Wahrscheinlichkeit noch auf Ebene 1. Lokale Effizienz, keine Systemwirkung, kein messbarer Effekt.

Was NBER und EIB zusammen bedeuten

Beide Studien widersprechen sich nicht. Sie beschreiben denselben Mechanismus aus verschiedenen Blickwinkeln.

NBER misst, was passiert, wenn KI breit eingesetzt wird ohne die dazugehörigen Investitionen in Prozesse, Daten und Kompetenzen. EIB zeigt, was möglich ist, wenn diese Investitionen gemacht werden. Der Unterschied liegt nicht in der Technologie – er liegt in der Entscheidung, wie tief eine Organisation bereit ist, sich zu verändern.

KI wirkt erst dann produktivitätssteigernd, wenn sie bestehende Arbeit ersetzt und nicht ergänzt. Solange sie nur zusätzlich genutzt wird, ist sie ein Kostenfaktor. Erst wenn Prozessschritte wegfallen, Rollen sich verschieben und Messung dort ansetzt, wo Veränderung entsteht, wird aus dem Werkzeug ein Hebel.

Das ist keine technologische Frage. Es ist eine Frage der Organisationsentscheidung – und die meisten Unternehmen haben sie 2026 noch nicht getroffen.