Zum Inhalt springen
CASOON

Von Chatbots zu KI-Agenten: Was Hermes über die nächste Phase von KI zeigt

Agentensysteme wie Hermes zeigen, wohin sich KI entwickelt: weg vom Chatfenster, hin zu modularen Workflows mit spezialisierten Rollen, wiederverwendbaren Skills und lokalen Modellen.

10 Minuten
Von Chatbots zu KI-Agenten: Was Hermes über die nächste Phase von KI zeigt
#KI-Agenten #Hermes #Lokale KI #Automatisierung
SerieKI-Agenten
Teil 1 von 5

Wer KI heute nutzt, arbeitet meistens noch klassisch: Prompt eingeben, Antwort bekommen, neuer Chat, wieder von vorne. Das Chatfenster ist die Standardmetapher — und gleichzeitig die größte Einschränkung. Genau an diesem Punkt setzen Agentensysteme wie Hermes an. Statt einzelner Unterhaltungen geht es dort um spezialisierte KI-Agenten, die dauerhaft Aufgaben übernehmen, Fähigkeiten speichern und wiederverwendbare Abläufe ausführen können.

Hermes selbst ist dabei weniger die eigentliche Story. Interessant ist vor allem, wofür solche Systeme gerade stehen: KI entwickelt sich langsam von einem Gesprächspartner zu einer persönlichen Arbeitsinfrastruktur.

KI-Agenten statt einzelner Chats

Ein normaler Chatbot reagiert auf Eingaben — danach beginnt vieles wieder bei null. Agentensysteme funktionieren anders. Dort können verschiedene KI-Agenten parallel existieren: Recherche-Agenten, Content-Agenten, Business-Agenten, Analyse-Agenten, Organisations-Agenten. Jeder mit eigenen Eigenschaften: unterschiedliche Modelle, eigene Skills, definierte Aufgabenbereiche, Zugriff auf Tools, Erinnerungen und Kontext.

Das wirkt weniger wie ein einzelner Assistent und eher wie ein kleines digitales Team — wobei jedes Mitglied für bestimmte Aufgaben zuständig ist und seinen Kontext zwischen Sitzungen behält. Der entscheidende Unterschied zum klassischen Chat: Der Zustand bleibt erhalten. Was der Agent gestern gelernt hat, steht ihm heute zur Verfügung.

Warum Skills wichtiger werden als Prompts

Der wahrscheinlich spannendste Teil von Hermes sind die sogenannten „Skills”. Aktuell läuft die Arbeit mit KI bei vielen so: Prompt schreiben, Ergebnis kopieren, später wieder neu formulieren, Prozess wiederholen. Jedes Mal von vorne.

Hermes versucht daraus wiederverwendbare Bausteine zu machen. Ein Skill könnte Webseiten analysieren, SEO-Probleme prüfen, Content strukturieren, Informationen recherchieren oder wiederkehrende Aufgaben automatisieren. Der Unterschied zu einem gespeicherten Prompt: Skills sind parametrierbar, kombinierbar und an unterschiedliche Eingaben anpassbar — ohne jedes Mal neu formuliert zu werden.

Der eigentliche Trend dahinter: Prompts entwickeln sich zu modularen Workflows. Das erinnert an Automatisierung, APIs, Makros oder No-Code-Prozesse. Der Unterschied ist, dass die Ausführungslogik dahinter zunehmend KI-gestützt ist — Interpretation statt Determinismus.

Ein praktisches Beispiel macht den Unterschied deutlicher:

AufgabeGespeicherter PromptSkill
Website prüfen„Analysiere diese Website auf SEO-Probleme”Nimmt URL, ruft definierte Checks ab, bewertet Meta-Daten, interne Links, robots.txt und erzeugt ein festes Ergebnisformat
Blogartikel vorbereiten„Schreibe einen Artikel über X”Prüft Zielgruppe, sammelt Quellen, erstellt Outline, markiert unbelegte Aussagen und liefert einen Redaktionsentwurf
Support-Tickets sortieren„Kategorisiere diese Tickets”Nutzt feste Kategorien, erkennt Priorität, schreibt Entscheidung begründet in JSON und markiert unsichere Fälle

Der wichtige Punkt ist nicht, dass ein Skill „intelligenter” ist als ein Prompt. Er ist überprüfbarer. Ein guter Skill hat Eingaben, Ausgaben, Annahmen und Grenzen. Genau dadurch wird KI-Arbeit wiederholbar genug, um sie in einen echten Arbeitsprozess einzubauen.

Ein realistischer Hermes-Workflow

Ein Agentensystem wird erst interessant, wenn es mehr leistet als Chat-Komfort. Ein sinnvoller Testfall wäre zum Beispiel eine monatliche Inhaltsprüfung für eine Website:

  1. Ein Recherche-Agent sammelt neue Themen, Suchanfragen und Wettbewerberseiten.
  2. Ein Audit-Agent prüft bestehende Seiten auf dünne Inhalte, veraltete Aussagen und fehlende interne Links.
  3. Ein Content-Agent erstellt konkrete Änderungsvorschläge, aber keine sofortige Veröffentlichung.
  4. Ein Review-Agent markiert riskante Aussagen: Preise, Rechtsfragen, technische Versionsstände, Produktvergleiche.
  5. Der Mensch entscheidet, welche Änderungen übernommen werden.

Das ist kein autonomer Ersatz für Redaktion. Es ist eine Arbeitsteilung. Die Maschine übernimmt Sammlung, Strukturierung und Vorarbeit. Die Verantwortung bleibt beim Betreiber, weil nur er Kontext, Tonalität und geschäftliche Priorität beurteilen kann.

Genau an dieser Stelle trennt sich produktiver Agenteneinsatz von Tool-Spielerei. Ein Agent ohne klaren Output erzeugt Text. Ein Agent mit klarer Rolle erzeugt eine Entscheidungsvorlage.

Die Desktop-Version zeigt, wohin der Markt geht

Hermes war ursprünglich vor allem als CLI-Tool bekannt: Terminal öffnen, Konfigurationen anlegen, Modelle verbinden, Commands ausführen. Für Entwickler ist das normal. Für viele andere Nutzer ist es eine klare Einstiegshürde, die zur Nicht-Nutzung führt.

Genau deshalb ist die neue Desktop-Version interessant — nicht wegen des Features selbst, sondern als Signal. Immer mehr Agentensysteme setzen auf visuelle Oberflächen, Desktop-Apps, Workflow-Ansichten und grafische Konfigurationen. KI-Agenten sollen nicht mehr nur für technische Nutzer zugänglich sein. Das ist kein UI-Kosmetik, das ist Marktentscheidung: Wer nur Entwickler erreicht, erreicht einen kleinen Teil der potenziellen Nutzer.

Trotzdem sollte man die Desktop-Oberfläche nicht mit Reife verwechseln. Eine gute Oberfläche löst drei konkrete Probleme:

  • Konfiguration sichtbar machen: Welches Modell nutzt welcher Agent? Welche Tools darf er verwenden? Welche Speicherbereiche sieht er?
  • Laufende Arbeit kontrollieren: Was macht der Agent gerade, wo hängt er, welche Zwischenergebnisse hat er erzeugt?
  • Eingriffe ermöglichen: Stoppen, korrigieren, neu starten, Ergebnis verwerfen.

Wenn eine Desktop-App nur ein hübscheres Chatfenster ist, entsteht kein neuer Workflow. Wertvoll wird sie erst, wenn sie Agenten, Skills, Speicher und Tool-Rechte kontrollierbar macht.

Lokale Modelle werden wieder relevanter

Viele Agentensysteme — auch Hermes — benötigen eigene API-Zugänge. Das bedeutet zusätzliche Kosten, separate API-Keys und Abhängigkeit von Cloud-Diensten. Bestehende ChatGPT- oder Claude-Abonnements helfen dort oft nicht weiter: Sie decken den Chat ab, nicht den API-Zugriff für externe Tools.

Deshalb setzen viele Nutzer inzwischen wieder stärker auf lokale Modelle — über Ollama, LM Studio oder direkt laufende Qwen- oder Llama-Modelle. Hermes unterstützt solche lokalen Modelle. Das macht es besonders interessant für Nutzer, die unabhängiger von Cloud-Diensten arbeiten möchten, Datenschutz priorisieren oder Kosten kontrollieren wollen. Lokale Modelle sind nicht mehr die Notlösung für Entwickler ohne API-Budget — sie werden zur bewussten Architekturentscheidung.

Zwischen echter Produktivität und Tool-Chaos

Der Markt für KI-Agenten wächst momentan schnell. Fast wöchentlich erscheinen neue Systeme: Hermes, CrewAI, Langflow, Flowise, AutoGen, Manus. Die Auswahl wird unübersichtlich, und viele Nutzer wechseln ständig zwischen neuen Tools, statt stabile Workflows aufzubauen. Das Neue zieht an, das Funktionsfähige bleibt liegen.

Genau hier macht Hermes indirekt einen wichtigen Punkt deutlich: Das beste KI-System ist selten das mit den meisten Features. Entscheidend ist, welches System tatsächlich produktiv genutzt wird — welches sich in bestehende Abläufe integriert, zuverlässig reagiert und nicht nach jeder Nutzung neu konfiguriert werden muss.

Eine nüchterne Bewertung kann mit fünf Fragen beginnen:

FrageWarum sie zählt
Kann ich Agentenrollen sauber trennen?Sonst wird aus allem ein überladener Universalassistent
Sind Skills versionierbar oder exportierbar?Ohne Portabilität entsteht der nächste Lock-in
Gibt es lokale und Cloud-Modelle?Datenschutz, Kosten und Qualität brauchen unterschiedliche Betriebsmodi
Kann ich Tool-Rechte begrenzen?Agenten mit Dateisystem-, Browser- oder API-Zugriff brauchen Least Privilege
Sind Ergebnisse reproduzierbar genug?Ein Workflow, der jedes Mal anders ausfällt, ist kein Prozess

Wer diese Fragen nicht beantworten kann, sollte das System als Experiment behandeln, nicht als produktive Infrastruktur.

Grenzen: Was Agentensysteme noch nicht zuverlässig lösen

Der größte Schwachpunkt bleibt nicht die Modellqualität, sondern die Prozesskontrolle. Agenten können überzeugend falsche Zwischenschritte erzeugen, Quellen missverstehen, Berechtigungen zu breit nutzen oder sich in Nebenaufgaben verlieren. Je mehr Tools ein Agent bekommt, desto wichtiger werden Protokolle, Review-Punkte und klare Abbruchbedingungen.

Für kleine Aufgaben ist ein Chat oft schneller. Für einmalige Recherche ist ein Agentensystem Overhead. Für sensible Daten ist lokaler Betrieb nur dann ein Vorteil, wenn auch Speicher, Logs und Backups sauber gelöst sind. „Lokal” ist keine Sicherheitsgarantie, sondern eine Architekturentscheidung mit eigenen Pflichten.

Hermes steht deshalb für eine Richtung, nicht automatisch für die beste konkrete Lösung. Der produktive Wert entsteht erst, wenn Rollen, Skills und Datenflüsse bewusst gestaltet werden.

Einordnung

Hermes zeigt weniger eine einzelne App als eine größere Entwicklung: KI bewegt sich weg vom klassischen Chatfenster, hin zu modularen Agentensystemen mit spezialisierten Rollen, wiederverwendbaren Skills, Speicher, Tools, lokalen Modellen und automatisierten Abläufen.

Die Desktop-Version ist dabei ein Zeichen dafür, dass diese Technologien langsam massentauglicher werden sollen — oder zumindest, dass die Anbieter das anstreben. Noch wirkt vieles experimentell, die Stabilität schwankt, die Lernkurve bleibt vorhanden. Aber die Richtung ist erkennbar: KI entwickelt sich von einem Werkzeug, das man bedient, zu einer Infrastruktur, die mitläuft.

Die nächste Entwicklungsstufe dieser Systeme geht bereits deutlich weiter: Statt einzelner Agenten entstehen zunehmend orchestrierte Multi-Agent-Workflows, bei denen mehrere KI-Systeme parallel an unterschiedlichen Aufgaben arbeiten — und die Rolle des Entwicklers sich grundlegend verändert. Wie das in der Praxis aussieht und was es konkret bedeutet, wenn KI vom Pair-Programming-Partner zum technischen Entscheider wird, zeigt Teil 2 dieser Serie. Wer sich zunächst einen Überblick über die wichtigsten Agenten-Frameworks am Markt verschaffen will — CrewAI, AutoGen, OpenHands und andere — findet das im Marktüberblick KI-Agenten.